JUGEMで書いたブログ記事をmarkdown形式に変換するスクリプトをTypeScriptで書いた
ブログサービスのJUGEMの記事はテキストかXML形式でエクスポートできる
作成した記事をダウンロードすることは出来ますか。 | JUGEM よくある質問集 FAQ
記事のデータは、テキスト形式(txt)とxml形式でダウンロードすることが可能となっております。
このXML
形式のファイルをmarkdown
に変換するプログラムを書いた。
実施前に画像パスを設定する必要あり
一点注意点があり、
JUGEMからエクスポートした XML データには、画像パスが実際のサイト上で指しているものとは違うものが吐き出されている。
このパスにアクセスしても画像自体は見つからず 404 が返される。
そのため、変換の合間に古い画像パスから現在の画像パスに変換する処理を挟んでいる。
(途中で画像パスの仕様が変わったのだが、エクスポート機能の方は未対応ということなのだろうか?)
この画像パスはブログごとに異なるため、下記のソースコード内でパスを設定する必要がある (ソースコード直接書き換えるのは微妙なので、どこかのタイミングで設定ファイル上で設定できるようにしようと思います...)
https://github.com/shinshin86/jugem-xml-to-md/blob/master/src/index.ts#L39
JUGEM側でエクスポートしたデータ(XML)をxml-data
に格納してから下記一連のコマンドを実行してください。
git clone https://github.com/shinshin86/jugem-xml-to-md.git cd jugem-xml-to-md vim src/index.ts // "実施前に画像パスを設定する必要あり"のところを参照して、画像パスを設定してください yarn yarn dev
実行後、result
ディレクトリにmarkdown
に変換されたファイルが生成されます。
ここから過去を振り返る、どうでもいい日記
はてなでブログを書き始める前はJUGEM
でブログを書いていた。記事を遡ってみてみると、どうやら10年以上前に書き始めていたらしい。
ブログを読んでいくと、当時はBeaglesが始まる前の段階だったようだ。
結構こじらせ文学系男子っぽい文章が見受けられたりする時があるので、たぶんこのブログは黒歴史になるのではないかと思い、本当はJUGEM
の記事をmarkdownに変換してGatsby
で今風なブログとして再構築しようと思ったのだが、あまり気が進まなくなった。
もしJUGEM
の記事をmarkdownに変換したい方が入れば使ってください。割とどころか、だいぶ雑に作っているので、不具合ありましたらご報告いただけると幸いです。