archive


[tag:]

bloggerは特に使いづらいこともないのだけど、 webフォームで入力しているとたまにhtmlが汚れるのと、 画像やcss等も含めたバックアップが気になったので Firebaseのホスティングを使ってアーカイブを作った。
An At a NOA

過去記事をすべてテキストデータに変換し、 テンプレートに流し込んで各ページのhtmlを作成した。
cssはすべて手打ちである。
Hugoあたりの静的サイトジェネレータを使うことも 検討中だが、取り急ぎはFirebaseのコマンドライン ツールとgolangで書いたスクリプトだけで事足りる。

可能な限りjavascriptやcgiを使いたくないのだが、 サイト内検索だけはできるようにしたい。
やはりGoogleのカスタム検索エンジンが第一候補か。

あと、ラベル情報を反映していないのだが、 ラベリングの仕組みを自動化したい。
今や深層学習で写真に写っている要素を言語化することも 可能なので、文章の内容からラベルを生成するくらい できそうだが、あまりよいものが見つからない。

特定のラベルをつけるのではなく、Googleクラウド自然言語API で全記事を形態素解析して、記事ごとにDoc2vecで距離が近い順に 他の記事を下に表示するとかでもよいかもしれない。