低頻度辞書の確認&プレゼン準備

 前回仕掛けたWikipedia辞書更新プログラムは、「生物学」カテゴリから3階層読み込むように変更したので、それが上手く動いているか確認しました。まずTwitterのFABSボットは、起動から約23分後に「終了しました」とのメッセージを返していました。その後サーバを確認したところ、確かにcronに設定した時刻の23分後に更新されていることが分かったので、上手く動いていたようです。
 低頻度辞書の中身を調べたところ、生物用語と思われる単語がいくつか追加されていました。やはりまだ無関係な単語がいくつか挿入されていたので、手動で出力抑制辞書に追加しておきました。「周辺」とか「基礎」といった単語を抑制語としました。
 その後収穫祭の準備として、去年の収穫祭の発表のスライドを見直しました。まず自己紹介を入れて、作ったプログラムの紹介を入れて、その内容を少し説明する感じで構成しようと思います。