2013-12-01から1ヶ月間の記事一覧

GENIA taggerを使うクラスの見直し

GENIA taggerはC++で書かれた英文品詞解析ソフトですが、これをRubyで呼び出すため、今まではサーバプログラムとして起動していましたが、今回はこれを書き換えました。 いちいち別プログラムとして起動してから、本命のRubyコードを走らせるのも面倒だし、…

英文の単語出現頻度を計算するクラスの続き

前回に引き続き、英文から名詞を抜き出すRubyクラスの実装を行いました。 前回は英文の単語数で分類するところまで書いたので、今回は分類された英文ごとに、品詞解析にかけて名詞を抜き出し、その出現数をカウントするところを実装しました。 品詞解析はGEN…