英文から名詞を取り出し出現頻度を計算するクラス

 英文の特徴抽出を行う際に、以前実装した英文から名詞を取り出す部分を、今回1つのクラスとしてまとめることにしました。
 名詞の判定にはGENIA taggerを使用していて、これを別プロセスで起動し、ソケット通信でRubyスクリプト中で解析したい英文を送るようにしています。今まではこのGENIA taggerプログラムを、手動で別に走らせるRubyスクリプトを使っていましたが、二度手間で面倒なので、今回これもまとめることにしました。

 指定の英文リストから、名詞を取り出し出現頻度を計算するRubyクラス、WordCountを作成しています。現在英文リストを分類し、外部プロセスからGENIA taggerを起動するところまで実装しました。
 途中経過ですが、GitHubにて公開しています。順次中身の実装を進めていこうと思っております。