日本語単語によるトピック解析

 英単語によるトピック数調整を考えていて、各トピックごとにどれだけの筆者が分類されるのかを調べていたところ、トピック数6のときに、トピック0番により多くの筆者が分類されていることがわかりました。

 その後、トピック数6でトピック0番での出現確率が高い単語を確認してみたところ、だいたいそのトピックの内容を推測できるような単語が集まっているようでした。
 
 もう少しトピック解析の特徴を知りたいので、今度はポスターの日本語要旨を使ってトピック解析してみることにしました。まずはMeCabで名詞を取り出そうとしたのですが、Rubyのバージョンを変えたからか、スクリプトからMeCabをうまく呼び出せずにエラーで落ちてしまいました。
 またMeCabのインストールからやり直すのは手間がかかるので、Rubyから直接コマンドを呼び出して、標準出力に得られたMeCabの結果をパースすることを考えようと思います。