単語を使った文章間相関計算&ネットワーク図表示

 ファイルに出力する際に文字化けしていたのは、Stringを含むRubyの配列をフォーマット等何も書かずにそのまま出力させていたかららしく、配列の中身に順番にアクセスしながら出力形式を指定して書き込んだら問題なくUTF-8で読めるように出力されました。
 さて単語ごとにそれが出現するポスターのリストが作れたので、今回はその後ポスターごとにどのポスターと単語を共有しているのか調べるところまで進めました。以前のコードをそのまま使うつもりでしたが、Rubyにあるまじきfor文などがあったり1.9.3にバージョンが変わって制約が厳しくなった部分等あったので、手直ししました。
 また、使用する単語について、前回はその単語が出現するポスター数が30以下のもののみ使用するようにしていましたが、今回もとりあえずその設定のままでやってみて、ノード数を減らした状態で様子を見ようと考えました。
 このプログラムを動かしてみて結果が得られたので、早速Cytoscapeで表示してみました。ノード数689、エッジ731本の図になりましたが、いくつかの塊に分かれているようです。今後このクラスタがどの単語によって形成されたか調べてみて、部分ごとにネットワークを作れるようにする方法を考えていくつもりです。