ポスター相関解析図の編集

 gackelさんがいい感じにグラフの見た目をよくしてくれたので、私もそういう感じにノードの大きさや表示形式をいじってみました。
 まずノードのラベルとしてポスター番号だけではなく発表者の名前も表示されるように、ポスター要旨の掲載ページから「発表者」もパースして取得してくるようにしました。

elsif tag.content =~ /発 表 者:/
tag.search("sup").remove
string = tag.content.split(":")[1].split(",")[0]
poster.push(string.gsub(/^.*(/, ""))

をコードに追加しました。また38番の要旨は英語なので、これはgoogle翻訳にかけて得られた文章を使うことにしました。
 また、ポスター間にエッジを引くときに、前回まではポスター間の共有単語数が規定数以上という制限にしていましたが、これをやめて、各ポスターで共有単語数の多い順に上位2ポスターを相手としてエッジを引くことにしました。
 このような条件で作成したのが以下の図です。

 エッジを引くときに使用する単語数が小さいものが含まれるのでまだエッジの意味があいまいな部分もあるとおもわれます。またよく使われる単語を用いてクラスターを作成できるとよいかと思われます。