示唆単語の抽出・追加

 新しいレビューが追加されていたので、それらを読みつつ属性分類するために有効と思われる単語を抜き出す作業を行いました。
 この作業をしている中で、「…を示した」や「…とわかった」といった言い回しは、結果を記述するときも結論を記述するときにも使われていることが分かってきました。なのでこれらの単語を「#結果か結論」といった新しい分類項目にするか、結果・結論属性の単語として両者に追加することにするか、どちらも試してみることにしました。
 まずは両者に単語を追加してみて、プログラムを走らせたところ、ちゃんと状態5つに分けることができました。しかしながらこれらの状態内の行を眺めてみても、あまり狙ったように分類できているとは考えづらい感じになってしまいました…。
 おそらくこれは隣接ベクトルを状態推定に用いているからであると思われるので、別のクラスタリング方法を考えるか、それとも隣接ベクトルを定義するのにもう少し工夫が必要であるのかなと考えています。次回以降これを上手くしていこうと思います。