レビューの文章へ属性付与

 レビューを読む人ごとに、どのような目的で読みにくるのかが異なることを考慮して、前回までに考えていた重要文の抽出をするよりは、目的ごとに重要な文章が変わると考え、こちらで重要さを定義することはとりあえず保留にすることにしました。
 代わりに、論文内の各文章が結論を書いているのか、手法を書いているのか、前提知識を書いているのか、実験から得られた結果を書いているのかといった、文章の内容属性を付けて分類し、それを提示できるようにしていこうとかなと考えました。
 属性推定と言えば隠れマルコフモデルなどの手法があがりますが、まずは文章に使われている単語を元にした単純な重み付けでどの程度区別できるようになるのか、調べてみようと思います。

 例えば考える属性として、「結論 or 実験結果 or 実験手法」を用意すると、
「以上の結果より〜明らかになった」→結論
「〜遺伝子の発現を上昇させた」→実験結果
「そこでマイクロアレイを用いて〜を検討した」→実験手法

といった感じで分けられそうです。これを自動化して文章を分類できるようなコードを書いてみようと思っています。