属性項目と特徴語の設定

 前回考えた文章に付加する4属性、「前提・手法・結果・結論」を決めるため、それらの属性を特徴づける単語を、いくつか新着論文レビューから選んでみました。そしてそれを「attribute.txt」としてまとめておき、プログラムの実行時にここから読み込んで辞書として使うようにしました。
 形式としては以下のような感じです。

#前提属性
報告されて

#手法属性
検討
そこで

#結果属性
増加
抑制
示唆され

#結論属性
今回
筆者ら
明らか

これらの単語は私がいくつかの論文レビューを読んで恣意的に選んだ単語です。これを利用して各文章を分類分けし、対象の配列にpushしていくプログラムを作成しました。それなりに分類はできていましたが、別の属性に振られるべき行が誤って含まれていたり、落としてしまった行などがあったので、今後はこれを修正していく為の方法を考えていこうと思っています。
 また今後の目標としては、手法属性のある行が結果属性のある行と結びつくことを示唆できれば、ある手法から得られうる結果を検索することができるようになるとも考えられたので、それも考慮していきたいと思っています。