チャンクによる知識抽出のためにチャンクと知識の共起を調査

 論文レビュー間でのチャンクの出現頻度が得られているので、実際にレビューを読んでみて新規知識だと思われる行を探し、その行とチャンクとの共起・相関を調べてみようと思いました。
 最近登録されたレビュー2本を私が実際に読んでみて、そのレビューから得られた新たな知識が書かれた行とチャンクとの関係を調べてみました。またその過程で、作成した行属性判別プログラムとの関係も見てみました。
 まず、今まで実験結果を表すチャンクはレビューごとに異なることが多く、全レビューでの出現頻度があまり高くないことが分かりました。しかしながらレビューで紹介されている実験結果の中には、今までは知られていなかった事実を示すものがもちろん多く、これらの行も知識としてまとめていかなければならないなと感じました。
 また作成した行属性判別プログラムについては、レビューによっては結論属性として評価された行が、私が知識を述べていると思った行と一致していることが多くあり、判別に用いているチャンク辞書を見直せばもう少しよい判別ができるようになるのではないかと思われました。得られたチャンク出現頻度リストから選んでみようと思っています。
 今後判別プログラムの見直しと「知識」についての見直しを行っていきたいと思います。具体的には、プログラムの方については使用するアルゴリズム・チャンク辞書の性能評価、知識についてはレビューで述べられている結論だけではなく新規の実験結果も重用ししていく方向で進めていこうと思います。