2012-04-01から1ヶ月間の記事一覧

ChromHMMの続き

前回に続きChromHMMの実装を行い、隣接ベクトル・状態の定義、エントロピーの計算をプログラムし、各状態に分けて文章を出力する部分まで実装できました。エントロピーの計算の部分でデバッグしていたところ、計算用の関数に一部バグがあったので、入力され…

chromHMMの実装

今回からchromHMMの実装を開始しました。言語は引き続きPerlさんです。 まずは各行を順番に見ていって、状態判定の為の単語が含まれているかどうか、単語数分の大きさをもった二値ベクトルを作成してみました。4月20日に公開されたレビュー、“分子のものさし…

隠れ状態と単語ベクトル

隠れマルコフモデルを利用するため、レビュー内の各行について、特定の単語が含まれているか否かというベクトルをまず用意し、それに対して隠れ状態、生起確率、遷移確率を定義して、各行の隠れ状態を推定していくことにしました。W: 状態を示唆する単語の数…

属性項目と特徴語の設定

前回考えた文章に付加する4属性、「前提・手法・結果・結論」を決めるため、それらの属性を特徴づける単語を、いくつか新着論文レビューから選んでみました。そしてそれを「attribute.txt」としてまとめておき、プログラムの実行時にここから読み込んで辞書…

レビューの文章へ属性付与

レビューを読む人ごとに、どのような目的で読みにくるのかが異なることを考慮して、前回までに考えていた重要文の抽出をするよりは、目的ごとに重要な文章が変わると考え、こちらで重要さを定義することはとりあえず保留にすることにしました。 代わりに、論…

PerlのCaboChaモジュールを試してみた

CaboChaをコマンドライン上で利用できるのは確認できたので、今度は付属のPerlバインディングを利用してみることにしました。 その前に前回バージョンをあげたMeCabに合わせて、MeCabのPerlモジュール0.993をインストールし、その後PerlモジュールCaboCha0.6…

調査の続きとCaboChaインストール

前回に続き、First Author'sのレビューをいくつか読んで、その中で新規知識として有用な行を特徴づける単語を探してみました。「その結果…明らかにした」 「これらの結果から、…示唆された」 「その結果、…説明できることを見い出した」といった書かれ方がさ…

レビュー内の知識の書かれ方調査

First Author'sの最近の論文を読んでみて、新しく発見されたこと・示唆できることがどのように書かれているのか、2本ほどゆっくり読みながら確認してみました。 まず3月30日公開のこのレビューを読んでみると、「…明らかになった」 「…示唆された」 「以上の…