精製チャンクを利用した行推定の続き

 前回に続き、精製チャンクを利用するためChromHMMプログラムの修正を行いました。今までは過去形の文章しか対象にしていませんでしたが、チャンクを精製したのでそのチャンクを含む場合は現在形の文章も推定対象に含めることにしました。

if line[0] =~ /た$|た(.*)$|だ$|だ(.*)$/
targetLines.push(line);
else
pushed = false

@attrArray.each do |aArray|
aArray.each do |chunk|
if line[0] =~ /#{chunk}/
targetLines.push(line)
pushed = true
break
end
end

if pushed
break
end
end

としてチャンクリストをなめるようにしました。
 このように修正した後、さっそくいくつかのレビューについてプログラムを試してみました。文章の対象を増やしたからか、計算された遷移確率や推定結果の精度が上がっているように思われました。

 次回はチャンクリストを自動で更新する部分をコーディングしていきたいと思います。