単語の精製とデータベース作成

 いくつかの文章を試しにプログラムに与えて単語リストを得てみたところ、斜体にしたり上付き文字にする為のタグがそのまま残ってしまっていることが分かったので、正規表現の判定文に山括弧を追加しておいて、中身のみ得られるようにしました。
 また膨大なフィールド数なのでデータベース化して検索しやすくしようと思い、iNutさんにrubyのモジュールActive Recodeの使い方を伝授していただきました。簡単にデータベースファイルを作成し、データセットをまとめてテーブルに挿入する方法などを利用することで、各文字列を登録することができました。
 今後は単語リストの作成に時間がかかりすぎるのを解消し、データベースを管理しやすいように考えながら値を登録していくようにしようと思っています。