階層トピック分類の構想

 前回までのポスター関連解析で扱った全ポスター数は56だったので、1枚のネットワーク図に収まりましたが、今度はもっと多くのポスターが発表される場合のポスター関連図をどのように作るか、前回までのネットワーク図の作り方をふまえて考え直してみました。

 全ポスター数が約4000にもなる場合、1つのネットワーク図にまとめても、見れないことはないですが、特定のポスターを探したり、自分の近くに配置されたポスターとの関連性の意味が希薄になります。
 また、多くのポスターを分類するためのトピック数が膨大になれば、トピックの内容を手軽に理解することができなくなり、トピック間の関連性も考えづらくなります。
 なので、あまり1枚のネットワーク図に含まれるノード数が大きくなりすぎないよう、またトピック数が多くなりすぎないよう、トピック解析を行った後のトピックに分類されたポスター集合に対し、さらにトピック解析を進めるというように、階層的なトピック解析を行うことを考えました。
 まず約4000枚のポスターから6つほどのトピックに分け、その後トピックごとのポスター集合に対し、さらに6つほどのトピックに分けていき、最終的に1トピックに分類されるポスター数が50〜60くらいになったら、そこでネットワーク図を作るようにしようと考えております。
 トピックの階層ごとに図を用意し、トピックを表すノードをクリックすれば、その階層を進み内部の図が見えるようになるような仕組みを作ろうと思います。

 そもそも、トピック内のトピック解析が上手く行くのかもまだ分からないので、次回それを行ってどのようにポスターが分類されるのか確かめてみようと思います。
 これが上手く行けば、あるポスターAがどのようなトピックに分類されるのか、そのトピックに他にどのような研究が含まれているのか、近いトピックは何か、そのトピックではどのような研究が行われているのか、などを知ることができるようになると思います。