gackelくんとのスコアマージ

 ポスターのアブストラクトを使って、私とは別の方法でgackelくん(ブログ:鳴いて血を吐く時鳥)がポスター間の相関度を計算したので、お互いの相関度をスコアとしてマージすることを考えました。
 まず、彼が計算した相関度は全ポスターの総当たりで0〜1の値を持つとのことだったので、ポスターの相関元ごとに相関先全ての点数への配列を生成してもらいました。その後私のほうの相関度をポスターの相関元ごとに点数化しました。
 点数化の方法は、まずポスターの相関元ごとに、相関先全てのなかで共有単語数が最大のものを見つけ、その最大共有単語数で相関先全ての共有単語数を割って0〜1の値を得ました。その後gackelくんの点数との足しあわせを考えましたが、彼のほうのスコアは0.3よりも小さいものが大多数になるとのことで、彼のほうで足しあわせてちょうど良くなるように正規化を考えてもらい、最終的に彼の点数を4倍したものと私の点数を足したものを、マージスコアとして採用しました。

 これを最終的な相関スコアとして、次回、相関グラフ図を作成していきます。