2017年3月9日木曜日

今週の成果

3/6 TF-IDF法を用いた分析


 今週は、TF-IDF法を用いた分析を行った。
 
   分析手順
1.      各論文から抄録を収集し、形態素解析を行う。
2.      単語におけるTF-IDF値を算出する
3.      頻出順に上位30単語を並べる。

その結果を下記に示す。

図1


この結果より、術式や治療法、単位など症状に関わりのない単語も抽出された。また、症状だと断定できる単語も少なく、確実性は低いと感じた。
更なる改善が必要である。

※TF-IDFの計算は,以下の文献に書いてあった方法を使った。
  • 鈴木啓,大内紀テキストマイニングを用いた学会のポジショニング分析.経営情報学会2015年秋季全国大会,2015.



0 件のコメント:

コメントを投稿