3/6 TF-IDF法を用いた分析
今週は、TF-IDF法を用いた分析を行った。
分析手順
1.
各論文から抄録を収集し、形態素解析を行う。
2.
単語におけるTF-IDF値を算出する※。
3. 頻出順に上位30単語を並べる。
その結果を下記に示す。
図1 |
この結果より、術式や治療法、単位など症状に関わりのない単語も抽出された。また、症状だと断定できる単語も少なく、確実性は低いと感じた。
更なる改善が必要である。
※TF-IDFの計算は,以下の文献に書いてあった方法を使った。
- 鈴木啓,大内紀知:テキストマイニングを用いた学会のポジショニング分析.経営情報学会2015年秋季全国大会,2015.
0 件のコメント:
コメントを投稿