2017年2月23日木曜日

今週の結果について

前回の論文で学んだことを活かし、対応分析を行った。
名詞、サ変名詞、名詞B、Cに絞り、茶筅を利用して複合語の検出を行った。
出力結果を記す。


時間の都合上、ほかのパターンが試せなかったので、次は複合語の検出法を変更したり、語句の取捨選択を行って出力したい。

疾患間の関連性の強さ


対応分析では,関連性の強い疾患が近くに布置される。 図から子宮内膜症と子宮筋腫,子宮頸がんと子宮体癌に関連性がみられる。また,縦軸は遠く離れているものの子宮体癌と卵巣腫瘍は横軸では近い関係がみられる。
これを前回行った分析と比較してみる。


疾患 子宮筋腫 子宮体癌 子宮内膜症 子宮頸がん 卵巣腫瘍
子宮筋腫   1.47 2.72 0.61 0.69
子宮体癌     0.54 1.09 2.13
子宮内膜症       0.20 0.71
子宮頸がん         0.28
卵巣腫瘍          

この表は,子宮筋腫と子宮内膜症の間に最も強い関連性を示している。また,子宮体癌と卵巣腫瘍,子宮犬種と子宮体癌の間にも関連性があることを示している。これらの結果は対応分析で示唆された結果と符合している。
対応分析は, 複数の疾患に関連する論文は除外されているにも拘わらずこのような類似性があるのは興味深い。

0 件のコメント:

コメントを投稿