5/30 ナイーブベイズ分類の結果2
次に、最大値である68.6%を超えるにはどうしたらいいのかを考えました。色々と試行錯誤した結果、最頻出単語数を変更することで割合が上下することに気が付きました。表1では、最頻出単語数を100~400単語まで変更したものを表しています。(※前回の結果は最頻出単語数:1となっています)
表1 |
次に、最頻出単語数を200単語に設定して200件の時と500件の時の分類を行いました。表2はその結果です。
表2 |
前回の結果と比べてみると、200件の最大値は68.6%→72.6%、500件の最大値は67.4%→70.8%と上昇したことが分かります。
しかし、割合は70%を超えることができましたが、もともと最頻出単語数が200以上ある単語が少ないという問題があります。そのため、この結果では正確な分類ができていない可能性が高くなっています。正確な分類を行うためにも、もう一度分類方法を見直す必要があると考えています。
0 件のコメント:
コメントを投稿