2017年7月13日木曜日

分類器の性能はどうやって測るの?

KH Coderのベイズ分類器は交差検証テストの結果として,性能を正確度(Accuracy)で出力している。機械学習の性能を評価する場合はほかにも様々な指標がある。これについては「モデルの精度評価」に詳しいので参照のこと。
さて,分類器というものは,正確度が高ければ高いほど良いというわけではない。正確度が高くても使いものにならない場合だってある。たとえば病気の有無をあてる分類問題で,有病率が低い場合は,いくら正確度が高くても再現率(Recall)が低い場合がある。一般に分類器は2つの指標(再現率と精度)で評価すべきである。
ただし,今回のように疾患ごとのデータ数を揃えている場合は正確度を使って性能を評価しても問題ない。

0 件のコメント:

コメントを投稿