まずは confusion matrix (混同行列)を作成。
https://phreeqc.blogspot.com/2017/11/deep-learning.html
Error(ERR、誤分類率)
Accuracy(ACC、正解率)=1-ERR
全数を使った指標は imbalance データで注意。
Precision(PRE、適合率、精度)
予測 positive で当たった割合
Recall(REC、再現率)
=True Positive Rate(TPR、真陽性率)
実際 positive で当たった割合
全部 Positive と予測すれば REC 100%、Precision低。
スクリーニングで Rec、詳細調査で Precision の高い手法を組み合わせるとよさそう。
F-measure(F値、F1値(F1-score))
h(PRE, REC)
PRE と REC の調和平均(harmonic mean)
相加平均、相乗平均でなく、なぜ調和平均なのでしょうか?
multi-class の場合も基本は binary と同じです。
macro・・・各クラスの結果を平均
micro・・・各クラスのTP等を集計して算出
各クラスの結果を等価に評価してくれるのがマクロ。良し悪しですが、レアクラスの結果を重視したい場合には良いでしょう。
計量分野を除き、言葉としての「精度」は人によって指す意味の異なる場合があります。英語で言う方が正しく伝わるでしょうね。
0 件のコメント:
コメントを投稿