sklearn中的roc

Reading time ~1 minute

1.介绍

ROC (接受者操作特性曲线:Receiver Operating Characteristic)

ROC metric用来评估分类器的输出质量。

ROC曲线通常在Y轴上表现为TP率(true postive rate),在X轴上则是FP率(false postive rate)。 这意味着ROC曲线图的左上角是理想的取值点:FP率为0,TP率为1. 这是理想情况,但这意味着曲线下面积(AUC: area under the curve)越大越好。

ROC的陡度(steepness)也十分重要,理想情况是:TP率最大化,FP率最小化。

2.多分类问题

ROC曲线一般用在二分类问题上,用来学习一个分类器的输出结果。为了将ROC曲线和ROC面积扩展到多标签分类问题(multi-label classifaction)上,需要对输出进行二值化。可以为每个label上绘制一条ROC曲线。也可以通过标签判断矩阵(label indicator matrix)的每个元素作为二分类预测(micro-averaging)来绘制ROC曲线。

另一种二分类的评估方式是micro-averaging。它给出每个分类label上对应的平均权重。

注意:

参考:

1.http://scikit-learn.org/stable/auto_examples/svm/plot_separating_hyperplane_unbalanced.html