如大家所了解的,二分类是一个常见的机器学习任务,有许多指标来衡量二分类模型的性能,本文将从疾病预测的场景开始,分别介绍二分类的基础指标和综合指标,并进行对比。
二分类就是把数据非此即彼地分成两类的任务,结果只有两种可能,比如判断邮件是不是垃圾 。这是机器学习里最基础的分类任务 。
疾病预测
我们以疾病预测为例子来介绍二分类的指标。疾病预测是一个二分类预测任务,我们需要预测患者是否患有疾病。
如下图,假设一共有 100 个样本,其中 90 个是正常未患病的人,10 个是患病的人,现在模型预测出 12 个患病的人,88 个未患病的人。
预测患病的人中,8 人真正患病(真阳性),4 人并未患病(假阳性)。预测未患病的人中,86 人未患病(真阴性),4 人患病(假阴性)。