ひょうりゅ

届ける言葉を今は育ててる

切换

模型评估

qing meng 发布于 2024-12-30 65 次阅读

模型评估插图

在数据标注中，模型评估是用来判断计算机（或机器学习模型）做得有多好的过程。因为模型是通过标注的数据进行训练的，我们需要一种方法来检查它是否学会了正确的任务，能够准确地做出预测。

模型评估的作用：

评估模型性能：模型评估让我们知道计算机学习的结果如何。我们训练模型后，通常会用一部分数据来进行测试，看看它的表现如何。
调整模型：通过评估结果，我们可以调整模型的参数，改进模型，直到它的准确性和效果达到我们期望的标准。

常用的评估指标：

准确率（Accuracy）
精确率（Precision）
召回率（Recall）
F1分数（F1 Score）

这些指标可以帮助我们从不同角度评估模型的表现。接下来我会逐一解释这些指标，并举一些具体的例子，帮助你理解它们。

1. 准确率（Accuracy）

准确率是最简单的一种评估指标，它表示模型正确预测的次数占总预测次数的比例。简而言之，它就是模型做对了多少次。

公式：

准确率 = 正确预测的数量总预测数量 \ 总预测数量

举个例子：

假设你训练了一个猫狗分类模型，测试集包含了100张图片，其中80张猫和20张狗。模型预测结果如下：

它正确地预测了猫80张图片中的75张。
它正确地预测了狗20张图片中的18张。

那么，模型的准确率就是：

准确率 =（75+18）/100 = 0.93 = 93%

这意味着模型正确预测了93%的图片。

2. 精确率（Precision）

精确率是指在所有被模型预测为某一类（例如“猫”）的样本中，实际属于该类的比例。换句话说，精确率告诉我们模型预测“猫”的时候，有多少次是准确的。

公式：

精确率=真正例（TP） / [ 真正例（TP）+假正例（FP） ]

真正例（TP）：模型正确预测为“猫”的数量。
假正例（FP）：模型错误预测为“猫”的数量。

举个例子：

在上面的猫狗分类任务中，模型预测了80张图片是“猫”，其中75张是真的猫，5张是狗。那么精确率就是：

精确率=75 / (75+5)=75 / 80=0.9375=93.75%

这意味着模型预测为“猫”的80张图片中，有93.75%是正确的。

3. 召回率（Recall）

召回率是指在所有真实属于某一类（例如“猫”）的样本中，模型预测出来的比例。召回率反映的是模型有多“敏感”，能够检测到实际属于某一类的样本。

公式：

召回率=真正例（TP） / [ 真正例（TP）+假负例（FN）]

假负例（FN）：模型错误地预测为“狗”而实际上是“猫”的数量。

举个例子：

在上述的猫狗分类任务中，实际有85张猫的图片（包括测试集中的所有猫），模型正确预测了其中75张猫，错预测了10张猫为狗。那么召回率就是：

召回率 = 75 / ( 75+10 ) = 7585 = 0.8824 = 88.24%

这意味着模型在所有实际是猫的图片中，能够正确识别出88.24%的图片。

4. F1分数（F1 Score）

F1分数是精确率和召回率的调和平均数，它试图平衡这两个指标。F1分数适用于在精确率和召回率之间需要平衡的情况。如果模型在精确率和召回率上都表现较好，F1分数就会较高。

公式：

F1分数 = 2 × { ( 精确率 × 召回率 ) / ( 精确率 + 召回率 ) }

举个例子：

假设一个模型的精确率是 93.75%，召回率是 88.24%。那么，F1分数就是：

F1分数 = 2 × { ( 0.9375 × 0.8824 ) / ( 0.9375 + 0.8824 ) } = 2 × (0.826 / 1.8199 ) = 0.905

即F1分数约为 0.905，表示模型在精确率和召回率之间取得了一个不错的平衡。

总结与小结：

准确率：总的正确预测比例，但它不能很好地处理类别不平衡的情况（例如猫狗图片中狗很少，模型可以通过总是预测猫来获得高准确率）。
精确率：模型预测为“猫”时，有多少次是对的。
召回率：所有真实是“猫”的图片中，模型能正确识别的比例。
F1分数：精确率和召回率的综合，适合需要平衡二者的场景。

举个例子来比较：

假设你在垃圾邮件识别中，模型总是判断邮件是“正常邮件”而不判断为“垃圾邮件”，这时即使准确率很高（比如98%），但是它的召回率会很低（很多垃圾邮件没被识别出来），此时F1分数会帮助你更好地理解模型的实际表现。

通过这些评估指标，你可以更全面地了解你的模型在哪些方面表现好，哪些方面需要改进，从而提高它的效果。

上一篇文章

数据标注

下一篇文章

2025/1/4

查看评论 - NOTHING

Comments NOTHING

暂无评论

取消回复

Markdown Supported while Forbidden

你是我一生只会遇见一次的惊喜 ...

戳我呀 OωO 嘿嘿嘿ヾ(≧∇≦*)ゝ

bilibili~	Tieba	(=・ω・=)

bili_smilies

bili_smilies

bili_smilies

bili_smilies

bili_smilies

bili_smilies

bili_smilies

bili_smilies

bili_smilies

bili_smilies

bili_smilies

bili_smilies

bili_smilies

bili_smilies

bili_smilies

bili_smilies

bili_smilies

bili_smilies

bili_smilies

bili_smilies

bili_smilies

bili_smilies

bili_smilies

bili_smilies

bili_smilies

bili_smilies

bili_smilies

bili_smilies

bili_smilies

bili_smilies

bili_smilies

bili_smilies

bili_smilies

bili_smilies

bili_smilies

bili_smilies

bili_smilies

bili_smilies

bili_smilies

bili_smilies

bili_smilies

bili_smilies

bili_smilies

bili_smilies

bili_smilies

bili_smilies

bili_smilies

bili_smilies

bili_smilies

bili_smilies

邮件通知