当前位置：主页 > 查看内容

您需要针对机器学习性能进行优化的6个指标

发布时间：2021-09-15 00:00| 有位朋友查看

简介：有许多指标可用来衡量模型的性能，具体取决于您要进行的机器学习的类型。在本文中，我们将研究分类和回归模型的性能指标，并讨论哪种指标可以进行更好的优化。有时要看的指标会根据最初要解决的问题而有所不同。机器学习指标的示例分类问题的优化分类表……

有许多指标可用来衡量模型的性能，具体取决于您要进行的机器学习的类型。在本文中，我们将研究分类和回归模型的性能指标，并讨论哪种指标可以进行更好的优化。有时要看的指标会根据最初要解决的问题而有所不同。

机器学习指标的示例

分类问题的优化

分类表示例

1.真实肯定(召回)

真实肯定率(也称为召回率)是二进制/非二进制分类问题中的首选性能指标。在大多数情况下(即使不是所有时间)，我们只对正确预测一个类感兴趣。例如，如果您正在预测糖尿病，则比起预测此人没有糖尿病，您将更关心预测此人是否患有糖尿病。在这种情况下，阳性类别为"此人患有糖尿病"，阴性类别为"此人未患有糖尿病"。这只是预测肯定类别的准确性(这不是准确性性能指标。有关更多详细信息，请参见下面的数字4)

2. ROC曲线(接收机工作特性曲线)

ROC曲线显示分类模型在不同阈值(分类到特定类的可能性)下的性能。它绘制了真假阳性率和假阳性率。降低阈值将增加您的真实肯定率，但会牺牲您的错误肯定率，反之亦然。

3. AUC(曲线下面积)

AUC也称为" ROC曲线下的面积"。简单地说，AUC会告诉您正确分类的可能性。较高的AUC代表更好的模型。

4.准确性

默认情况下，精度是第一要注意的事情。但是，真正的数据科学家知道准确性太误导了。一种更好的称呼方法是预测所有类别的平均准确性。就像我在True True Rate中提到的那样，它是最理想的指标。准确度将取"真正值"和"真负值"之和的平均值。在不平衡分类问题中，大多数情况下，否定类比肯定类的代表更多，因此您更有可能具有很高的真实否定率。然后，准确度将偏向负面类别的准确预测，这可能不会引起任何人的兴趣。

机器学习中的回归优化

回归图示例

5.错误

该错误通常会在R旁边被忽略，它告诉我们更多有关拟合值相对于回归线(即拟合值与优秀拟合线之间的平均距离)的精度的信息。在计算模型的置信度和预测间隔时，这一点尤为重要。由于使用响应变量的自然单位，因此更易于解释，而R没有单位，并且仅在0到1之间。

误差有不同类型，例如"均值绝对误差"和"均方根误差"。每种误差都有其优缺点，必须单独对待以评估模型。

6. R2

现在，尽管"标准误差"很重要，但R已成为良好回归模型的实际度量。它告诉我们模型解释了因变量和自变量之间的差异。较高的R会给出更好的模型，但是，如果过高(接近99%)有时会导致过度拟合的风险。由于相关性与因果关系的争论可能会给R带来不合逻辑的高R，因此R可能会产生误导。

用户的目标会影响模型的性能，因此请谨慎选择

精度并非始终是分类问题中的优秀度量，R对于回归而言可能并非最佳。无疑，它们都是最容易理解的，尤其是对于非技术利益相关者而言(这也许是首先构建模型的较大原因)。比较好的方法可能是考虑各种性能指标并考虑您的初始目标。模型的性能始终取决于用户的目标。从一个人的角度来看，表现不佳对于另一个人而言可能并非如此。

本文转载自网络，原文链接：https://www.toutiao.com/i6849021724818670091/
本站部分内容转载于网络，版权归原作者所有，转载之目的在于传播更多优秀技术内容，如有侵权请联系QQ/微信：153890879删除，谢谢！

上一篇：人工智能的主要发展及其驱动力 下一篇：没有了

随机推荐

2021年十大值得期待的手机技术

2021年才刚开始，小米和vivo就已经抢先发布了今年搭载骁龙888的旗舰机型，那么，...
机器人在零售行业中有哪些应用？

机器人已经进入零售业，从六英尺高的自由移动机器发现巨人食品商店中的溢出物，...
趋势科技：AI将在2030年替代网络安全人员

进入2021年，趋势科技预测，网络罪犯会利用家庭网络入侵企业IT和IoT网络。 IT主...
应对机器学习中类不平衡的10种技巧

介绍当一个类的观察值高于其他类的观察值时，则存在类失衡。示例：检测信用卡...
字节二面：优化HTTPS的手段，你知道几个

由裸数据传输的 HTTP 协议转成加密数据传输的 HTTPS 协议，给应用数据套了个「保...
Android 11 vs iOS：Android 11从iPhone

Android 11的第一个公开测试版已于今天发布，它带来了许多重要的新功能。如同iO...
金山云荣获“IPv6支持度优秀奖” 全系列

近日，由下一代互联网国家工程中心主办的GNTC 2020全球网络技术大会在南京成功举...
人工智能对人类的威胁堪比核弹？揭秘AI威

新晋世界首富、特斯拉CEO、科技大佬马斯克一度呼吁人们限制机器人，认为机器人在...
iOS11.3能修复降频问题，但这些机型没有

去年年底，苹果承认在一些较旧的iPhone机型上限制了CPU的性能，其原因很简单因为...
VR影院来了！即将革新未来电影行业

电影的发展一直伴随着技术的改革创新，通过不断提升技术水平，不仅能给制作者提...

您需要针对机器学习性能进行优化的6个指标

推荐图文

边缘计算：为何如此重要

两代 iPhone SE 之间，苹果悄悄地变了

微信、支付宝有密码，为什么扫码枪还能直接把钱扫走

5G车联网技术驱动自动驾驶智慧化变革之路

智能车辆识别技术为智慧城市铺平了道路

苹果发布iOS 14.1和iPadOS 14.1 带来了多项Bug修复

随机推荐

2021年十大值得期待的手机技术

机器人在零售行业中有哪些应用？

趋势科技：AI将在2030年替代网络安全人员

应对机器学习中类不平衡的10种技巧

字节二面：优化HTTPS的手段，你知道几个

Android 11 vs iOS：Android 11从iPhone

金山云荣获“IPv6支持度优秀奖” 全系列

人工智能对人类的威胁堪比核弹？揭秘AI威

iOS11.3能修复降频问题，但这些机型没有

VR影院来了！即将革新未来电影行业

关于我们