不知道大家有没有这样的感觉:在我们学习的时候,经常学了就忘,忘了再学,彷佛进入了死循环。明明都学了,结果就是记不住。有时候都想往自己的脑袋里植入一个储存器,想学什么就往脑子里复制,这样多好。
机器学习就是这样一个例子。很多时候,我们在学习过程中迷失了方向,从而失去了继续学习的动力。许多概念需要系统化。但是今天,我想为大家介绍机器学习的所有概念,这些概念将有助于你更快地了解这个领域。这篇文章将适合那些刚刚入门并且已经在实践中开始使用机器学习的人。
概述:
废话不多说,让我们直接开始吧!
这些概念中的每一个都会引出其他更小的衍生概念。在这里,我会为每一个术语给出最短和最简单的定义:
1、动机
动机对于机器学习来说很重要,因为它形成了模型与数据进行比较的过程。机器学习的动机有两种方法:
2、分类
与其他方法一样,训练机器学习算法的方法也各不相同,而且各有优缺点:
3、问题类型
如果要深入研究机器学习类别,还有五种其他类型的问题:
4、类
机器学习算法可分为参数或非参数:
第一步:假设我们的函数(f)的函数形式或形状,即:f是线性的,因此我们将选择一个线性模型。
第二步:选择一个程序来适应或训练我们的模型。这意味着估计线性函数中的β参数。一种常见的方法是(普通)最小二乘法。
5、性能分析
算法的性能分析是计算该算法所需的空间和时间的过程。算法的性能分析采用以下措施:
6、算法
机器学习真正有趣的部分来了!以下内容能够帮助你如何将机器学习付诸实践:
7、调试
调试是为学习算法选择一组最佳超参数的问题。这是它的组成部分:
交叉验证—一种用于评估统计分析结果如何概括为独立数据集的技术。一轮交叉验证涉及将数据样本划分为互补的子集,对一个子集(称为训练集)执行分析,并对另一个子集(称为验证集或测试集)进行分析验证。
方法:Leave-p-out交叉验证,Leave-one-out交叉验证,k倍交叉验证,Holdout方法和重复随机采样验证。
超参数-一个参数,其值用于控制学习过程。相反,其他参数的值(通常是节点权重)是通过训练得出的。可以使用以下方法对其进行优化:
1)网格搜索。传统方式只是简单地穷举搜索学习算法的超参数空间的手动指定子集。
2)随机搜索。它只是简单地对参数设置进行采样,发现在高维空间中,进行固定次数要比穷举搜索更为有效。
3)基于梯度的优化。对于特定的学习算法,可以计算相对于超参数的梯度,然后使用梯度下降优化超参数。
正则化(提前停止)-提前停止规则可指导学习者开始过度拟合之前可以运行多少次迭代,然后停止算法。
过度拟合。当模型学习训练数据中的细节和噪声时,会在一定程度上影响新数据上模型的性能,因此会发生这种情况。
欠拟合(Underfitting)。模型从训练数据中“学习不足”的情况下,导致泛化率低和预测不可靠。
引导。它是使用替换随机抽样并属于更广泛的重采样方法的任何测试或度量。自举法将准确性的度量(偏差,方差,置信区间,预测误差等)分配给样本估计。
套袋(bagging)。它是一种集成的机器学习算法,结合了许多决策树的预测。
以上内容基本上包含了机器学习的全部知识点,温故而知新,学过的东西如果不回过来看一下,说不定哪天就彻底忘记了。希望以上内容能给大家提供帮助~
曾经,视频进度条被用户呼吁了很久之后,才被腾讯加入,如今已经是离不开的基本...
随着人脸识别等新兴技术的普及并走进万千大众的生活,围绕技术运用的争议越来越...
根据移动数据和分析公司App Annie的年终预测,2020年消费者在iOS和Google Play上...
自然语言处理(NLP)使聊天机器人能够理解我们的会话信息并相应地作出响应。 企业...
且看以下的人工智能在机械故障诊断中的应用方向便知了! 本文转载自网络,原文链...
今年以来,伴随着新基建的提出,我国5G发展迈入快车道。经过疫情复工复产后按下...
2012 年,苹果地图推出时,曾因位置标错、图像变形扭曲,而闹过不少乌龙。 那时...
产业数据: Forrester预测,中国的技术支出将在2020年增长2%,在2021年增长9%到1...
我们知道,使用 Android 10 系统用户可以轻松地以二维码的形式分享 WiFi 密码,...
实现的效果如下的Gif所示,就是网络通信Socket模块实现文件下载传输。 服务端 首...