机器学习、人工智能应该是近几年最火的关键词之一了。今天分享一些机器学习的基础知识。如果有啥不正确的地方,欢迎各位大佬指正。
在说机器学习之前先明确一下,什么是人类的学习行为呢?
可以这样总结,人类从历史经验中获取规律,并将其应用到新的类似场景中,就是人类的学习行为。
相对应的,机器学习是指让机器去训练、去学习,让机器从大量数据中找到数据中的内在特征,从而对新事物做出判断。
机器学习有哪些类别呢?按照不同的分类方式,有不同的细分类别。梳理了一下,主要有以下的概况图:
(1)按照学习目标分类
什么是机器学习目标呢?通俗来讲,就是我们想通过机器学习,最终实现的结果形态是什么样。
按照学习目标,主要可以分为三类:回归问题、分类问题、排序问题。
(2)按照训练数据的特性分类
上文提到了,进行机器学习是需要训练数据为基础的(不然机器没法学习呀)。按照训练数据的特性,主要分为以下两类:
(3)按照模型的复杂程度分类
按照模型的复杂度,主要分为两类:线性模型和非线性模型。
(4)按照模型功能分类
按照模型的功能来分类,主要分为判别模型与生成模型。
对于一个机器学习项目而言,主要的流程有以下概况:
(1)数据预处理
数据清洗是检测和去除数据集中的噪声数据和无关数据,处理遗漏数据,去除空白数据域和知识背景下的白噪声。
(2)数据切分
在机器学习中,通常将所有的数据划分为三份:训练数据集、验证数据集和测试数据集。它们的功能分别为
关于数据如何进行切分,后续再进行分享。
(3)特征工程
特征构建是指从原始数据中人工的找出一些具有物理意义的特征。需要花时间去观察原始数据,思考问题的潜在形式和数据结构,对数据敏感性和机器学习实战经验能帮助特征构建。
关于机器学习,就先分享这些。欢迎大家继续关注~
在电视剧《亮剑》片尾,有这么一个剧情,李云龙长期与田雨分居,张白鹿趁虚而入...
1. 介绍 本文为以前做的项目总结,由于相关支付 SDK 迭代,原文已经不满足需求,...
武汉晚报讯(记者王超然)自动驾驶出租车体验如何?车上有没有司机?会不会迷失...
2020年是基于深度学习的自然语言处理(NLP)研究的繁忙年份。最大的噪音的英文由迄...
组织为什么要在机器学习治理上挣扎?当我们要为组织解决机器学习治理时,我们看到...
上周微信刚刚更新了8.0版本,带来新的表情、状态、音乐MV等玩法,直到现在关于它...
新晋世界首富、特斯拉CEO、科技大佬马斯克一度呼吁人们限制机器人,认为机器人在...
北京时间 3 月 5 日消息,使用人工智能的算法正在尝试以意想不到的技巧来解决问...
今天我给大家分享20款小众宝藏APP,工作、生活全不误,每天5分钟让自己悄悄成长...
沉浸式技术是不仅激发了企业而且吸引了普通消费者的最新潮流之一。看到这些新生...