当前位置：主页 > 查看内容

机器学习新风暴：如何用ML模型预测房价？

发布时间：2021-07-15 00:00| 有位朋友查看

简介：本文转载自公众号读芯术(ID：AI_Discovery) 从驾驶汽车到识别语音+翻译，机器学习通过软件预测变幻莫测的现实世界，正在人工智能领域掀起一场风暴。所以，什么是机器学习? 机器学习是教计算机系统使用反馈的旧数据进行预测的过程，基本上是训练计算机根据过……

本文转载自公众号“读芯术”(ID：AI_Discovery)

从驾驶汽车到识别语音+翻译，机器学习通过软件预测变幻莫测的现实世界，正在人工智能领域掀起一场风暴。

所以，什么是机器学习?

机器学习是教计算机系统使用反馈的旧数据进行预测的过程，基本上是训练计算机根据过去的数据预测未来的数据。这些预测可以很简单，例如鉴定照片中的动物是猫还是狗，难度也可以递进至对语音准确识别来生成网站字幕或运行视频或音乐之类的事情。

机器学习种类

机器学习大致分为两大类：监督学习和无监督学习。

监督学习是用示例教学机器的方法。这些机器接受了大量数据的训练，从而学会识别图案，并可以根据训练数据来识别和区分数据。

而无监督学习是使用算法来识别数据集的模式，其中的数据点既未分类也未标记。算法从数据集中提取有用的信息或特征来分析其底层结构，并依此对数据进行分类。

来看看怎样使用监督学习来构建机器学习模型。

第一步：熟悉数据

任何机器学习项目的第一步都是熟悉数据。对此可以使用Pandas库。Pandas是数据科学家探索和处理数据的主要工具。

机器学习新风暴：如何用ML模型预测房价？

Pandas库中最重要的是DataFrame。DataFrame相当于保存数据的表，类似SQL数据库中的表。Pandas有处理DataFrame中数据的强大方法。拿加利福尼亚房价数据举例。(文件路径：../input/california-housing-prices/housing.csv)使用以下命令加载和浏览数据：

机器学习新风暴：如何用ML模型预测房价？

第二步：选择建模数据

研究DataFrame的数据后会发现它有10列，其中有9列是数字数据，“Ocean proximity”一列有字符串类型数据。我们只用数字数据就可以构建任何模型，因此可以直接删掉“Ocean proximity”列。

机器学习新风暴：如何用ML模型预测房价？

然后删掉空值的列，如下：

机器学习新风暴：如何用ML模型预测房价？

第三步：选择预测目标(Y)和特征(X)

下一步是选择预测目标(Y)，也就是“median_house_value”列。所以分配Y为“ median_house_value”。其余特征为X。从数据集中移除“ median_house_value”列，然后将余下的分配为X，如下所示：

机器学习新风暴：如何用ML模型预测房价？

机器学习新风暴：如何用ML模型预测房价？

第四步：构建模型

使用scikit-learn库创建模型。该库在代码中以sklearn形式编写。当用存储在DataFrames中的数据类型进行建模时，最受欢迎的库就是Scikit-learn。建立和使用模型的步骤是：

定义：模型类型是什么?是线性回归还是其他类型?
拟合：从现有数据中获取模式(建模的核心)。
预测：预测目标
评估：确定模型预测的准确度。

现在，使用scikit-learn(sklearn)来定义线性回归模型，并将其与特征和目标变量进行拟合，并获得“ median_house_value”的预测值。导入以下库使用scikit-learn(sklearn)。

机器学习新风暴：如何用ML模型预测房价？

为线性回归模型创建一个变量。并且还使用train_test_split函数将数据分为训练和测试数据。在这里，我使用了25%的数据进行测试，而剩余的75%则用于训练模型。

机器学习新风暴：如何用ML模型预测房价？

第五步：拟合模型

用训练数据拟合线性回归模型。

机器学习新风暴：如何用ML模型预测房价？

完成后，预测功能通过使用X的测试值来预测房价。然后使用得分功能通过模型获得预测值的准确度，如下所示：

机器学习新风暴：如何用ML模型预测房价？

可以看到，模型预测正确率在66%左右。

第六步：画图

现在用X测试值和预测值(输出)画图，如下：

机器学习新风暴：如何用ML模型预测房价？

一个拟合的模型完成啦，我们可以用它预测。实际使用时，我们可以对即将上市的新房子做预测。

本例是关于如何在数据集上拟合线性回归模型并用来预测房价。我们还可以将相同的数据拟合到决策树上或用来支持向量机，并比较哪种模型预测得更好。

希望本文能帮到那些正在尝试建立第一个机器学习线性回归模型的人。

本文转载自网络，原文链接：https://www.toutiao.com/i6895927810968257032/
本站部分内容转载于网络，版权归原作者所有，转载之目的在于传播更多优秀技术内容，如有侵权请联系QQ/微信：153890879删除，谢谢！

上一篇：无人驾驶：如何使用立体视觉实现距离估计？ 下一篇：没有了

推荐图文

周排行
月排行
总排行

1 两代 iPhone SE 之间，苹果悄悄地变了

2 苹果AR/VR头显设备渲染图：可替换头带内

3 新冠肺炎之后，5G将如何改变医疗行业

4 iPhone需不需要清后台？这本来就不该有争

5 关于人工智能你需要知道的一切

6 人工智能列国志｜这十件大事记录了人工智

7 AI武器时代：伊朗科学家真的遭遇了人工智

8 3分钟帮你快速了解UI设计全流程

9 “双十一”秒杀攻略：5G和Wi-Fi 6哪个更

10 机器学习和AIOps在网络性能管理中的作用

随机推荐

万字长文爆肝 DNS 协议！

试想一个问题，我们人类可以有多少种识别自己的方式?可以通过身份证来识别，可以...
无人机小型化趋势之下，发展成熟需关注三

近年来，核心技术的不断突破，市场需求的持续释放，推动了无人机产业的火热发展...
Omdia：2025年下一代PON设备市场接近89亿

LightReading报道，Omdia在题为 2021年值得关注的趋势：宽带接入设备市场的报告...
人工智能怎样赋能智能工厂

如今，人工智能技术在制造业的应用方兴未艾，如何才能选对适合自身企业的人工智...
5G和物联网技术发展，将助力电子测试市场

5G是新一代移动通信技术，具有高速率、大带宽、低时延等优势。物联网则是互联网...
爱情说说短语：你的一句我陪你，胜过千言

1．遇到你之前，世界是一片荒原，遇到你之后，世界是一个乐园，过去的许多岁月，...
什么是人工智能芯片？人们需要知道的一切

【51CTO.com快译】行业专家指出，许多智能设备和物联网设备都是由某种形式的人工...
爱情说说配图：原来，爱情只是宿命摆下的

1．这世界上哪有完全合适的爱情，只不过爱的时候，彼此都委曲求全而已。这世上又...
未来数据中心最需要的5种技能

现代数据中心正在不断发展以适应各种类型的新工作负载。随着业务的增长，在新的I...
苹果近红外光学AR/VR眼球追踪技术获专利

近期，美国专利商标局授权了苹果一项与AR/VR眼球追踪系统相关专利，专利中详细介...