本文为大家介绍了在数据科学和机器学习中所需要的基本数学技能,并且分类给出了相应的主题建议。
尽管已经有许多出色的计算工具可供数据科学家执行其工作,数学技能在数据科学和机器学习中仍然是必不可少的,因为这些工具通常仅仅会像是“黑匣子”,而如果没有理论基础,您将无法回答核心的分析性问题。
如果您渴望成为数据科学家,那么您无疑会想到以下问题:
我几乎没有数学背景,可以成为一个数据科学家吗?
数据科学中的哪些基本数学技能很重要?
有许多好的软件包可用于构建预测模型或数据可视化。一些最常见的用于描述性和预测性分析的软件包包括:
借助这些软件包,任何人都可以构建模型或进行数据可视化。但是,扎实的数学背景知识对于模型微调(fine-tuning)以生成具有最佳性能的可靠模型至关重要。建立模型是一回事,但解释模型并得出可用于数据驱动决策的有意义的结论,是另一回事。重要的是,在使用这些软件包之前,您必须了解每个软件包的数学基础,这样才能避免将这些软件包仅仅用作“黑匣子”工具。
假设我们现在将要建立一个多元回归模型。在此之前,我们需要问自己以下问题:
哪些是截距?
我应该使用非参数回归模型,例如K近邻回归还是支持向量回归(SVR)?
我的模型中有哪些超参数,如何对其进行微调以获得性能最佳的模型?
没有良好的数学背景,您将无法解决上面提出的问题。最重要的是,在数据科学和机器学习中,数学技能与编程技能同等重要。因此,想成为数据科学家,您必须花时间研究数据科学和机器学习的理论和数学基础。您能否构建可应用于实际问题的可靠且有效的模型,取决于您的数学技能。
现在,让我们讨论数据科学和机器学习所需的一些基本数学技能。
1、 统计学和概率论
统计学和概率论可以用于特征的可视化、数据预处理、特征变换、数据填补、降维、特征工程、模型评估等环节。以下是您需要熟悉的主题:
2、 多变量微积分
大多数机器学习模型都是使用具有多个特征或预测变量的数据集构建的。因此,熟悉多变量演算对于建立机器学习模型非常重要。以下是您需要熟悉的主题:
3、 线性代数
线性代数是机器学习中最重要的数学技能。当数据集被表示为矩阵,线性代数则可用于数据预处理、数据转换、降维和模型评估。以下是您需要熟悉的主题:
4、 优化方法
大多数机器学习算法通过最小化目标函数来执行预测建模,因而机器学习必须应用于测试数据的权重才能获得预测标签。以下是您需要熟悉的主题:
总而言之,我们讨论了数据科学和机器学习所需的基本数学和理论技能,已经有许多免费在线课程教授这些必要的数学技能。想成为数据科学家,请务必牢记,理论基础对于构建高效且可靠的模型至关重要。因此,您应该投入足够的时间来研究每种机器学习算法背后的数学理论。
译者简介:刘思婧,清华大学新闻系研一在读,数据传播方向。文理兼爱,有点小情怀的数据爱好者。希望结识更多不同专业、不同专长的伙伴,拓宽眼界、优化思维、日日自新。
作者 | 楚奕 来源 | 阿里技术公众号 这篇文章主要从技术视角介绍下跨平台WebCanv...
1.百度是个大骗子,我抄了十几年的满分作文却从未得过满分。 2.学神在刷难题,...
基于阿里巴巴的互联网架构、大数据技术,利用混合云架构打造全新的云化电子税 务...
本文转载自微信公众号「后端Q」,作者conan。转载本文请联系后端Q公众号。 概述 ...
背景 有时候我会碰到快速搭建测试服务的需求,比如像这样: 搭建一个 HTTP Servi...
创业与投资的本质,都是追寻一种能够穿越时空,抵达未来的高效方式。 德勤管理咨...
3月24日,腾讯发布2020年Q4及全年财报,其中金融科技及企业服务第四季收入385亿...
前言 微服务成了互联网架构的标配模式,对微服务之间的调用的流量治理和管控就尤...
1.某女生寝室门口贴着一个告示男生与饭盒不得入内,问何解?答曰两者都会搞大女...
1.在报名的路上,我看见远处的学校,轰!的一声没了。希望如此。 2.男:我一直...