作为一个在这个行业已经好几年的数据科学家,在LinkedIn和QuoLa上,我经常接触一些学生或者想转行的人,帮助他们进行机器学习的职业建议或指导方面相关的课程选择。一些问题围绕教育途径和程序的选择,但许多问题的焦点是今天在数据科学领域什么样的算法或模型是常见的。
由于可供选择的算法太多了,很难知道从哪里开始学起。课程可能包括在当今工业中使用的不是很典型的算法,而课程可能没有包含目前不是很流行的但特别有用的方法。基于软件的程序可以排除重要的统计概念,并且基于数学的程序可以跳过算法设计中的一些关键主题。
我为一些有追求的数据专家整理了一个简短的指南,特别是关注统计模型和机器学习模型(有监督学习和无监督学习);这些主题包括教科书、毕业生水平的统计学课程、数据科学训练营和其它培训资源。(其中有些包含在文章的参考部分)。由于机器学习是统计学的一个分支,机器学习算法在技术上归类于统计学知识,还有数据挖掘和更多的基于计算机科学的方法。然而,由于一些算法与计算机科学课程的内容相重叠,并且因为许多人把传统的统计方法从新方法中分离出来,所以我将把列表中的两个分支也分开了。
统计学的方法包括在bootcamps和证书程序中概述的一些更常见的方法,还有一些通常在研究生统计学程序中所教授的不太常见的方法(但在实践中可以有很大的优势)。所有建议的工具都是我经常使用的工具:
机器学习扩展了许多这样框架,特别是K均值聚类和广义线性建模。在许多行业中一些有用的常见技术(还有一些更模糊的算法,在bootcamps或证书程序中出人意料的有用,但学校里很少教) 包括:
依靠所选择的行业,可能需要与自然语言处理(NLP)或计算机视觉相关的附加算法。然而,这些是数据科学和机器学习的专门领域,进入这些领域的人通常已经是那个特定领域的专家。
学术项目之外的一些学习这些方法的资源包括:
数字时代 创新的时代。万千开发者汇聚智慧 启迪梦想 不断推进创新发生。 成立12...
哪里办理 域名备案 最快?相较传统备案方法,现在采用的电子化备案方式,已经方...
纷纷攘攘的云计算,终于逐步走下云端;云计算也从概念化走向实际应用。在香港及...
光流 optical flow (光流) 表示的是相邻两帧图像中每个像素的运动速度和运动方...
随着中小IDC市场竞争激烈,也近趋于饱和。高速率、可靠性、低成本是IDC竞争中胜...
1. 前言 Gartner预测到2023年 全球3/4的数据库都会跑在云上 云原生数据库最大的...
3月18日,全球知名开源软件开发和项目管理协同平台GitLab与红杉宽带、高成资本共...
VPS主机 是网站中最常用的一种虚拟服务器形式, VPS主机 具有技术成熟、灵活方便...
来源 | 阿里云基础设施微信公众号 阿里云IPv6小贴士 最丰富的云产品:70余款支持...
本文转载自公众号读芯术(ID:AI_Discovery)。 笔者认为,编程最难的部分之一,并...