本文转载自公众号“读芯术”(ID:AI_Discovery)。
很多网站都提供数据科学在线课程,而笔者最钟爱的就是Kaggle平台,使用它的次数最多,比如查看代码、下载数据和查看其他Jupyter笔记本等。领英也提供课程,但笔者更愿意在已有学习经历的网站上参加课程。
根据Kaggle上的示例和数据,笔者已经在这个网站上练习了大量的机器学习算法及对应的代码。老司机带路,为你筛选一些 Kaggle上可学习的精品数据科学课程。
Kaggle
Kaggle是可以了解数据科学的网站,你可以在上面查看其他数据科学家们开发的机器学习模型,也可以查看数百行代码,参加机器学习竞赛,从大量有用的数据集中下载资源,最终修炼成更优秀的数据科学家。
其上有许多直击重点的好课,不同于其他常见的数据科学课程,你不必花上数周或数月,可以在几小时或几天内就完成整套课程。
课程
这些课程中有些非常简单,而有些则在学习数据科学和实践技能方面具有独特性和优势,能让你成为与众不同的数据科学家。这些课程由数据科学、机器学习和人工智能的领军者教授或创建。向下拉动课程列表就可以在开始新课程之前看到所需要的必备技能。
其他平台上的许多课程可能会注重特定的函数、列表、数组、查询技术,但是Kaggle的这些课程始终注重它们与数据科学项目的联系,以帮助学习者了解和改进整个数据科学过程。下面列出这14门课程:
图源:unsplash
其中有6门我力荐的精品课程:
1. 特征工程
这门课程之所以重要,是因为大多数数据科学家们在职业生涯中都不会收到一个完美的精选数据集,能够直接纳入他们的模型。它在实际应用中是不可或缺的,你总是需要完善特征工程的艺术。本课程重点介绍基线模型、分类编码、特征生成和特征选择的过程。
2. 高级SQL
虽然SQL课程没什么特别之处,但笔者非常喜欢看其中一些部分,这些部分使用了我所见过最有用的SQL的视觉效果以及BigQuery的示例。课程涵盖的主要主题是:
3. 地理空间分析
图源:pexels
这门课是我目前见过的最好的视觉化示例之一。在本课程中,您可以执行许多自定义地图,这在其他程序中通常是无法执行的。本课程包括几个部分:
4. 机器学习的可解释性
该课程概述了SHAP值,这是一个非常有用的库,帮助数据科学家们向自己和其他非技术相关人员解释机器学习的结果。在这个特别的课程中你将学习到:模型洞察的用例、排列重要性、Patrial Plot图、SHAP值、SHAP值的高级用法。
5. 自然语言处理
在笔者的职业生涯中,数据科学中的这一部分用得最多。总是会有重要的、典型的数字数据,但是文本数据几乎一样普遍。可以将文本作为特征添加到多个机器学习模型中。
本课程涵盖NLP入门、文本分类和词向量。尽管这个话题在数据科学领域似乎有些陌生,但数据科学的这一方面多年以来已司空见惯了。例如,谷歌搜索引擎很可能一直在使用自然语言处理来生成搜索建议。
6. 游戏人工智能和强化学习入门
在数据科学的学习经历以及紧跟当前数据科学趋势过程中,笔者从未见过这样的课程。这些课程中最有趣的部分或许是可以学习如何制作电子游戏。本课程重点关注的其他主题是:
图源:unsplash
数据科学课程在网上几乎随处可见,但选项太多有时也会造成困扰,因此笔者非常贴心地为你挑选好啦。课程的选择最终取决于你在寻找什么,如果你想要直接的、非常有益的、真实的数据科学课程应用,Kaggle就是最佳选择。
案例背景 永安稻香小镇的体验式数字农业基地是余杭街道依托“阿里以西10分钟”的...
【51CTO.com快译】 数据分析是对数据进行判断、细化、更改和建模的过程,目的是...
操作场景 您可以删除不需要的私有镜像。 删除私有镜像后,将无法找回,请谨慎操...
公司介绍 长沙营智信息技术有限公司旗下易撰网,2017年10月份上线以来,基于数据...
【51CTO.com快译】不知道您是否听说过软件架构师最讨厌意大利面这个梗?它是指软...
大家在开发Python的过程中,一定会遇到很多反斜杠的问题,很多人被反斜杠的数量...
人脸识别 是目前商业应用最成熟、最广泛的人工智能技术之一,成为开发者、企业接...
大数据市场如今正在呈爆炸式增长。根据调研机构Markets and Markets公司的调查,...
本月DataWorks产品月刊为您带来 产品活动 1.参与阿里云DataWorks问卷调研 (Aliyu...
阿里巴巴、腾讯、支付宝、网易、IBM、谷歌、京东、 百度、滴滴等一线互联网公司...