95后数据科学家教你从零自学机器学习,这有3本入门必看书籍

晓查 发自 凹非寺
量子位 编译 | 公众号 QbitAI

厌倦了现在的工作,想转行做数据科学,但是却没有计算机专业的相关学历,应该怎样才能入门?

这类的教程已经有很多。最近一位22岁的数据科学家Dario,以自学经历中用到的资源告诉你,如何从零开始学习数据科学。

所谓从零开始自学,是针对那些可以自主学习在线课程和阅读书籍,却没有上班之余接受课堂教育的人士。

在学习之前,如果你对线性代数、微积分、概率论与统计学、程序设计都不太熟悉,Dario建议先去学习一下这几门数学课程,然后再学习Python。

在学完以上内容后可以进入下面的学习。

看书还是看视频

如果想进入数据科学领域,每天一两个小时的学习是必不可少的,是看书还是选择看视频?

很多人都不想在每天工作8小时后还看书,因此视频教程是个不错的选择,而且可以在通勤路上观看。

Dario首先推荐的是Udemy的《数据科学与机器学习Python训练营》,这是他第一次接触数据科学的时候学习的课程。

课程中用Pandas和Numpy进行数据分析,并用Matplotlib和Seaborn进行一些数据可视化。虽然内容不多也不深入,但已经足够入门数据科学了。

Dario还推荐了Coursera上由吴恩达主讲的《机器学习》课程,学习时长大概十多个星期。课程以英文讲述,但是提供中文字幕。

这门课程的质量绝对有保障,大约12万名用户平均评分为4.9(满分5),人气也超高,共有260多万用户注册。

三本优秀的入门必看书

如果你更喜欢读书,Dario还推荐了3本入门数据科学的优秀教材。

第一本是《Python数据科学手册》。这本书从Jupyter Notebook入手,内容涵盖了Numpy、Pandas,、Matplotlib和Scikit-Learn等数据科学中最重要的部分。

该书的中文版去年已经出版,网上评分9.3,网友都说这是本优秀的入门级教材,非常适合非计算机专业的学生。

第二本是《统计学习导论》,它的内容会有点数学,但是也很容易阅读。

对于机器学习这样一个广泛的领域,这本书能将篇幅控制在400页左右很不容易。唯一的缺点是代码是用 R语言而不是Python编写的。

这本书的英文版提供免费下载(地址见文末),评分为9.5分,中文版8.3分。

第三本是《Scikit-Learn与TensorFlow机器学习实用指南》,这本书能帮助你深入了解机器学习的概念和算法。目前,该书的英文影印版和中文版都已经出版。

下一步

学完所有课程后,Dario建议初学者建立一个GitHub存档,并寻找5个数据集来练手,在这个过程中写出自己的结论和思考过程。

对于你未来要投递的公司来说,让他们看到你的工作很重要。因为你没有相关学位,因此需要以某种方式展示自己在数据科学中的工作,而GitHub是一个不错的选择。

传送门

原文连接:
https://towardsdatascience.com/becoming-a-self-taught-data-scientist-5563f546bb7b

数据科学与机器学习Python训练营:
https://www.udemy.com/course/python-for-data-science-and-machine-learning-bootcamp/

吴恩达《机器学习》课程:
https://www.coursera.org/learn/machine-learning

《An Introduction to Statistical Learning》下载地址:
http://faculty.marshall.usc.edu/gareth-james/ISL/

版权所有,未经授权不得以任何形式转载及使用,违者必究。