数据科学初学者起航——六本免费书籍
数据科学是一个跨学科领域,需要计算机科学、数学、统计学和机器学习等多个领域的技能。作为学习数据科学的初学者,你可能不太了解怎么开始学习。
你可以选择数据科学课程和训练营,指导你完成结构化课程。但是,如果你没有几千美元来支付这些课程,你也可以从免费或低成本的资源学习开始。
免费资源在网上随处可见,但很难找到好的资源。对初学者来说,书籍是一个很好的学习资源,幸运的是,现在有几本免费书籍,涵盖了所有初学者需要了解的概念。
在接下来的文章中,我将为初学者介绍我最喜欢的六本免费书籍。如果你想了解更多数据分析相关内容,可以阅读以下这些文章:
从入门到精通——2021年你应该读的深度学习书籍清单
2021年你最应该阅读的11本数据科学书籍
Tableau官方推荐:8本给数据科学界小白的经典书籍
15本学习Data Mining的最佳书籍,你看过几本?
本文中的每本书都涵盖了数据科学中最重要的基本概念之一。我按照我个人推荐的顺序整理了话题,具体如下:
- Python 编程的基础知识
- 数据科学统计学
- 数据分析中的Pandas
- Python 数据科学工具包
- 机器学习
- 深度学习
1. Learn Python the Right Way
(正确学习Python)
作者:Peter Wentworth、Jeffrey Elkner、Allen B. Downey 和 Chris Meyers
点击此处免费阅读: https://learnpythontherightway.com/#about
Python 是数据科学的首选编程语言。因此,学习Python的编程基础知识是该领域初学者应该学习的首要内容。本书并非专门针对数据科学编程,而是涵盖了编写 Python 代码的一般性概念。我建议先从这本书开始,然后再继续阅读本文后面推荐的书籍中介绍的数据科学 Python包。
本书假设读者没有任何编程知识,介绍了 Python 语言和基本的一般编程原则。每一章都包含一个补充的 YouTube 视频,有助于进一步解释所涵盖的概念。
本书的作者还提供了一套实践教程,其中包含超过 15 个实用的 Python 项目,可以让你在实际操作中运用学到的知识。
2. Practical Statistics for Data Science
(数据科学家的实用统计知识)
作者:Peter Bruce & Andrew Bruce
点击此处免费阅读:
https://github.com/ghoshark/E_Books/blob/master/Practical%20Statistics%20for%20Data%20Scientists.pdf
这是迄今为止我发现的最好的书籍之一,可以向初学者介绍数据科学中最重要的统计概念。本书涵盖了各种主题,包括数据采样、分布、统计实验和机器学习。
所有概念都以适合初学者的术语进行解释,包括使用 R 和 Python 混合的实际代码示例。我们的读书会也有讲过这本书,欢迎加入会员观看相应视频和资料:
3. Pandas: Powerful Python Data Analysis Toolkit
(Pandas:强大的 Python 数据分析工具包)
作者:Wes McKinney 以及 Pandas 开发团队
点击此处免费阅读:
https://pandas.pydata.org/docs/pandas.pdf
这本书被称为 Pandas 的 Python 包是数据科学中探索、转换、清理和处理数据的首选工具。本书是这个d工具的完整用户指南。
本书涵盖所有内容,包括安装、基本操作、绘图和数据分析。本书假设读者具备 Python 基本知识,因此首先了解Learn Python the Right Way中的概念非常重要,但对于初学者以及进阶的学习者来说,本书可以说是绝佳的参考指南。
4. Hands-on Machine Learning with Scikit-learn, Keras and Tensorflow
(使用 Scikit-learn、Keras 和 Tensorflow 进行机器学习)
作者:Aurelien Geron
在这里免费阅读:
本书详细通过介绍一些人气很高的 Python 机器学习包,包括Scikit-learn、Keras 和 Tensorflow ,对机器学习进行了详细的实践介绍。
本书很好地介绍了机器学习的重要理论概念,包括机器学习系统的类型、过拟合和欠拟合,以及常见算法的工作原理。
书中很多内容都很实用,包括典型的端到端机器学习项目的完整演练。本书将为该领域的初学者提供完整的介绍。
5. Python Data Science Handbook
(Python 数据科学手册)
作者:Jake Vanderplus
点击此处免费阅读:
https://jakevdp.github.io/PythonDataScienceHandbook/
这本书是对 Python 数据科学工具包的概括性介绍。本书介绍了 NumPy 库,包括数组、数组计算和 Python 中的数据类型等概念。
本书还很好地介绍了通过 Pandas 进行数据分,以及荣夫妇哦 Scikit-learn 进行机器学习,对初学者来说非常友好。
6. Deep Learning for Coders with Fastai and Pytorch: AI Applications Without a PHD
(用 Fastai 和 Pytorch 的深度学习:不需要PHD的 AI 应用)
作者:Jeremy Howard and Sylvain Gugger
点击此处免费阅读:
https://github.com/fastai/fastbook
本书是深度学习的实用入门教程,其目标读者为编程人员,因此在深入阅读本书之前,了解 Python 编程相关知识是必不可少的。但是,本书并没有假设读者对数学和统计学有深度的了解,而是可以对深度学习背后的理论进行了出色但简单的解释。
本书是学习深度学习的理想入门书籍,可以帮你开发人生中的第一个深度学习模型。
互联网上有大量免费或低成本的学习资源,包括免费课程、大学讲座、教程、视频、博客文章和书籍。在本文中,我提供了六本免费阅读书籍的链接,仅这些书籍就可以为初学者打好数据科学领域的优秀知识基础。
感谢您的阅读!你还可以订阅我们的YouTube频道,观看大量数据科学相关公开课:https://www.youtube.com/channel/UCa8NLpvi70mHVsW4J_x9OeQ;在LinkedIn上关注我们,扩展你的人际网络!https://www.linkedin.com/company/dataapplab/
原文作者:Stephen Miracle
翻译作者:Lia
美工编辑:过儿
校对审稿:Jiawei Tong
原文链接:https://levelup.gitconnected.com/the-2-types-of-software-engineers-every-successful-product-team-needs-11952e937def