这10本改变数据生涯的书,你看了么?

这10本改变数据生涯的书,你看了么?

你喜欢免费书籍嘛?

不管你喜不喜欢,反正我喜欢。由于之前出过两期必读书目的文章,受到了观众激烈的反响,于是决定顺应市场需求,又来喂一波精神食粮。 这波粮食呢,一部分是关于初级机器学习,深度学习介绍,Python语言,数据可视化入门,一部分是关于人们对机器感兴趣的一些话题,例如特征工程,模型可解释性等。

没啥需要多说的,直接开喂!

我们一直写一本关于机器学习里数学方面的书,来激励人们了解数学概念。我们并不想让这本书覆盖很多高级的机器学习技术,因为已经有太多深奥的书这么做了。我们想授人以渔而非直接授人以鱼。我们传授了机器学习里必要的数学知识,以促进读者能接下来阅读其他的书籍。

这本书简直就是机器学习的维基百科,里面包含了所有机器学习领域你需要知道的知识点。包括了:监督学习和无监督学习(Supervised and unsupervised learning), 支持向量机(support vector machines), 神经网络(neural networks), 集成学习(ensemble methods), 梯度下降(gradient descent), 聚类和降维(cluster analysis and dimensionality reduction), 自编码器和迁移学习(autoencoders and transfer learning), 特征工程和超参调优(feature engineering and hyperparameter tuning)!

我们想创造一个资源,这个资源可以

(1)任何人都能免费使用

(2)为那些最终想成为应用机器学习科学家的人提供一个好的开头

(3)里面包含了能够运行的代码,直观展示给读者在实际情况下如何解决问题

(4)里面的内容能够被我们和社区里志同道合的朋友快速更新

(5)同时还有论坛,大家能够在里面交互式讨论技术和答疑解惑。

这本书的目标是为重新表示预测器(re-representing predictors) 提供一些工具,将这些工具放在良好的预测建模框架中,并将我们在实践中使用这些工具的经验传达给读者。最后,我们希望这些工具和我们的经验能够帮助读者生成更好的模型。

所有的解释方法在这本书里都被解剖分析和讨论。这些方法到底是怎么工作的?他们的优劣势是什么?他们的输入如何解释?这本书能够让你应用最稳定的解释方法到你的机器学习项目里。

这本书侧重于表格数据(关系型或结构型数据),较少关注计算机视觉和自然语言处理问题。这本书非常适合机器学习实践者,数据科学家,统计学家,和任何对机器学习模型的可解释性感兴趣的人。

这是一本用Python语言来做项目的免费书籍。这是为初级读者量身定做的Python语言指南。如果你对电脑的全部认知只有何如存储文本文件,但你又想学Python,那么目前你需要的就是这本书了。

在BBC数据团队里,我们开发了R 软件包和R 食谱,通过使用R的ggplot2库创建内部风格的来对外发布图形,这个过程是一个可复制的过程,同时也使新用户更容易创建图形。

这本书对于任何想要做图形的人来说都是非常有用的。

拿到数据后,你该做的就是好好看看你的数据。图形和表格能够让给你探索和了解你获得的信息结构。好的数据可视化同样能够让你的思想和发现更容易与他人交流。除此之外,根据你的数据生产有效的图表是培养良好的阅读和理解图表的能力的最好方法——不管是在研究文章、商业幻灯片、公共政策倡导还是媒体报道中,他人制作的图表都有好坏之分。

强化学习的目的是开发高效的学习算法,并了解算法的优缺点。这本书之所以有趣,是因为它有大量的实际应用,可以用于解决从人工智能到运筹学或控制工程的各种问题。在这本书中,我们关注那些建立在强大的动态规划理论基础上的强化学习算法。我们给出了一个相当全面的学习问题目录,里面描述了核心思想,注释了大量的最先进的算法,然后讨论了它们的理论性质和局限性。

这本书的目的是考虑大型和具有挑战的多级决策问题,这些问题在原则上能被动态规划和最优控制给解决,但他们的精确解在计算上是很难算出来的。我们讨论了依赖于近似解来产生同样具有足够性能的次优策略的解决方法。这些方法统称为强化学习,同样也有昵称,如近似动态规划和神经动态规划。

原文作者:Matthew Mayo

翻译作者:Zixin

美工编辑:过儿

校对审稿:卡里

原文链接:https://www.kdnuggets.com/2019/03/another-10-free-must-read-books-for-machine-learning-and-data-science.html