在开始数据科学项目之前,你要问自己这几个基本问题
通常,当我们谈论数据科学项目时,虽然都会设计收集数据、分析、和呈现结果,但很少有人能够对整个过程的进展做出可靠的定义。 在这篇文章中,我分解了一系列问题框架,包括项目目标是什么、为什么要完成该项目、以及该项目如何受益于最终客户等,带你重新理清做项目的思路。
2022年数据科学还会继续火吗?Data Scientist 的求职展望
近几年,随着人工智能的发展,数据科学相关岗位在各个行业的应用相当广泛,很多即将步入职场的求职者也开始思考在未来的十年当中,数据科学相关岗位是否还会像这几年一样受欢迎。本文将从几个方面预测分析2022年数据科学行业,包括行业的变化、值得关注的技术和工具、数据科学求职经验、以及求职展望等等。
带你了解什么是Covariance Matrix协方差矩阵
线性代数(Linear Algebra)是机器学习的基础之一,被认为是“数据中的数学知识”。虽然我个人非常喜欢线性代数中的大多数知识,但有些概念在一开始会很难掌握。然而,协方差矩阵(Covariance Matrix)改变了这种现况。协方差和相关性的概念体现了线性代数中的某些知识。接下来,我们将学习什么是协方差矩阵,如何运算协方差矩阵及其具体操作。
数据科学面试中,你需要问你的雇主这 5 个问题
数据工程是一门很深奥的技能,所以不要认为你可以独自完成这项工作。没有人能在没有数据的情况下开展机器学习。不要假设你可以访问所有你需要的数据。要了解数据管道和基础设施是否已经到位。如果公司要求你构建这些,那么你最好具备数据工程技能。本文将介绍五个你应该问雇主的问题,提前为未来的工作做好准备!
揭秘 10 大数据科学术语(面试中最常见问题)
入门数据科学可能会让人不知所措,你需要掌握的各种概念和技术,才能有效地完成工作时。 即使是“数据科学”这个词也可能有点模糊,随着该领域的普及,它似乎失去了定义。数据科学中流行着很多术语,了解这些术语很重要,因为它们经常出现在数据科学工作面试中。本文将介绍十大数据科学术语。
你如何知道你的分析是“正确的”?
如果你一直和数据打交道,那很可能有人告诉过你“这个数据看起来不太对……” 你可能以为,如果我再小心谨慎细致一些,就不会出现这些错误了。但其实,在向利益相关者展示报告之前,尽最大努力验证最终结果,对于增强信心和获得信任是非常重要的。本文将介绍几种方法,让你了解如何验证自己的数据正确与否。
只需要简单3 步!在 Azure 上构建部署微服务 NLP 模型
对于数据科学家来说,处理数据是一回事,但将机器学习模型部署到生产环境可能是另一回事。根据不同的云部署方式,这个过程可能需要几分钟到几个小时不等。更重要的是,部署方式还应该基于可扩展性和你的预算要求。 本文将展示一种直接使用 Python 代码(不是构建容器),将 NLP 模型作为微服务,然后部署到 Azure 的快速方法。
从Marplotlib到Plotly: 教你入门Python数据可视化
Matplotlib 是在 Python 中创建可视化最快且最直接的工具,但它最适合初始的探索性分析和静态绘图。而Plotly 是一个较新的开源图形库,可以高效地创建更复杂的交互式可视化。本文将逐步带领你通过 Plotly 创建带有自定义工具框(Customized Tooltips)和范围滑(Range Slider)的交互式组合图(Interactive Combo Chart)。你将学习Plotly的关键概念和特性,文章也会为您提供完整的代码。