初级与高级数据科学家有什么区别?
正如标题所暗示的那样,初级和高级数据科学家之间存在很多明显的差异,但还有哪些鲜为人知的差异呢?在本文中,我们将讨论这些差异以及一些高级数据科学家可能会代替初级数据科学家履行的关键职责或流程。
数据建模——核心概念
数据建模指的是对现实世界各类数据的抽象组织,确定数据库需管辖的范围、数据的组织形式等直至转化成现实的数据库。数据建模的主要目标是以最有效的方式存储和检索数据。在本文中,我将介绍联机事务处理OLTP(on-line transaction processing)和联机分析处理OLAP(On-Line Analytical Processing)应用的数据库设计和数据建模的基本概念。
亚裔惨不惨,让数据告诉你
近日,高盛研究部回顾了塑造亚裔美国人在美国的经历的主要经济趋势、在职场晋升和担任高层领导职位方面面临的障碍,以及他们对创新和 GDP 增长的贡献。那么亚裔美国人的经济增长趋势如何?他们面临着什么样的现状和挑战?
电子商务趋势报告:2022 年行业状况
从早期开始,电子商务一直是增长最快的行业之一。在过去的两年里,电子商务经历了迄今为止最大的转变,但远未结束。本文概括了电子商务领域一年来发生的事情,以及预计在 2022 年发生的事情。
如何明确和解决模糊的数据科学问题?
许多公司拥有大型数据存储库,但不知道如何处理这些数据,对于公司来说,他们可以雇佣一些可以在数据中发现价值的专家——数据科学家。一个优秀的数据科学家能够在不确定的领域中轻松地工作,并能够明确和解决为公司带来价值的问题。尽管我认为最好通过经验来学习这些技能,但为了让你开始学习,我将在本文分享一些对明确和解决模糊的数据科学问题很有用的策略。
一篇文章带你了解探索性数据分析
探索性数据分析 (Exploratory Data Analysis – EDA) 会应用一组用于探索、描述和总结数据性质的统计技术,确保分析的客观性和互操作性。可以帮我们识别可能犯的错误,找到异常值的存在,检查变量之间的关系(相关性)及可能的数据冗余,并通过图形和重点摘要对数据进行描述性分析。在本文中,我们将通过对 QS 世界大学排名(2017-22)数据集的分析,向你介绍 EDA 的过程。
强大的 Python Matplotlib 函数——创建漂亮的数据可视化
Matplotlib 是一个很优秀的 Python 包,被我们用于数据的可视化,Matplotlib 几乎可以制作任何类型的数据可视化图表。本文中,我将向您展示如何使用最重要的几个matplotlib 函数,你可以按照自己的需求进行任何类型的数据可视化。本文将用一个线型图(line plot)为例,逐步介绍一些可以用在图表中的重要的matplotlib 函数。