Blog

Jun
18

亚裔惨不惨,让数据告诉你

近日,高盛研究部回顾了塑造亚裔美国人在美国的经历的主要经济趋势、在职场晋升和担任高层领导职位方面面临的障碍,以及他们对创新和 GDP 增长的贡献。那么亚裔美国人的经济增长趋势如何?他们面临着什么样的现状和挑战?

By Zhang Bonnie | Blog
DETAIL
Jun
16

如何衡量数据质量

为什么要衡量数据质量?“不能衡量的东西,就不能改进”,老话是这么说的。我觉得不是这样的,过分沉迷于参数很可能会把你引入歧途。然而,有充分的理由来衡量数据关键指标。1.因为有些数据真的很重要;2.因为衡量数据质量有助于为数据团队设置高标准。

By Zhang Bonnie | Blog
DETAIL
Jun
16

电子商务趋势报告:2022 年行业状况

从早期开始,电子商务一直是增长最快的行业之一。在过去的两年里,电子商务经历了迄今为止最大的转变,但远未结束。本文概括了电子商务领域一年来发生的事情,以及预计在 2022 年发生的事情。

By Zhang Bonnie | Blog
DETAIL
Jun
11

如何明确和解决模糊的数据科学问题?

许多公司拥有大型数据存储库,但不知道如何处理这些数据,对于公司来说,他们可以雇佣一些可以在数据中发现价值的专家——数据科学家。一个优秀的数据科学家能够在不确定的领域中轻松地工作,并能够明确和解决为公司带来价值的问题。尽管我认为最好通过经验来学习这些技能,但为了让你开始学习,我将在本文分享一些对明确和解决模糊的数据科学问题很有用的策略。

By Zhang Bonnie | Blog
DETAIL
Jun
09

一篇文章带你了解探索性数据分析

探索性数据分析 (Exploratory Data Analysis – EDA) 会应用一组用于探索、描述和总结数据性质的统计技术,确保分析的客观性和互操作性。可以帮我们识别可能犯的错误,找到异常值的存在,检查变量之间的关系(相关性)及可能的数据冗余,并通过图形和重点摘要对数据进行描述性分析。在本文中,我们将通过对 QS 世界大学排名(2017-22)数据集的分析,向你介绍 EDA 的过程。

By Zhang Bonnie | Blog
DETAIL
Jun
07

强大的 Python Matplotlib 函数——创建漂亮的数据可视化

Matplotlib 是一个很优秀的 Python 包,被我们用于数据的可视化,Matplotlib 几乎可以制作任何类型的数据可视化图表。本文中,我将向您展示如何使用最重要的几个matplotlib 函数,你可以按照自己的需求进行任何类型的数据可视化。本文将用一个线型图(line plot)为例,逐步介绍一些可以用在图表中的重要的matplotlib 函数。

By Zhang Bonnie | Blog
DETAIL
Jun
07

Retail Analysis的力量——商业分析在零售业的应用

本文话题:数据分析在零售业的应用。主要有以下几方面内容:什么是零售业的数据分析?零售业数据分析会用到哪些具体的技术?零售业数据分析可以帮助企业解决什么样的问题?零售业数据分析的具体应用有哪些?

By Zhang Bonnie | Blog
DETAIL
Jun
04

8 种数据挖掘技术,让你成为更好的数据分析师

数据挖掘是从大量数据集中提取有价值信息的过程,它被用于发现数据中的趋势和模式,并对未来做出预测。可以使用许多不同的数据挖掘技术,每种技术都有自己的优缺点。我们将在本文中讨论的八种数据挖掘技术是:1. 异常检测(Anomaly detection)、2. 聚类分析(Clustering Analysis)、3. 分类分析(Classification Analysis)、4. 回归分析(Regression Analysis)、5. 选择建模(Choice Modeling)、6. 规则归纳(Rules Induction)、7. 神经网络(Neural networks)、8. 关联学习(Association learning)

By Zhang Bonnie | Blog
DETAIL