数据分析

Apr
09

通过案例数据集,带你了解Python数据分析和数据可视化

由于“数据消费者(data consumers)”接受信息的方式,使用图表或图形来显示大量复杂数据,往往比电子表格或报告更简单,这也是数据可视化的魅力之一。想要了解一组数据的特征,我们需要选择数据量、数据中的变量总数等基本方面来总结数据;同时也要识别数据问题,例如缺失值、不一致和异常值等等。本文将向你展示如何用“房价数据集”进行一些简单的数据可视化.

By Zhang Bonnie | Blog
DETAIL
Apr
07

2022年数据工程就业市场:对1000个FAANG职位信息进行分析

2022年数据工程师(Data Engineer)需要哪些技能?为了回答这个问题,本文分析了在LinkedIn上收集的Meta、亚马逊(Amazon)、苹果(Apple)、Netflix和谷歌15加顶尖科技公司的数据工程师职位信息,探索最受欢迎的技能和技术;通过可视化的方法,向你展示这些技能需求的分布和受欢迎程度,帮你求职数据工程师确定方向。

By Zhang Bonnie | Blog
DETAIL
Apr
05

数据泄露Data Leakage是什么?你为什么要注意?

在执行机器学习任务时,维护数据的干净卫生是至关重要的。然而,尽管现在大家对这个主题都进行了充分的探讨,但对数据卫生的巨大威胁却缺乏认识,比如数据泄漏—Data Leakage。在本文中,我们将探讨什么是数据泄漏,通过介绍一个数据泄露案例,带你了解它是如何发生的,以及应该如何防止。

By Zhang Bonnie | Blog
DETAIL
Apr
03

10个Python函数,帮你解决70%的数据分析问题

如果你想成为一名数据科学家,那你要做的第一步就是培养你的数据处理技能,因为几乎每个数据科学项目都需要这个技能。你需要首先读取数据,并将其转换为表单,然后你就可以通过数据回答问题了。而Python编程语言就有针对数据操作和数据分析工作的 Pandas 库。在这篇文章中,我将概述每一个数据科学家都应该知道的10个python(pandas)操作。

By Zhang Bonnie | Blog
DETAIL
Mar
29

手把手教你用Python创建SQL数据库!

会写SQL很重要,能高效地查询数据库被认为是数据分析师/科学家最基本的技能之一。但如何在没有数据库的情况下练习数据库查询呢?在今天的文章中,让我们一起来解决这个基本问题,学习如何从零开始创建自己的MySQL数据库。在Python和一些外部库的帮助下,我们创建一个脚本来自动创建并使用随机生成的数据,填充我们的表格。

By Zhang Bonnie | Blog
DETAIL
Mar
24

冬奥会你看了么?体育界的数据分析应用

数据分析对各行各业的影响正在逐渐深入,新的技术可能会对体育行业产生帮助。比如在一个球队中,教练要怎样找到最有潜力的运动员,需要怎样补充人员来维持球队实力的平衡?通过分析球队最近的表现和趋势,来做出更好的决策,这些都可以根据数据来做一个评判。本文中,我们一起来讨论一下数据分析在体育界的应用。

By Zhang Bonnie | Blog
DETAIL
Mar
15

六条鲜为人知的SQL技巧,帮你每月省下100小时!

SQL(结构化查询语言 ) 已经存在了几十年。它是一种用于管理关系数据库中保存的数据的编程语言。大多数大公司都在世界各地使用 SQL。数据分析师可以使用 SQL 访问、读取、操作和分析存储在数据库中的数据,并生成有用的见解,推动明智的决策制定过程。在本文中,我将分享六个我经常使用的SQL技巧。

By Zhang Bonnie | Blog
DETAIL
Mar
14

如何做社交媒体中的情绪分析(Sentiment Analysis)

情绪分析(Sentiment Analysis)是机器学习模型的代表之一,能帮我们理解文本数据的语调,包括正面、负面或中立的语气。捕捉文中的情绪可以帮助公司更好地了解用户的心声 (VOC),甚至可以引导产品开发,从而改进功能。情绪分析通常基于词汇和规则,这意味着该情绪可以标记为正面、负面或中立的单词。本文将介绍基于词汇深度学习的方法。

By Zhang Bonnie | Blog
DETAIL