Blog

May
05

3年SQL经验,我总结了十条技巧

SQL 是处理数据库时最被广泛使用的编程语言,并受到各种关系数据库系统(如 MySQL、SQL Server 和 Oracle)的支持。 无论你计划做什么数据类职位,学会SQL都是最基本的要求。 因此,SQL 成为该数据科学领域需要学习的最重要的概念之一。本文将分享我经常用的十条SQL技巧,这些技巧可以适用于所有人,帮助你更好的进行数据分析。

By Zhang Bonnie | Blog
DETAIL
May
04

20个常用函数——用Excel做数据分析

Microsoft Excel是一个简单而强大的数据分析工具。Excel是各行业普遍使用的软件应用程序,可以被用于生成报告和业务见解。它是一款一体化数据管理软件,可以轻松导入、探索、清理、分析和可视化数据。目前,Excel包含了450多个函数,每年还在不断增加更多的函数。本文中,我们将介绍一系列数据分析中常用的函数。

By Zhang Bonnie | Blog
DETAIL
May
04

数据分析领域的10位杰出女性

你想了解一下数据科学领域的女性吗?以下是10位影响了数据行业的女性。她们有的是首席执行官、有的是研究人员、有的是博客作者。有很多人说,科技行业缺乏女性;但事实上,数据分析领域中有很多女性,其中不少人为行业带来了深刻影响。在本篇文章中,我们将带你了解10位从事数据科学的杰出女性。

By Zhang Bonnie | Blog
DETAIL
May
02

你必须知道的数据科学的可视化技术

在应用统计和机器学习中,数据可视化(Data Visualization)可以说是最重要的技能之一。数据可视化是通过使用常见图形来表示数据的一种方式。它提供了一套重要的工具,以易于理解的方式识别对性质的理解、关系和数据驱动的洞察力,并且是业务分析的重要方面。在这篇文章中,我们将讨论一系列数据可视化图表。

By Zhang Bonnie | Blog
DETAIL
Apr
28

数据科学必备技能:一小时学会Random Forest随机森林

随机森林(Random Forest)是一种由决策树算法构建的监督机器学习算法,被数据科学家们用来解决回归和分类问题。 随机森林利用集成学习,结合了许多分类器,为复杂的问题提供解决方案。现在,随机森林算法已被应用于银行和电子商务等各个行业,用来预测行为和结果。本文将向你介绍随机森林的基本原理和一些应用。

By Zhang Bonnie | Blog
DETAIL
Apr
28

Standardization vs Normalization——数据人老说的“标准化”与“归一化”是什么?

我们数据中的输入特征可以有不同的测量单位。特征缩放(Feature scaling)通过将所有数据拟合到特定比例来解决分布不均的问题,这就是为什么它通常是特征工程中的必要组件的原因。而两种最常见的特征缩放方法,就是标准化(standardization)和归一化(normalization)。在本文中,我们将探索这两种方法的原理。

By Zhang Bonnie | Blog
DETAIL
Apr
27

五个数据科学项目,让你的简历更出色

如果你想以初学者的身份进入数据行业,你需要证明你拥有必备的技能,如果你没有任何正式工作经验,最好的方法就是做新的数据科学项目。简历中的项目经验是简历中最重要的部分,它们 能证明你具有这方面的潜力,可以让雇主相信你能胜任这份工作。本文将介绍五个为我带来了灵感的项目。

By Zhang Bonnie | Blog
DETAIL
Apr
27

广告行业(Advertising)都有哪些数据科学应用?

通过持续地评估绩效vs.成本、感觉vs.年龄性别、转化率vs.媒体类型等指标,广告机构可以决定如何动态分配活动资源,从而满足客户的目标。数据科学家们设计数据分析解决方案,能够从不断变化的数据中提取并提供有意义的见解。这些见解是为了支持活动生命周期中的关键业务决策,让客户了解他们目前活动的各种关键统计数据。

By Zhang Bonnie | Blog
DETAIL