20个常用函数——用Excel做数据分析
Microsoft Excel是一个简单而强大的数据分析工具。Excel是各行业普遍使用的软件应用程序,可以被用于生成报告和业务见解。它是一款一体化数据管理软件,可以轻松导入、探索、清理、分析和可视化数据。目前,Excel包含了450多个函数,每年还在不断增加更多的函数。本文中,我们将介绍一系列数据分析中常用的函数。
数据分析领域的10位杰出女性
你想了解一下数据科学领域的女性吗?以下是10位影响了数据行业的女性。她们有的是首席执行官、有的是研究人员、有的是博客作者。有很多人说,科技行业缺乏女性;但事实上,数据分析领域中有很多女性,其中不少人为行业带来了深刻影响。在本篇文章中,我们将带你了解10位从事数据科学的杰出女性。
你必须知道的数据科学的可视化技术
在应用统计和机器学习中,数据可视化(Data Visualization)可以说是最重要的技能之一。数据可视化是通过使用常见图形来表示数据的一种方式。它提供了一套重要的工具,以易于理解的方式识别对性质的理解、关系和数据驱动的洞察力,并且是业务分析的重要方面。在这篇文章中,我们将讨论一系列数据可视化图表。
数据科学必备技能:一小时学会Random Forest随机森林
随机森林(Random Forest)是一种由决策树算法构建的监督机器学习算法,被数据科学家们用来解决回归和分类问题。 随机森林利用集成学习,结合了许多分类器,为复杂的问题提供解决方案。现在,随机森林算法已被应用于银行和电子商务等各个行业,用来预测行为和结果。本文将向你介绍随机森林的基本原理和一些应用。
Standardization vs Normalization——数据人老说的“标准化”与“归一化”是什么?
我们数据中的输入特征可以有不同的测量单位。特征缩放(Feature scaling)通过将所有数据拟合到特定比例来解决分布不均的问题,这就是为什么它通常是特征工程中的必要组件的原因。而两种最常见的特征缩放方法,就是标准化(standardization)和归一化(normalization)。在本文中,我们将探索这两种方法的原理。
五个数据科学项目,让你的简历更出色
如果你想以初学者的身份进入数据行业,你需要证明你拥有必备的技能,如果你没有任何正式工作经验,最好的方法就是做新的数据科学项目。简历中的项目经验是简历中最重要的部分,它们 能证明你具有这方面的潜力,可以让雇主相信你能胜任这份工作。本文将介绍五个为我带来了灵感的项目。
广告行业(Advertising)都有哪些数据科学应用?
通过持续地评估绩效vs.成本、感觉vs.年龄性别、转化率vs.媒体类型等指标,广告机构可以决定如何动态分配活动资源,从而满足客户的目标。数据科学家们设计数据分析解决方案,能够从不断变化的数据中提取并提供有意义的见解。这些见解是为了支持活动生命周期中的关键业务决策,让客户了解他们目前活动的各种关键统计数据。
用 K-Means聚类算法(K-Means Clustering)分析客户
聚类是根据数据中的模式将整个数据分成组(也称为集群)的过程。在本文中,我将演示如何使用 K-Means 聚类算法,根据商城数据集(数据链接)中的收入和支出得分对客户进行细分的。通过了解更多用户,团队将更好地了解如何根据客户行为创建营销活动、促销、特别优惠等等。