数据

Jan
11

如何巧用数据可视化,讲好一个故事?

一个故事,首先是要能够引起听众或者读者的兴趣。我们举个例子, 我们可以用两种方法来讲述不同性别的司机最常见的开车分心的原因。

第一种方式是给你一些统计数据:

6%的男性司机认为发短信会导致分心,相比之下,只有4.2%的女性司机这样认为。

9.8%的男性司机认为车中有儿童会导致开车分心汽车里,而女性司机中则有26.3%。

By romanluo | Blog
DETAIL
Nov
16

一路披荆斩棘,我是如何成功拿到四大Data Scientist offer的?

今天
数据应用学院学员Stella想跟大家分享她的求职心得
希望能够帮助到正在找工作的小伙伴们

By romanluo | Blog
DETAIL
Nov
13

从0开始:神经网络分类器

我们的目标只是提供一个从头开始编写的隐藏层完全连接的神经网络分类器(没有深度学习库),以帮助消除神经网络中神秘的黑匣子感觉。
所提供的神经网络对描述属于三类小麦的内核的几何属性的数据集进行分类(你可以轻松地将其替换为你自己的自定义数据集)。假设一个L2丢失函数(lossfunction),并且在隐藏和输出层中的每个节点上使用S形传递函数(sigmoidtransfer function)。权重更新方法使用具有L2范数的梯度下降(gradient descent)的增量规则(deltarule)。

By romanluo | Blog
DETAIL
Nov
11

没时间读?那就听听——Podcasts 轻松学习大数据

人工智能,数据科学,机器学习和机器人
是当今科技时代中最受欢迎的话题
下面的播客节目你可不能错过

By romanluo | Blog
DETAIL
Oct
26

100000个故事中的性别与动词分析:有一些很有意思的发现

受到我的同事 Julia Silge’s 最近一篇博客(what verbs tend to occur after “he” or “she” in several novels)的启发,我想用这个包含了100000个故事的数据及来分析性别和动词的关系。

我在之前的文章里探索过的Mark Riedl’s Wikipedia plots dataset很适合用来研究这个问题。这个数据集包好100000个关于电影、小说、电视剧和电视游戏的剧情。这些故事横跨几个世纪,由成百上千作者创作。但剧情介绍是由当代的观众撰写的,这意味着我们可以对这些千奇百怪的艺术形式进行统一的角色性别鉴定。由于这个数据集包含的是剧情介绍而不是原始的小说之类的,所以文本内容更多是“发生”了什么事,很少会出现某个角色“认为”或者“说”之类的表述。

By romanluo | Blog
DETAIL
Oct
26

抛弃幻想,谈谈现实中的数据科学家

Big data is like teenage sex: everyone talks about it, nobody really knows how to do it, everyone thinks everyone else is doing it, so everyone claims they are doing it — Dan Ariely

By romanluo | Blog
DETAIL
Oct
19

神奇动物在哪里:数据科学家和数据工程师大揭秘!

人们对于大数据和AI究竟是什么总是含糊不清并有很多困惑,“数据黑箱子”的技术性让那些分析巨大数据集的人变成了某种神秘人物。这些有着技术和意愿去分析数字并据此提供见解的人通常就被叫做:数据科学家。

By romanluo | Blog
DETAIL
Aug
22

化数据为音乐,倾听中子星的声音……

从股票走势到气温波动,随时间而变化的数据常以图表形式展现在我们面前。相比于平淡的二维图表,我们是否能让人们用听觉感受股价的骤跌,或全球气温呢?一种将平面数据转换成柔和的声波的技术——超声处理——实现了这个想法。

By KellyZzz | Blog
DETAIL