Blog

Oct
26

100000个故事中的性别与动词分析:有一些很有意思的发现

受到我的同事 Julia Silge’s 最近一篇博客(what verbs tend to occur after “he” or “she” in several novels)的启发,我想用这个包含了100000个故事的数据及来分析性别和动词的关系。

我在之前的文章里探索过的Mark Riedl’s Wikipedia plots dataset很适合用来研究这个问题。这个数据集包好100000个关于电影、小说、电视剧和电视游戏的剧情。这些故事横跨几个世纪,由成百上千作者创作。但剧情介绍是由当代的观众撰写的,这意味着我们可以对这些千奇百怪的艺术形式进行统一的角色性别鉴定。由于这个数据集包含的是剧情介绍而不是原始的小说之类的,所以文本内容更多是“发生”了什么事,很少会出现某个角色“认为”或者“说”之类的表述。

By romanluo | Blog
DETAIL
Oct
26

抛弃幻想,谈谈现实中的数据科学家

Big data is like teenage sex: everyone talks about it, nobody really knows how to do it, everyone thinks everyone else is doing it, so everyone claims they are doing it — Dan Ariely

By romanluo | Blog
DETAIL
Oct
26

喝过五十瓶Soylent 是一番怎么样的体验?

Soylent 是一类可以替代食物的饮品,并且号称自己是可以长期替代食物,也即只喝Soylent 也不会导致营养不良等问题。

1.5版之前都是粉状物,需要自己冲泡。现在的2.0之后已经可以单独购买瓶装,直接打开就能喝。

你是每餐都喝Soylent 吗?

By romanluo | Blog
DETAIL
Oct
19

神奇动物在哪里:数据科学家和数据工程师大揭秘!

人们对于大数据和AI究竟是什么总是含糊不清并有很多困惑,“数据黑箱子”的技术性让那些分析巨大数据集的人变成了某种神秘人物。这些有着技术和意愿去分析数字并据此提供见解的人通常就被叫做:数据科学家。

By romanluo | Blog
DETAIL
Oct
02

一份以数据为导向的选择出行航空公司的指南

经过不久前的美联航暴力驱逐乘客事件,我相信小伙伴们在出行前都会更加慎重地选择航空公司了。
到底哪些航空公司服务好值得信赖呢?今天我们用数据说话,来看看在Skytrax上前三十个最受关注的航线的评分细节。
哪一些航线是类似的呢?

我们考虑了7个细节上的评价
座椅舒适度,
机舱乘务员,
食物与饮料,
机上娱乐设备,
地勤服务,
wifi连接,
以及价格。

By KellyZzz | Blog
DETAIL
Oct
02

听说程序员和数据分析马上就要失业了?

最近在知乎上看到两个很奇怪的问题,一个说程序员过五年是不是就要失业了,怎么办;另一个说马云说「现在有人说我是学数据分析,这个人将来就没工作做了」?

这些说法有一定道理,但是不完整。

By KellyZzz | Blog
DETAIL
Oct
02

人工智能适用于所有企业么?

人工智能(AI)早已不再只是出现在科幻小说里的东西。它在很多企业业务以及我们的生活中普遍存在, 例如, 智能手机里的Siri,亚马逊的Alexa。
但是,AI真的对你的公司有意义吗?不妨考虑一下下面提到的几点再做决定。
人工智能有许多应用和描述。有些说是机器学习或机器智能,或者是涉及认知计算和深入学习。最终, IBM 估计它是一个价值2万亿美元的市场,其计算能力将用于了解数据,理由,谈话,做出决策和学习。

By KellyZzz | Blog
DETAIL
Oct
02

真的假的,170万人都是商业分析师?

许多文章都是围绕商业分析师到底是什么而展开的,
这些文字将商业分析师定义为帮助股东做决策,促进,沟通,扮演商业和IT之间桥梁,等等的那群人。但其实一个机构的任何人都可以胜任这份工作!许多其他的职业同样可以帮助股东决策,例如管理咨询师和商业指导。
然而,很少有文章介绍商业分析师和
机构组织,角色,或者职业中的其他任何人的不同之处。
在我看来,商业分析师是具有一定的能力水平,
通过引导,分析,指定,管理 需求和价值以及要求来开展商业分析的人。
如果你不能胜任通过执行这四项领域来满足商业需求,那么你就不属于一名商业分析师。

By KellyZzz | Blog
DETAIL