data analysis

Mar
27

区块链将如何影响我们的未来?三大趋势为你解谜!

从旁观者的角度来看,blockchain区块链有可能是个能够为罪犯们带来好处的科技。而且,将货币分散及匿名化的想法听起来有点可怕。 所以我们自问: 这个新的科技将会如何改变世界呢? 三大趋势为你解谜:供应链管理;点对点交易;数据安全。

DETAIL
Mar
27

如何扩充你的数据科学工具包?这里有24款免费的数据科学工具!

数据分析工具是数据科学领域的重要组成部分。开源社区多年来一直致力于开发数据科学工具从而为该领域做出重要贡献。事实上,很多大企业已经开始开发开源解决方案从而他们可以留住用户,同时开源数据科学工具也已经成为数据科学领域的主导地位。 因为从数据挖掘到编程语言有各种各样的开源工具可供使用,因此我们将数据科学家可以添加到他们的数据科学工具包中的技术汇总在一起供大家参考。

DETAIL
Jan
11

如何巧用数据可视化,讲好一个故事?

一个故事,首先是要能够引起听众或者读者的兴趣。我们举个例子, 我们可以用两种方法来讲述不同性别的司机最常见的开车分心的原因。

第一种方式是给你一些统计数据:

6%的男性司机认为发短信会导致分心,相比之下,只有4.2%的女性司机这样认为。

9.8%的男性司机认为车中有儿童会导致开车分心汽车里,而女性司机中则有26.3%。

By romanluo | Blog
DETAIL
Jan
11

让Kaggle比赛第二名获奖者告诉你:买下一个冰淇淋的最佳时间是什么时候?

我们最近的Instacart购物车分析比赛中,向Kagglers提出了一个挑战,来预测一个Instacart消费者会再次购买哪些商品并在何时购买。 想象一下,如果,当你用完牛奶时,Instacart已经准备好将牛奶加入你的购物车,或者Instacart已经知道现在是时候再次购买你喜欢的冰激凌了。

By romanluo | Blog
DETAIL
Dec
21

python的线性优化——你需要知道的有哪些?

大数据科学通常通过过数据的预测、规律与表现(通常没有约束的概念)的方式来呈现,但是对做商业情况中的决策是远远不够的。大数据科学的输出或呈现效果必须能够被商业决策所吸收并利用,同时,在商业情况下的优化模型需要有商业条件的约束。
例如在分析超市产业链案例的情况下 – 你的大数据处理过程需要来预测未来的销售数据。你将需要使用初始数据来建立一个优化库存与销售策略的模型。

By romanluo | Blog
DETAIL
Nov
13

【编程&数据处理】pandas 1 | 入门,SO EASY!!!

这些天,我看到了一篇妖艳贱货文“10 Minutes to Pandas (10分钟搞定pandas)”。

我的内心os是:开什么玩笑,怎么可能…

但是pandas官方文档标题就是这么写的。。。

By romanluo | Blog
DETAIL
Nov
02

那些年,我掉过的MYSQL 的那些“坑”

假如我有一个名为midterm_score的表
存放一所学校某年级所有学生的期中考试成绩,
有班级编号(class_code),学生名称(student_name)和总分(score)共3个字段。
如果我现在想对每个班级学生的总分进行排名

By romanluo | Blog
DETAIL
Nov
02

使用文本挖掘技术分析Twitter用户对电影Rangoon的评价

使用一些建模分析手段来评价电影的成功已经屡见不鲜,这类预测模型常常使用注入电影制作成本,类型,主演,出品方等结构化数据作为输入。然而,在社交媒体日益发达的现在,人们时常会在Twitter,Facebook等网站上发表自己的意见和建议。社交媒体已然是衡量电影观众情绪的潜在工具了。

By romanluo | Blog
DETAIL