数据分析

Dec
21

如何用Tensorflow object-detection API训练模型,找到圣诞老爷爷?

Christmas is coming!你是否在期待圣诞老人和他的礼物呢?你想知道哪里可以找到圣诞老人吗?本文将教会你如何通过Tensorflow object-detection API训练自己的目标检测模型(object detector),来找到圣诞老人。

By romanluo | Blog
DETAIL
Dec
21

python的线性优化——你需要知道的有哪些?

大数据科学通常通过过数据的预测、规律与表现(通常没有约束的概念)的方式来呈现,但是对做商业情况中的决策是远远不够的。大数据科学的输出或呈现效果必须能够被商业决策所吸收并利用,同时,在商业情况下的优化模型需要有商业条件的约束。
例如在分析超市产业链案例的情况下 – 你的大数据处理过程需要来预测未来的销售数据。你将需要使用初始数据来建立一个优化库存与销售策略的模型。

By romanluo | Blog
DETAIL
Nov
13

【编程&数据处理】pandas 1 | 入门,SO EASY!!!

这些天,我看到了一篇妖艳贱货文“10 Minutes to Pandas (10分钟搞定pandas)”。

我的内心os是:开什么玩笑,怎么可能…

但是pandas官方文档标题就是这么写的。。。

By romanluo | Blog
DETAIL
Nov
11

【商业分析师专栏】Business Analyst面试必须准备的63个问题

BA的面试一般分成behavioral和technical interview两种。有一些公司有时不会设置technical interview。下面我们来看看命中率百分之90的面试问题!

By romanluo | Blog
DETAIL
Nov
02

那些年,我掉过的MYSQL 的那些“坑”

假如我有一个名为midterm_score的表
存放一所学校某年级所有学生的期中考试成绩,
有班级编号(class_code),学生名称(student_name)和总分(score)共3个字段。
如果我现在想对每个班级学生的总分进行排名

By romanluo | Blog
DETAIL
Oct
26

100000个故事中的性别与动词分析:有一些很有意思的发现

受到我的同事 Julia Silge’s 最近一篇博客(what verbs tend to occur after “he” or “she” in several novels)的启发,我想用这个包含了100000个故事的数据及来分析性别和动词的关系。

我在之前的文章里探索过的Mark Riedl’s Wikipedia plots dataset很适合用来研究这个问题。这个数据集包好100000个关于电影、小说、电视剧和电视游戏的剧情。这些故事横跨几个世纪,由成百上千作者创作。但剧情介绍是由当代的观众撰写的,这意味着我们可以对这些千奇百怪的艺术形式进行统一的角色性别鉴定。由于这个数据集包含的是剧情介绍而不是原始的小说之类的,所以文本内容更多是“发生”了什么事,很少会出现某个角色“认为”或者“说”之类的表述。

By romanluo | Blog
DETAIL
Oct
26

抛弃幻想,谈谈现实中的数据科学家

Big data is like teenage sex: everyone talks about it, nobody really knows how to do it, everyone thinks everyone else is doing it, so everyone claims they are doing it — Dan Ariely

By romanluo | Blog
DETAIL
Oct
19

神奇动物在哪里:数据科学家和数据工程师大揭秘!

人们对于大数据和AI究竟是什么总是含糊不清并有很多困惑,“数据黑箱子”的技术性让那些分析巨大数据集的人变成了某种神秘人物。这些有着技术和意愿去分析数字并据此提供见解的人通常就被叫做:数据科学家。

By romanluo | Blog
DETAIL