Blog

Apr
12

FB, Uber, Airbnb等数据岗面试分析集锦

数据科学的世界拥有巨大的潜力,大多数公司希望利用他们的数据产生的洞察力来助于他们在21世纪的经济前沿进行竞争。 通过我们的分析,我们希望你能够将这些知识转化为可操作性的行动,打造你的数据科学职业生涯,并打破加入顶级数据科学团队的壁垒!

By Ying Niu | Blog
DETAIL
Apr
12

切勿局限你的视野:闷声发大财的精准农业

农业将在接下来的几十年中占有毋庸置疑的重要地位。美国的孟山都,中国的佳格数据,都是这方面的行业领头羊。求职的各位亲,大可不必把自己的目标定死在硅谷Google,Facebook。打开你的视野,更有一片天地。

By Ying Niu | Blog
DETAIL
Apr
10

如何应对PIP之: 目的和基本方法(附举报模版)

法制社会,一切以法治为基础, 以法律为准绳。本文所介绍应对pip的方法绝对的合理合法。因为pip涉及潜在的非法行为,要fight,必须保证我们自己不触及法律底线。请放心使用。

By Ying Niu | Blog
DETAIL
Apr
07

如何使用Python处理丢失的数据来进行机器学习

现实世界的数据中常常包含丢失的数据。原因很多,比如观察结果没有记录,或数据损坏。

处理丢失的数据很重要,因为许多机器学习算法不支持具有丢失值的数据库。

本教程将讨论如何使用Python处理丢失的数据来进行机器学习。

By guoguoguo22 | Blog
DETAIL
Apr
07

领英知识图谱(LinkedIn Knowledge Graph)提升数据价值

这是一篇关于领英知识图谱(LinkedIn Knowledge Graph)如何利用大数据和机器学习技术来为会员带来价值的非技术类文章,应insideBigData的邀请,由我和我的同事Bee-Chung Chen共同完成

By guoguoguo22 | Blog
DETAIL

纽约,旧金山,伦敦和班加罗尔的码农比较分析

当我告诉某人Stack Overflow在纽约市,他们常常感到惊讶:许多人认为它在旧金山。 (我甚至在求职信中看到了“我在纽约,但愿意搬到旧金山”的工作申请。)旧金山是一个符合常识的猜测,美国科技公司可能位于那里:它在心脏的硅谷,靠近技术巨头如苹果,谷歌和Facebook的总部。但纽约也有一个丰富的创业生态系统,这是一个与旧金山非常不同的世界,开发人员使用不同的语言和技术。

By Ying Niu | Blog
DETAIL
Mar
31

从洛杉矶到府南河:1.洛杉矶雾霾斗争史

环境问题在各个国家都是一个很复杂的问题。环境问题本身既需要科学上的解释,又需要在社会分工与协调中寻找矛盾的本源。而解决环境问题除了需要科技的进步,往往更需要在政治与经济利益的取舍。所以非常困难。

By Ying Niu | Blog
DETAIL
Mar
30

XGBoost VS LightGBM

武林至尊,宝刀屠龙,号令天下,莫敢不从!倚天不出,谁与争锋?想要在Kaggle这样一个拥有来自全世界超过5万数据科学家参与的数据科学竞赛拔得头筹,什么工具才能称作是屠龙刀和倚天剑呢?在当今的数据科学江湖中,XGBoost作为多个Kaggle冠军的首选工具,当之无愧拥有屠龙刀的称号。而开源刚2个月的LightGBM以其轻快敏捷而著称,成为了Kaggle冠军手中的倚天剑。接下来,笔者就以Kaggle的Allstate Claims Severity竞赛来跟大家分享一下这两个工具的使用经验。

By Ying Niu | Blog
DETAIL