Blog

May
24

治疗癌症的有效解药--基因数据

加强医疗卫生方面的数字基础建设,通过大量基因数据的支持和分析预测,越来越多的患者会受到更加人性化的检查和治疗,癌症不再那么可怕,也将有可治愈的一天。

By ivankahu | Blog
DETAIL
May
24

使用TensorFlow分类手写数字

回到2013年,我写了一篇关于使用Python进行数字识别的帖子。 从那时起,Python数据生态系统发生了很大变化。 Google给了我们Tensorflow,scikit-learn已经成熟,“AI”现在是最新的热潮。
所以我认定是时候把精力放到手写识别这个领域。 它仍然是一个非常简单,但迷人的概念:收集某人的手写素材,并试图预测这个人写的东西。 好消息是,在过去几年我们已经学习并掌握了几个新的技巧,我会在这里与大家分享一些。

By ivankahu | Blog
DETAIL
May
24

数据科学的新生代工具(附实操代码)

自从“数据科学”进入人们视野以来, 它一直被用来形容处理那些一台电脑装不下的大数据。所以,处理大数据的能力被认为是数据科学概念的核心。虽然Mapreduce依然是基础工具,但很多新涌现的有趣工具已经超越了它的基本功能。比如说,Mantel-Haenszel 计量就无法在基本的Mapreduce中运行。Spark和Google Cloud Dataflow正是下一代数据处理体系的代表。本文将结合笔者的第一手经验和调研对两者进行比较。

By ivankahu | Blog
DETAIL
May
24

数据科学家自曝工资单!

现在有很多数据科学家跨行业跨公司的横向薪水调查,但是很少有分析展示出数据科学家的职业发展中,薪水随时间的变化。下面这位数据科学家自述了自己25年的薪水发展变化,以及职业发展道路,为我们提供了非常有价值的信息!

By ivankahu | Blog
DETAIL
May
24

框架为数据科学家带来哪些编程语言所不能带来的优势

过去,计算机编程的关键就是用对语言。不论是C,Lisp,还是Pascal,程序员们都有着自己的专长和编程格式。然而, 随着计算能力的增加,编程语言之间大大缩减,从而允许系统理解所有计算机语言并可以在其中轻易转换。如今,人们关注的是框架(Framework)这个更现代,更具有前瞻性的概念。框架可以克服很多编程语言中过时的做法

By ivankahu | Blog
DETAIL
May
24

MOOC时代,如何根据自己的情况选择适合自己的网课?

大规模开放在线课程(Massive Open Online Course, MOOC)作为一种新型的学习平台,自推出以来,因为其不受地域和时间限制,价格低廉甚至免费,在世界各个角落都能享受来自包括哈佛、MIT等著名学府的教授带来的高质量课程, 而受到广泛的欢迎。但是,这么多琳琅满目的MOOC平台,如何选择最适合自己的网课呢?本文将比较几个主要MOOC平台的优缺点以及给大家推荐一些跟数据分析相关的网课。

By ivankahu | Blog
DETAIL
May
24

若想修炼成数据科学家,最重要的技能居然是…?

若想修炼成数据科学家,最重要的技能是什么呢?

By ivankahu | Blog
DETAIL
May
16

如何建立数据科学和数据工程团队?

数据科学和数据工程团队该如何建立?比如,是否有与数据科学配对的“数据工程”团队这个概念?还是数据科学家和数据工程师都属于“纵向”产品团队?数据科学与工程团队如何互动?数据科学的工作如何与数据工程协调?数据科学家与工程师之间的责任分工如何?有没有混合角色的概念?

By ivankahu | Blog
DETAIL