科普 | 神经科学和分布式运算如何相互影响
当我们想起大数据时,我们往往想到互联网:几十亿的社交网络用户,上百万的移动手机的传感器,成千上万维基百科的编辑条目等等。随着科技创新的发展,海量数据也可能来自被植入大脑的相机终端。分布式计算领域取得的新进展正在改变神经科学家获取及处理数据的方式,而这个过程,同时也改变着我们对计算的看法。
科普 | HDFS和HBase: 所有你需要知道的都在这里
Hadoop文件分发系统 ( Hadoop Distributed File System (HDFS) )和Hadoop数据库(HBase)是大数据生态系统的关键组成部分。本文将使用两者最常被使用的实例来解释两者的不同
Python数据处理:关于Pandas你需要知道的都在这里
数据整理是数据科学研究流程中的一个重要步骤。本文要介绍的pandas就是一个广受欢迎的数据整理库。这个应用最早基于NumPy开发,那么NumPy又是什么东西?NumPy其实是Python里进行数学计算的基础工具。Pandas库提供了快速、简捷、易懂的数据结构,简化了数据整理步骤。
PolYamoR的简介:Python和R之间的双向翻译器
时至今日,数据科学已经成为Python和R之间的主战场。在数据科学里,存在着让不同编程语言共存的方式。
但是编程语言的共存也有它的规则,就算是 Dataiku Data Science Studio (DSS) 系统可以使其顺畅,但是并非每个人都准备好接受这种共存的状态。
和生意人打交道,数据科学家常犯的三大典型错误
目前还没有一家媒体的封面文章宣扬过那些不符合舆论预期的数据科学家的失败。
今天我们就来谈谈数据科学家常犯的三大典型错误以及如何避免犯这些错误。
资深数据科学家面试entry level 数据科学家时,会问那些问题?
pringboard里收录了Matt对数据科学面试的指导面试记录。同时,Matt也是Springboard数据科学职业导向性Boot Camp中的一位导师。