Spark

Aug
03

Apache Spark——一个灵活的数据处理框架

多年来,Hadoop 一直是大数据领域无可争议的领头羊——直到 Spark的 出现。自 2014 年首次发布以来,Apache Spark 一直在点燃大数据世界。 凭借 Spark 便捷的 API 和承诺的比 Hadoop MapReduce 快 100 倍的速度,一些分析师认为 Spark 标志着大数据新时代的到来。本文将为你介绍这两个大数据处理框架,并展开讨论Apache Spark的具体优势。

By Zhang Bonnie | Blog
DETAIL
Aug
01

Spark/Hadoop/MapReduce入门101

Apache Spark是用于大规模数据处理的统一分析引擎,是现如今非常流行的通用集群计算系统。它提供了 Java、Scala、Python 和 R 中的高级 API,以及支持通用执行图像的优化引擎,有便于使用、可以在多个平台上运行的特点,结合了 SQL、数据流和复杂分析。本文介绍了Apache Spark的必备知识,同时介绍了与之相关的MapReduce和Hadoop,带你快速入门Spark基础知识!

By Zhang Bonnie | Blog
DETAIL
May
24

框架为数据科学家带来哪些编程语言所不能带来的优势

过去,计算机编程的关键就是用对语言。不论是C,Lisp,还是Pascal,程序员们都有着自己的专长和编程格式。然而, 随着计算能力的增加,编程语言之间大大缩减,从而允许系统理解所有计算机语言并可以在其中轻易转换。如今,人们关注的是框架(Framework)这个更现代,更具有前瞻性的概念。框架可以克服很多编程语言中过时的做法

By ivankahu | Blog
DETAIL