MapReduce

Aug
01

Spark/Hadoop/MapReduce入门101

Apache Spark是用于大规模数据处理的统一分析引擎,是现如今非常流行的通用集群计算系统。它提供了 Java、Scala、Python 和 R 中的高级 API,以及支持通用执行图像的优化引擎,有便于使用、可以在多个平台上运行的特点,结合了 SQL、数据流和复杂分析。本文介绍了Apache Spark的必备知识,同时介绍了与之相关的MapReduce和Hadoop,带你快速入门Spark基础知识!

By Zhang Bonnie | Blog
DETAIL
Aug
09

科普 | HDFS和HBase: 所有你需要知道的都在这里

Hadoop文件分发系统 ( Hadoop Distributed File System (HDFS) )和Hadoop数据库(HBase)是大数据生态系统的关键组成部分。本文将使用两者最常被使用的实例来解释两者的不同

By KellyZzz | Blog
DETAIL