A.HDFS:分布式文件系统,是Hadoop项目的两大核心之一,是谷歌GFS的开源实现
B.HBase:提供高可靠性、高性能、分布式的行式数据库,是谷歌Big Table的开源实现
C.Hive:一个基于Hadoop的数据仓库工具,用于对Hadoop文件中的数据集进行数据整理、特殊查询和分析存储
D.Zookeeper:针对谷歌Chubby的一个开源实现,是高效可靠的协同工作系统
A.HBase是一个行式分布式数据库,是Hadoop生态系统中的一个组件
B.HBase是针对谷歌BigTable的开源实现
C.HBase多用于存储非结构化和半结构化的松散数据
D.HBase是一种关系型数据库,现成功应用于互联网服务领域
A.Hadoop的核心是HDFS和Map Reduce
B.Hadoop是基于Java语言开发的,只支持Java语言编程
C.Hadoop2.0增加了Name NodeHA和Wire-compatibility两个重大特性
D.Hadoop Map Reduce是针对谷歌Map Reduce的开源实现,通常用于大规模数据集的并行计算
A.Spark引进了弹性分布式数据集RDD(ResilientDistributedDataset)的抽象,容错性高
B.Spark提供的数据集操作类型不仅限于Map和Reduce,大致分为:Transformations和Actions两大类
C.Spark程序由Python语言进行编写,不支持Java语言进行的程序编写
D.Spark把中间数据放到内存中,迭代运算效率高
A.利用MapReduce计算模型
B.基于Hadoop集群
C.实现了一批开源的挖掘方法
D.采用了DFS分布式文件系统