A.基于Mapreduce,具有较大延迟
B.每个Hive表对应HDFS上的一个目录
C.不支持SQL能力,特有的查询语言
D.支持jdbc/odbc访问
A.可以指定实例进行日志收集
B.可以指定节点IP进行收集
C.可以指定用户进行日志收集
D.可以指定时间段进行日志收集
A.Hive最终将数据存储在HDFS中
B.Hive是Hadoop平台的数据仓库工具
C.HQL可以通过MapReduce执行任务
D.Hive对HBase有强依赖
A.只要有一个HiveServer不可用,整个Hive集群便不可用
B.MotaStore用于提供元数据服务,依赖于DBService
C.在同一时间点、HiveServer只要一个处于Active状态,另一个则处于Standby状态
D.HiveServer负责接收客户端请求.解析.执行HQL命令并返回查询结果
A.HDFS:分布式文件系统,是Hadoop项目的两大核心之一,是谷歌GFS的开源实现
B.HBase:提供高可靠性、高性能、分布式的行式数据库,是谷歌Big Table的开源实现
C.Hive:一个基于Hadoop的数据仓库工具,用于对Hadoop文件中的数据集进行数据整理、特殊查询和分析存储
D.Zookeeper:针对谷歌Chubby的一个开源实现,是高效可靠的协同工作系统
A.加载数据到Hive时数据必须是HDFS的一个路径
B.创建外部表必须要指定location信息
C.创建外部表使用external关键字,创建普通表需要指定internal关键字
D.创建表时可以指定列分隔符
A.SparkStreaming与Flink相比,时延更低
B.Flink流式处理引擎能够同时提供支持流处理和批处理应用的功能
C.checkpoint实现了Flink的容错
D.与FusionInghtHD中的Streaming相比,Flink具有更高的吞吐量