列表

详情


(  )应用于大数据的数据采集阶段。

A. MapReduce

B. HDFS

C. ETL

D. HBase

参考答案: C

详细解析:

大数据关键技术:包括数据采集、数据存储、数据管理、数据分析与挖掘4个环节
数据采集:数据抽取工具ETL
数据存储:结构化数据、非机构化数据和半结构化数据的存储与访问。结构化数据一般存放在关系数据库,通过数据查询语言(SQL)来访问;非结构化和半结构化数据一般通过分布式文件系统NOSQL进行存储
数据管理:分布式并行处理技术(MapReduce)
数据分析与挖掘:是根据业务需求对大数据进行关联、聚类、分类等钻取和分析,并利用图形、表格加以展示。数据分析与挖掘属于数据仓库的范畴。
大数据涉及的技术:
HDFS:Hadoop分布式文件系统(HDFS)是适合在通用硬件上的分布式文件系统,能提供高吞吐量的数据访问,非常适合大规模数据集上的应用
HBase:是一个分布式、面向列的开源数据库,是一个适合于非结构化数据存储的数据库。是基于列的模式
MapReduce:是一种编程模型,用于大规模数据集的并行运算
Chukwa:是一个开源的用于监控大型分布式系统的数据收集系统。还包含了一个用于展示、监控和分析已收集的数据的工具集

上一题