列表

详情


用大数据计算服务构建海量的数据仓库时,分区表是一种很常见的做法,对于分区表的描述正确的有()【加强训练】


A. 分区支持Hash Clustering,将数据进一步分片

B. 在通过SQL读取分区表中的数据时,可以通过指定分区的方法只读取一部分分组,减少IO开销

C. 可以单独处理指定分区中的数据,不会对其他分区数据产生影响

D. 对于过期的数据可以将对应的分区drop掉,不会影响其他分区中的数据

参考答案: ABCD

详细解析:

A.Hash Clustering通过允许用户在建表时设置表的Shuffle和Sort属性,进而MaxCompute根据数据已有的存储特性,优化执行计划,提高效率,节省资源消耗;B.通过过滤分区实现分区裁剪,降低IO开销;C.分区相当于文件夹存储,过滤分区相当于只处理该文件夹下数据,对其他分区没影响;D.分区表可以只drop过期数据分区,相当于删除某个文件夹下数据对其他分区没影响。


上一题