列表

详情


ODPS的某个带有Join的SQL运行效率很低,可以采取以下哪些措施来检验或者改善 ( )

A. 检查连接键是否存在数据倾斜

B. 检查是否有多对多连接

C. 如小表关联大表,可以考虑使用mapjoin优化

D. 检查是否有笛卡尔积

参考答案: AC

详细解析:

正确答案AC A、数据倾斜会使SQL的运行效率变低:主要原因是数据存储不均,存在数据热点; B、多对多不一定连接不一定造成效率变低; C、小表关联大表时,相当于小表会复制大表的数据量份数,所以使用造成效率低; D、ODPS默认不支持笛卡尔积,如果SQL中引入笛卡尔积执行会报错。

上一题