阿里云认证 - 专业工程师(阿里云ACP)

在数据工场DataWorks中使用数据同步任务将云数据库RDS MySQL版的用户日志表同步至大数据计算服务MaxCompute中，其中RDS表中的用户访问时间字段为visit_time (datetime类型)，格式为YYYY-MM-DD HH:MM:SS,需要将该列数据转化并存储在MaxCompute对应string类型列中，存储的日期格式为YYYYMMDD，以下做法正确的是()。

A. 在RDSMysq|数据同步至MaxCompute中，RDSMysql侧不支持使用函数

B. 在数据同步字段配置界面中增加字段'DATE-FORMAT(visit_time，%Y%m%d)'并与MaxCompute时间列对应

C. 在数据同步字段配置界面中增加字段'DATE-FORMAT(visit_time， %Y-%m-%d)'并与MaxCompute时间列对应

D. 在数据同步字段配置界面中增加字段DATE-FORMAT(visit_time，'%Y%m%d')并与MaxCompute时间列对应

某图书管理系统使用ODPS进行离线数据分析，现在他们要将同一类目的书籍的名称拼成一个字符串，即将属于同一分组的字符串合并在一列展示，以下哪个内置函数可以实现这一功能?

A. wm_concat

B. split_part

C. concat

D. regexp_instr

数据工场DataWorks (原DatalDE)中，SQL任务task1是按小时调度的周期性调度任务，任务配置为每小时执行次，结果会插入到表table1中去，table1为一个有两个分区键(ds和hh)的分区表，其中ds取前一个小时的年月日(格式为yyyymmdd) ， hh取前一小时的小时(格式为hh24)，要使用调度系统提供的时间参数定义分区，使得task1每次调度运行时自动替换时间值，task1应该如何配置?

A. task1代码里table1的分区ds=${bdp.system.bizdate}， hh=$(h)，任务参数配置: hh=$[hh24]

B. task1代码里table1的分区ds=${bdp.system.bizdate}，hh=${h)，任务参数配置: hh=$[hh24-1/24]

C. task1代码里table1的分区ds=${daytime}, hh=${h)，任务参数配置: daytime=[yyyymmdd-1/24] hh=$[hh24-1/24]

D. task1代码里table1的分区ds=${daytime}, hh=${h)，任务参数配置: daytime=[yyyymmdd] hh=$[hh24-1/24]

从优化角度来看,大数据计算服务的MapReduce对于哪个节点处理哪个分片这个问题,采用了_______ 策略。

A. 本地性原理，即数据在哪台机器上，就在哪台机器上启动map

B. 能者多劳原理，将数据移动到计算能力最强的节点上，启动map.

C. 基于历史处理信息的优化原理,即将数据移到从历史执行信息看处理效果最好的机器上，

D. 负载均衡原理，即将数据放在当前负载最小的节点上启动map

数据工厂DataWorks中，调度任务每次运行前都先将任务实例化，即生成一个实例，调度运行时实际上在执行相应的实例。运维中心中的任务运维视图有运维、测试、补数据3种类型实例，运维实例是任务日常自动调度生成的实例，测试实例和补数据实例是通过任务管理视图对任务进行测试和补数据生成的实例。以下哪种类型任务不会生成自动调度实例?（）

A. 按天调度的周期调度工作流任务

B. 按月调度的周期调度工作流任务

C. 一次性工作流任务

D. 按周调度的周期调度工作流任务

大数据计算服务(MaxCompute, 原DPS )中的日志表log 是一张分区表，分区表是dt,每天产生一个分区用于存储当天新增的数据，数据是通过tunnel 接口上传，运维人员需要在每天上传数据之前生成好当天的分区，假设当前日期是20160301,语句_可以创建合适的分区。（）

A.

add partition log (dt=' 20160301')

B.

insert overwrite table log partition(dt=' 20160301')

C.

insert into table log partition(dt='20160301')

D.

alter table log add partition(dt= '20160301')

大数据计算服务(MaxCompute, 原ODPS )中，表ods_ sale_ detail 存放的是销告明细记录,建表语句如下: create table ods_ sale_ deti(sale_ date datetime, region string, amt decimal);其中sale_date字段表示销售的日期，amt表示销售全额，想要找出所有汇总销售额大于10000的日期以及当日的销售额，以下哪几个SQL可以达到这个目的? （）

A. select sale_ date, sum(amt) from ods_sale_ detail group by sale_ date where amt> 10000;

B. select * from (select sale_date,sum(amt) s_amt from sale_ date group by sale_date) sub where s_amt>10000;

C. select sale_ date, sum(amt) from ods_ sale_ detail group by sale_ date having sum(amt)>10000;

D. select sale_date, sum(amt) from ods_ sale_ detail group by sale_ date where sum(amt)>10000;

数据工场DataWorks （原DatalDE）中，通过运维中心的任务运维列表可以批量修复重跑任务，即重跑多个任务，重跑的任务执行成功后下游未运行状态的任务恢复调度。项目空间prj1有一批任务需要批量修复重跑，以下说法正确的是_______。

A. 只有prj1的项目管理员可以操作

B. prj1的开发角色成员可以操作

C. prj1的运维角色成员可以操作

D. prj1的部署角色成员可以操作

DataIDE中，通过运维中心的任务运维视图可以对调度任务操作重跑并恢复调度，即重跑该任务同时把下游未运行的任务恢复调度。任务task3依赖任务task2，任务task2 依赖任务task1，对task2操作重跑并恢复调度，以下哪个场景会使task2和task3执行?（）

A. task1为成功状态，task2为失败状态，task3为未运行状态

B. task1、 task2、 task3都是未运行状态

C. task1、 task2、 task3都是运行成功状态

D. task1为失败状态，task2、task3都是未运行状态

在dataworks中的数据管理模块中，用户可以申请数据访问权限，dataworks中的数据包括三种数据类型，是下面哪些选项（）

A. 表：即数据表

B. 函数：即UDF，可在SQL中使用的函数

C. 资源：如文本文件，MapReduce的jar文件等

D. jar包

阿里云认证 - 专业工程师(阿里云ACP) - 大数据工程师