首页

阿里云认证 - 专业工程师(阿里云ACP) - 大数据工程师

类型:
选择方向:
选择考试:
选择科目:
题型:
为你找到 202 个题目。
数据工场DataWorks (原DatalDE) 中,调度系统可以根据配置好的任务属性进行自动调度。属性中包含的调度周期是指任务调度的频次,目前支持( )哪几种时间粒度。


A. 天

B. 月

C. 周

D. 小时

E. 5分钟

F. 1分钟

大数据开发套件DatalDE中,如果当前工作流/节点任务存在上游任务,则调度执行时,必须满足( )等条件才可以调度执行。


A. 上游任务已经执行

B. 上游任务已经执行并返回成功

C. 自身定制时间已到或已过

D. 自身定制时间未到

机器学习算法按照学习方式可以简单的分为两类,包括()


A. 深度学习

B. 分类学习

C. 无监督学习

D. 监督学习

E. 聚类学习

以下哪几个大数据计算服务(MaxCompute,原ODPS )的SQL语句可以用户表user中找出用户名称username中包含'hu’的记录?【加强训练】

A.

select* from user where username rlike '*hu*'

B.

select* from user where username like '%hu%'

C.

select* from user where username contains('hu')

D.

select* from user where username like '*hu*'

在执行相应的实例。周期性调度任务每天自动调度的实例都是在当天23:30开始生成的,以下说法正确的是? (3个)


A. 任务task1是按天调度的周期性调度任务,2016年4月9日23点00分,把task1的定时时间从原来零点整改成8点30分,4月10日,task1的实例定时时间为8点30分

B. 任务task1是任务task2的上游任务,2016年4月9日11点30分,把task2的上游任务换成task3,当天task2的自动调度实例依赖的还是task1的实例

C. 2016年4月9日11点30分新增的按天调度的周期性调度任务,当天可以自动调度运行

D. 2016年4月9日11点30分新增的按天调度的周期性调度任务,4月10日可以自动调度运行

用大数据计算服务构建海量的数据仓库时,分区表是一种很常见的做法,对于分区表的描述正确的有()【加强训练】


A. 分区支持Hash Clustering,将数据进一步分片

B. 在通过SQL读取分区表中的数据时,可以通过指定分区的方法只读取一部分分组,减少IO开销

C. 可以单独处理指定分区中的数据,不会对其他分区数据产生影响

D. 对于过期的数据可以将对应的分区drop掉,不会影响其他分区中的数据

对OTS的单行操作,描述正确的有?

A. getrow:读取单行数据

B. deleterow:删除一行

C. updaterow:更新一行,如果该行不存在,则新增一行

D. putrow:新插入一行数据,如果数据存在,则删除旧行,在写入新行

在数据工场DataWorks (原DataIDE )中的数据同步任务的配置选项中,可以设置源表和目标表的字段对应关系。将大数据计算服务( MaxCompute,原ODPS )的表同步到分析型数据库( AnalyticDB 。原ADS)中时,以下关于字段映射的说法中正确的有( )。

A. 源表和日标表需要同步的字段的名称必须一致

B. 源表和日标表需要同步的字段需按照位置关系一一对应即可

C. 字段配置项中,源表和目标表需要同步的字段数必须一致

D. 数据同步任务是按照源表和目标表字段位置来匹配导入的

数据工场DataWorks (原DatalDE) 中的数据同步任务Task1,将大数据计算服务(MaxCompute, 原ODPS)表的最新分区中的数据同步到云数据库RDS (MySQL)中。源数据表中存在数据质量问题,加载的时候会有部分出错记录,在目标表Table2中会出现部分数据有主键冲突的情况,当主键冲突时,保留新数据。可以通过( )的配置结合起来实现上述场景。


A. 根据表分区设置来配置参数,使得每次执行时读取最新的分区。如按照天的话,可以配置分区=${bdp.system.cyctime}

B. 根据表分区设置来配置参数,使得每次执行时读取最新的分区。如按照天的话,可以配置分区=${bdp.system.bizdate}

C. 在源头云数据库RDS侧配置加载控制为替换原有数据(replace into)

D. 视为脏数据,保留原有数据(insert into)

某企业因为业务发展带来了数据膨胀,每日产生4T数据,现在他们考虑要把现有的分析系统迁移到云上。通过系统分析,针对目前系统的状况去做云产品的选型。他们梳理了一下目前支持的应用类型,大体上有以下几种:提供给一线业务人员前一日以及最近三个月的经营状况的报表分析,同时要向客户提供30天内业务数据的即席查询。请从查询效率和成本两个维度考虑,你认为需要哪些产品组成合适的解决方案?【加强训练】

A. DRDS

B. RDS

C. ODPS

D. ADS

上一页

第 1 页