参考答案:
【问题1】
1.数据分布及状态详细调查(或者数据梳理)。
2.各政府部门业务流程以及信息系统使用情况调查。
3.统一的数据标准规范研究。
4.指标计算模型研究,确定各个指标的输入数据。
5.提出数据管理(采集、存储、使用、维护等)工作流程方案。
6.获取有关部门宏观经济数据的具体应用需求。
【问题2】
需要建设一个集中的数据库作为核心数据库。主要理由:
1.数据分布广,同一数据类或数据项存在信息冗余和不一致的情况,应用前需要比对和清洗,整理后的数据应存放于核心数据库。
2.宏观经济信息的实时性要求不高,以集中的统一的核心数据库为基础,提供经济信息服务,形成的经济指标更加科学。
【问题3】
1.输入参数的时间戳不一致,或者时间段口径不一致。
2.数据不符合统一的标准,或者数据标准不一致(如投资主体的代码在不同的系统中不一致)。
3.数据来源单位的数据没有及时更新,或者不全。
4.存在无效数据,如某个投资主体有误或不存在。
详细解析:
试题的题干简要介绍了宏观经济数据库的概念以及宏观经济数据库数据的广泛分布情况。从题干中,我们能够了解:经济状态用宏观经济指标来表示,而这些指标需要通过计算模型估算,模型的输入信息有很多。这些信息分布于政府、金融、财税、企业等众多部门,这些信息的有机集合称为宏观经济数据库。这样的数据库,采用物理集中的建设方式,不具有可操作性,而且针对同一事件,不同部门的数据都会有反映,这些数据有可能是一致的,也有可能是不一致的,因此在建设宏观经济数据库的时候,要对数据进行整合。
【问题1】
问题1说明中指出了该市的基础信息平台很完善(网络、存储和计算平台),因此B公司在进行原形分析时,主要分析的不是数据库的运行平台,而是数据的生产、数据的存储、数据的消费(应用)、标准规范等情况。
【问题2】
对于“物理分散,逻辑集中”的数据库,在进行逻辑集中的时候,要对数据进行整合,消除数据的不一致性,而且宏观经济数据库的应用没有实时性要求,为便于计算模型获得口径一致的输入数据,应该建设一个集中的数据库。
【问题3】
指标差别大,主要是因为数据的不一致性造成的,产生不一致性的原因可能包括数据的时间戳、标准等。