参考答案:
【问题1】(5分)
(1)A:故障分析定位 B:故障终止
(2)
系统硬件及设备:主要包括主机服务器及其主要部件、专门的存储设备、网络交换机、路由器,等。监控方法:采用通用或者专用的管理监控工具,通常具有自动监测、跟踪和报警的功能。
软件:主要针对其应用性能、软件Bug和变更需求。监控方法:采用管理工具,专门的测试工程师负责,使用过程中用户发现提出。变更需求也是在用户使用和监视二合一的过程中发现。
人员:系统操作人员、系统开发工程师、用户、来访者,甚至包括系统所在机房的清洁工和运输公司的职工,等。监控方法:对与系统接触的过程中的行为进行跟踪和记录,防止或者及早发现非标准的操作带来的系统故障或者服务故障。
【问题2】(6分)
事务故障:系统自动恢复
系统故障:重启系统后系统自动恢复
介质故障:DBA转入最新的数据副本,使数据库恢复到最近一次转储时的一致性状态;日志文件副本;执行系统恢复命令,具体的恢复仍由DBMS完成
【问题3】(4分)
问题控制的目标:
将由IT基础架构中的错误引起的故障和问题对业务的影响降低到最低限度
找出出现故障和问题的根本原因,防止再次发生与这些错误有关的故障
实施问题预防,在故障发生之前发现和解决有关问题
问题控制的步骤:
发现和记录问题
归类问题
调查和分析问题
错误控制
详细解析:
【问题1】故障管理即包含了故障监视、故障调研、故障支持和恢复以及故障终止5项基本活动。
系统硬件及设备:主要包括主机服务器及其主要部件、专门的存储设备、网络交换机、路由器等。监控方法:采用通用或者专用的管理监控工具,通常具有自动监测、跟踪和报警的功能。
软件:主要针对其应用性能、软件Bug和变更需求。监控方法:采用管理工具,专门的测试工程师负责,使用过程中用户发现提出。变更需求也是在用户使用和监视二合一的过程中发现。
人员:系统操作人员、系统开发工程师、用户、来访者,甚至包括系统所在机房的清洁工和运输公司的职工,等。监控方法:对与系统接触的过程中的行为进行跟踪和记录,防止或者及早发现非标准的操作带来的系统故障或者服务故障。
【问题2】
数据库故障
主要分为:事务故障、系统故障和介质故障。
事务故障
是指事务在运行至正常终点前被终止,此时数据库可能出现不正确的状态。
由于事务程序内部错误而引起的,有些可以预期,如金额不足等;有些不可以预期,如非法输入、运算溢出等。
恢复过程
①反向(从后向前)扫描日志文件,查找该事务的更新操作。
②对该事务的更新操作执行逆操作,也就是将日志记录更新前的值写入数据库。
③继续反向扫描日志文件,查找该事务的其他更新操作,并作同样处理。
④如此处理下去,直到读到了此事务的开始标记,事务故障恢复就完成了。
事务故障的恢复由系统自动完成,对用户是透明的。
系统故障(通常称为软故障)
是指造成系统停止运转的任何事件,使得系统要重新启动。
特定类型的硬件错误、操作系统故障、DBMS代码错误、突然停电等。
恢复过程
①正向(从头到尾)扫描日志文件,找出故障发生前已经提交的事务(这些事务既有BEGIN TRANSACTION 记录,也有COMMIT记录),将其事务标识记入重做(REDO)队列。同时找出故障发生时尚未完成的事务(这些事务只有BEGIN TRANSACTION 记录,无相应的COMMIT记录),将其事务标识记入撤销(UNDO)队列。
②反向扫描日志文件,对每个UNDO事务的更新操作执行逆操作,也就是将日志记录中更新前的值写入数据库。
③正向扫描日志文件,对每个REDO事务重新执行日志文件登记的操作,也就是将日志记录中更新后的值写入数据库。
是在系统重启之后自动执行的。
介质故障(称为硬件故障)
是指外存故障,例如磁盘损坏、磁头碰撞,瞬时强磁场干扰等。
这类故障将破坏数据库或部分数据库,并影响正在存取这部分数据的所有事务,日志文件也被破坏。
恢复过程
①装入最新的数据库后备副本,使数据库恢复到最近一次转储时的一致性状态。
②转入相应的日志文件副本,重做已完成的事务。
介质故障的恢复需要DBA的介入,具体的恢复操作仍由DBMS完成。
恢复过程
①DBA只需要重装最近转储的数据库副本和有关的各日志文件副本。
②然后执行系统提供的恢复命令。
【问题3】
问题控制的目标:
将由IT基础架构中的错误引起的故障和问题对业务的影响降低到最低限度。
找出出现故障和问题的根本原因,防止再次发生与这些错误有关的故障。
实施问题预防,在故障发生之前发现和解决有关问题。
问题控制的步骤:发现和记录问题、归类问题、调查和分析问题、错误控制。