畅享博客 > 科索路 Cosolu > 方乐 > 灾难恢复计划案例研究
2006-12-1 18:11:46

灾难恢复计划案例研究

1.引入 IT 服务连续性管理 (ITSCM )

根据各种权威机构的统计数字表示,具有毁灭性的灾难发生可能性在不断增加。灾难包括:火灾,水灾,偷盗,大规模停电,软硬件瘫痪等等。在组织内部,灾难被定义为影响组织的系统或服务正常运行的任何事件,而且常常需要付出很大的努力才能将这些事件所造成的损失恢复。灾难要比突发事件严重的多,它是阻止业务连续运行的“拦路虎”。

随着业务对 IT 服务依赖性的不断增加,对大部分的组织来说,做生意等同于使用 IT 技术。如果没有 IT 技术,那么他们就无法产生收益。因此从 IT 服务的角度考虑如何使业务持续地进行下去是非常重要的。作为 IT 服务管理( ITSM )的最佳实践方法论, ITIL 的十大流程管理模块中的 IT 服务连续性管理模块( IT Service Continuity Management , ITSCM ),就是从这个角度出发,通过对 IT 基础设施和 IT 服务的连续性管理,确保组织在灾难后一定时间内恢复到正常状态,支持整个组织的业务连续性,减小灾难带来的严重后果。

IT 服务连续性管理包括:

  • 评估灾难对 IT 服务的影响程度;
  • 识别出对业务发展起关键作用并需要额外预防措施的服务;
  • 定义灾难后服务恢复所需的时间;
  • 采取相应措施预防、检测灾难,降低灾难造成的损失;
  • 识别被用来恢复服务的方法和步骤;
  • 制定内容详尽的灾难恢复计划并对该计划进行测试。

根据 ITIL 最佳实践的 ITSCM 流程,制定出周密、详尽的灾难恢复计划并对其进行测试是进行 ITSCM 的关键成功因素,那么在实践中应该如何运用灾难恢复计划,支持业务连续性管理呢?

两年前,科索路咨询公司(以下简称科索路)接受了国内一家生产制造公司(以下简称 L 公司)的案例,开始着手为该公司准备应急措施计划,解决问题。这个计划可以确保无论发生了什么,该公司都能继续有效地开展工作,为其客户服务。

2. 应急措施计划的必要性

四年前, L 公司仅仅安装了他们自己的大型主机系统,任何事情都依靠这个主机,但没有相应措施预防主机出现故障,降低灾难带来的损失。科索路通过收集各种需求信息,通过研究,为该公司的“灾难恢复”设置了很高的优先级。科索路为 L 公司曾做过一个很简单的业务影响分析( BIA ),旨在发现计算机的突发故障会对各部门产生多大的影响。在为 L 公司评选备份提供商的过程中,价格自然是选择服务商的一个重要因素,但更重要的是:即使发生了最危急的灾难, L 公司仍可依靠提供商提供的服务有效的开展工作。科索路顾问认为 L 公司所有员工都应该能熟悉所处的环境并能得心应手的实施恢复系统的步骤。因此在选择供应商时,要让尽可能多的员工参与意见,以适应更多员工的需求。在此基础上,供应商都被要求演示一下他们如何处理 L 公司的文件,以及如何在各自的系统上运行这些文件。这种演示测试对选择供应商具有决定性作用。

3. 业务的连续性

但是,替代大型主机只是灾难恢复计划最低要求者的观点。一个成熟的灾难恢复计划还必须包含相应的应急措施计划,并能仔细分析出组织可能产生的其他问题和组织所提供的服务。科索路从一开始就严格按照 ITIL 最佳实践方法来做,并在特殊的地方进行改良,融入新的需求。 ITIL 最佳实践在灾难恢复方面是一个很好指导方针和参照标准。制定这样的计划是一个很好的起点,更重要的工作仍然是如何按照计划进行实施。

计划中的主要内容有:

  • 灾难恢复所需要的业务条件;
  • 根据灾难恢复的优先级,计划中必需定义的服务内容;
  • 应急措施计划小组及其成员;
  • 组织和所有人员的名字,电话号码和地址;
  • 从调用该计划时刻起,所有关于灾难检测的描述和灾难影响程度的评估;
  • 灾难恢复步骤的详细描述,包括紧急情况解除后,如何恢复到原来的状态;
  • 所有保单的细节;
  • 电力供应短缺或空调失灵后,如何进行相应的恢复措施;

4. 测试计划

任何计划要想成功的先决条件就是要不断地进行测试。科索路每年都要对 L 公司的计划进行测试。在测试过程中, Z 公司作为独立的评估方将计划中出现的任何问题记录下来,同时也记下没有被完全遵循计划实施的地方。在测试中, IT 测试小组尽可能将测试做得逼真,与现实一样。但是,在进行应急措施计划的测试时,他们并没有把大型主机完全关闭,避免产生过大的损失。

5. 有关 ITIL 的结论

科索路根据 ITIL 最佳实践方法论并结合其实践经验,总结出了制定更符合国内公司灾难恢复计划的流程和方法。科索路认为, ITIL 指导方针对制定一个好的业务连续性计划起到了很好的指向作用。同时 ITIL 指导方针和方法论所提供的框架可以使 IT 部门更好的思考各种技术上和非技术上的问题,引导制定各种领域内的应急措施计划。然后,把各种特定需求融入进去,以确保计划的完整性,从而实现业务的持续性发展。


推荐到鲜果:

评论

good

发布者 harson
2006-12-1 22:33:01


小企业、大企业都应当考虑容灾

发布者 liaobin
2006-12-2 23:24:30


good


发布者 CrossPOLO
2006-12-6 14:56:35



体会过受益的人推荐——客源CRM非常不错!

可称得上是企业的业绩利器

可以帮助企业轻松获得大量目标客户来源,促使市场产出明显增长而投入费用明显节省,并且可帮助企业找出业绩成长的瓶颈问题及销售过程中开源节流的关健因素。
详情请查看: http://www.crmway.net

发布者 匿名用户
2008-4-21 12:11:29


您正在以 匿名用户 的身份发表评论  快速登录
(不得超过 50 个汉字)
       看不清,换一个
提示消息
(输入完内容可以直接按Ctrl+Enter提交)