业务连续性概述
业务连续性是指企业有应对风险、自动调整和快速反应的能力,以保证企业业务的连续运转。为企业重要应用和流程提供业务连续性应该包括以下三个方面。
1.高可用性(High availability) 。它是指提供在本地故障情况下,能继续访问应用的能力。无论这个故障是业务流程、物理设施,还是IT软硬件故障。
2.连续操作(Continuous operations)。 它是指当所有设备无故障时保持业务连续运行的能力。用户不需要仅仅因为正常的备份或维护而需要停止应用的能力。
3.灾难恢复(Disaster Recovery)。它是指当灾难破坏生产中心时,在不同的地点恢复数据的能力。
同时,上述三个部分不是相互孤立的,是相互关联,而且有交叉的。
业务连续性的方法论
业务连续性管理起源于上个世纪70年代的容灾恢复计划。在那个时代,灾难恢复的活动由数据处理经理来管理。在那个时候,如果出现大的故障或危机,中断是以天计算而不是小时计算的。金融组织,如银行和保险公司大都选择在另外一个远离主中心的地方存储备份磁带。恢复活动经常是由火灾、水灾、暴风或其他物理损坏引发的。
到了上个世纪80年代,曾出现了很多商业恢复中心,在共享设备上提供计算服务,但重点还在IT的恢复。到了上个世纪90年代,IT出现重大的革命,灾难恢复计划发展为业务连续性计划。
针对业务连续性,IBM首先利用一套系统的方法来了解用户独特的业务连续性和可用性需求。IBM可以帮助用户构思和架构一套连续性规划。该规划可以使中断的威胁降到最低或消除中断威胁,充分考虑最关键需求的优先级,并将恢复时间降到最短。IBM连续性解决方案采用了基础架构管理方面(存储管理方面领先的自动化软件、服务器供应和端到端的可用性管理)的先进技术和最佳实践经验。
IBM使用自动化、前瞻性和适应性功能,将现场和非现场的备份功能结合起来满足用户的独特需求。通过IBM系统存储部提出的基于GDOC和存储HA的解决方案,可以真正地帮助客户实现业务的连续运转,保证了用户可以在IT技术层实现第七级的业务连续性解决方案。
同时配合IBM业务连续性和灾难恢复方法论,由分析评估、设计实施和维护管理组成一个循环往复的闭合系统,推动企业的业务连续和灾难恢复能力不断提升。
这个方法论将贯穿于IBM所有的业务连续性和灾难恢复服务当中。循环前进的方案体现了IBM对客户长期技术支持的承诺。IBM提供的服务将始终与环境变迁保持同步,并根据最新的技术、客户的需求及时进行服务升级及补充,以确保企业的连续运作,实现企业的灾难恢复能力的螺旋形上升,使业务连续性计划与外界环境变同步发展。
总之,IBM希望通过完善的解决方案,帮助企业的业务系统适应各种破坏以及灾难带来的挑战,并实时响应新变化,确保企业业务的持续运转。
业务连续性管理
业务连续性管理(Business Continuity Management,BCM),是一项综合管理流程,使企业认识到潜在的危机和相关影响,制订响应、业务和连续性的恢复计划,其总体目标在于提高企业的风险防范能力,有效地响应非计划的业务破坏并降低不良影响。
业务连续管理(BCM)十大最佳实践标准
1.项目启动和管理
确定业务连续性计划(BCP)过程的需求,包括获得管理支持、以及组织和管理项目使其符合时间和预算的限制。
2.风险评估和控制
确定可能造成机构及其设施中断和灾难、具有负面影响的事件和周边环境因素,以及事件可能造成的损失、防止或减少潜在损失影响的控制措施。提供成本效益分析以调整控制措施方面的投资达到消减风险的目的。
3.业务影响分析
确定由于中断和预期灾难可能对机构造成的影响以及用来定量和定性分析这种影响的技术。确定关键功能、其恢复优先顺序和相关性以便确定恢复时间目标。
4.制定业务连续性策略
确定和指导备用业务恢复运行策略的选择,以便在恢复时间目标范围内恢复业务和信息技术,并维持机构的关键功能。
5.应急响应和运作
制定和实施用于事件响应以及稳定事件所引起状况的规程,包括建立和管理紧急事件运作中心,该中心用于在紧急事件中发布命令。
6.制定和实施业务连续性计划
设计、制定和实施业务连续性计划以便在恢复时间目标范围内完成恢复。
7.意识培养和培训项目
准备建立对机构人员进行意识培养和技能培训的项目,以便业务连续性计划能够得到制定、实施、维护和执行。
8.维护和演练业务连续性计划
对预先计划和计划间的协调性进行演练、并评估和记录计划演练的结果。制定维持连续性能力和BCP文档更新状态的方法使其与机构的策略方向保持一致。通过与适当标准的比较来验证BCP的效率,并使用简明的语言报告验证的结果。
9.公共关系和危机通信
制定、协调、评价和演练在危机情况下与媒体交流的计划。制定、协调、评价和演练与员工及其家庭、主要客户、关键供应商、业主/股东以及机构管理层进行沟通和在必要情况下提供心理辅导的计划。确保所有利益群体能够得到所需的信息。
10.与公共当局的协调
建立适用的规程和策略用于同地方当局协调响应、连续性和恢复活动以确保符合现行的法令和法规。
业务连续性计划
业务连续性计划(Business Continuity Planning,BCP)是一套事先被定义和文档化的计划,明确定义了恢复业务所需要的关键人员、资源、行动、任务和数据。需要考虑的问题包括:关键业务数据被彻底破坏,只能用昨天的备份恢复,该怎么办?服务器瘫痪,该怎么办?技术更新换代,怎么样对业务影响最小?发生了灾难事件,该怎么办?IT系统恢复是否就可以开放业务运营?
BCP的内容不应该只局限在IT方面,应该涵盖如下几个方面:应急响应计划(业务连续性管理组织结构、应急初始评估流程、灾难宣布流程、灾难评估流程);容灾恢复计划(IT切换流程/步骤/启用条件、IT回切流程/步骤/启用条件);运维恢复计划(ORP);业务恢复计划。
BCP必须简单有效,定期演练,演练之前充分准备,遵守相关流程,从而保持业务连续性计划的有效性。演练的关键点在于通过真实的演练来检验并提高,演练规划要详细、模块化,演习手册要能满足指挥员和操作员不同的需求,演习结果要量化衡量。每次演练都有新的问题发生,在事前不要给领导100%的预期,因为演练的目的是要成长和提高,通常实现80%的目标就已经是一种成功。