2023 年业务连续性和灾难恢复 (BCDR) 最佳实践

已发表: 2023-06-07

业务连续性 (BC) 和灾难恢复 (DR) 是相辅相成的实践,有助于组织在发生中断、中断或危机后继续开展活动的能力。

到 2023 年,业务连续性和灾难恢复 (BCDR) 比以往任何时候都更加突出。每家公司,从普通企业到跨国公司,都依赖数字技术——使 BCDR 成为企业必备的技术。 此外,大流行病准确地表明了意外的业务中断可能对经济造成多大的损害。

然而,14% 的公司在六个月到三年内没有测试过他们的 BCDR 计划,而且研究表明,很少有公司是业务连续性和灾难恢复最佳实践。 以下是您需要遵循的 10 条准则:

1. 评估与不同组件相关的风险并进行业务影响分析 (BIA)

风险分析和 BIA 是负责制定 BCDR 战略的组织的基本工具。 识别内部和外部风险和威胁的行为对于业务连续性和灾难恢复至关重要。 风险研究揭示潜在威胁及其发生的可能性。 该风险评估是对 BIA 的补充,BIA 评估中断的可能影响。

BIA 包括财务分析,但它还考虑了意外中断的非财务方面。 此外,BIA 确定公司在事件发生后必须继续执行的关键任务服务,以及维持这些功能所需的资源。

2. 确定何时激活 BCDR 以获得最佳结果

在将不幸的情况称为灾难并启动 BCDR 计划之前,企业必须考虑多个变量。 中断的预期持续时间、中断对组织的影响、启动 BCDR 计划的经济负担以及 BCDR 策略导致进一步中断的可能性是最重要的考虑因素。

具有讽刺意味的是,从公司的主要地点转移到次要中心,然后在发生事件后返回主要运营基地的行为可能会严重破坏流程。 因此,公司领导层必须仔细评估何时实施 BCDR 计划。 例如,一个组织可能确定六个小时的中断不足以保证发布灾难公告。

3. 准备好倡导 BCDR 的变化和更新

威胁形势的发展或新企业的出现可能会迫使公司增加其 BCDR 覆盖范围。 在 2022 年至 2023 年期间,这种情况经常发生,因为公司重返办公室工作,新的风险也逐渐浮出水面。

如果扩展 BCDR 策略和恢复技术的必要资源未包含在您当前的预算中,您可能需要寻求额外资金。 投资建议应基于以下内容:

  • 制定商业提案,突出增强的 BCDR 能力的优势
  • 确定更新后的 BCDR 战略是否会对其他领域产生影响,例如网络安全。
  • 获得资金,包括产品和服务评估
  • 创建具有足够文档的采购请求

请记住,您必须在 BCDR 费用和特定灾难情景的预计经济后果之间建立平衡。 您不想设计比危机本身贵 10 倍的解决方案。

4. 测试业务连续性和灾难恢复计划是否存在漏洞

桌面培训、计划演练以及模拟是常见的测试形式。 通常,测试团队由恢复主管和来自每个功能组的代表组成。 通常,桌面演习是在会议室进行的,团队会检查计划是否存在缺陷并确保每个公司部门都有代表。

在有计划的演练中,团队的每个成员都广泛检查他或她指定的计划组件以找出弱点。 通常,团队在完成任务时会考虑到特定的灾难。 一些组织将灾难角色扮演和相关活动纳入计划的演练中。 任何不足之处都应加以解决,并将修改后的计划发送给所有相关人员。

5. 加倍关注文档

必须根据业务风险和灾难恢复协议起草业务连续性计划。 例如,该计划应指定员工在发生危机时必须做什么,以及关键任务 IT 支持的最严格交付时间表。

识别关键系统并编制关键应用程序清单也很重要。 此外,组织必须维护一份外部联系人清单,例如金融家、IT 专家和公用事业工人。 正如冠状病毒的爆发告诉我们的那样,只有拥有完善的业务连续性计划的公司才有能力迅速恢复。

6. 确定您独特的风险弹性水平及其强制要求的 IT 支持

鉴于每个组织都是独一无二的,您必须评估风险并制定个性化的业务连续性计划。 例如,就银行而言,仅仅几秒钟的延迟就可能导致数百万美元的损失。 如果出现停机时间,医疗保健机构可能会面临危重病人护理的风险。

此外,公司的恢复选项必须根据其运营所在的部门来确定。 RTO 和 RPO 是这方面最重要的概念。 RPO 或恢复点目标是指一段时间内允许的最大数据丢失。 RTO 或恢复时间目标是中断和恢复流程之间经过的时间。

您可以根据公司的业务规则和指南选择适当的 RPO 和 RTO,从而选择适当的 DR 备选方案和恢复技术。

7. 投资虚拟化基础设施的冗余

大流行之后,虚拟化在企业中变得至关重要和普遍。 然而,业务连续性计划必须考虑混合物理和虚拟基础架构的必要性。

拥有虚拟服务器、存储空间。 以及工作站降低了服务中断的风险,但虚拟机仍然可能出现故障。 为虚拟机制定备份策略应该是您的首要任务之一,特别是如果您在 2020 年至 2023 年之间增加了关键任务流程的虚拟化蓝图。

8. 考虑与托管 BCDR 提供商合作

几乎每个 IT 服务提供商都会说他们可以帮助进行服务中断修复和恢复。 但是,提供异地备份设施的合作伙伴与拥有必要的 BCDR 基础设施的合作伙伴之间存在显着差异。 托管服务提供商将提供多种服务:

  • 军用级基础设施
  • 灾难恢复和备份工具
  • 存档和恢复设施
  • 存储的多平台管理
  • 在紧急疏散和转移到多个恢复地点中的任何一个方面的知名且经过验证的专业知识

9. 与采购部门合作评估供应商的 BCDR 准备情况

现代企业不是像海上岛屿一样自给自足的实体。 相反,它们是紧密相连的机构,对第三方供应商有着深刻的相互依赖性,第三方供应商提供从关键任务 IT 基础设施到成品和基本材料的任何东西。 确定每个公司与供应商的合作伙伴关系,以及如果供应商的供应中断,它对业务连续性带来的潜在风险。 供应商面临哪些压力,您的同事在压力下的表现如何?

在建立关系之初,必须对第三方供应商进行严格的尽职调查,并持续监控是否有任何新威胁的迹象。 他们各自的业务连续性计划究竟是什么?它们是否足以保护您的公司?

10.研究托管选项

最后,托管为拥有大规模 IT 基础设施的公司提供了一种将风险分散到不同地理区域的方法。

第三方数据中心的内置冗余旨在鼓励正常运行时间和弹性。 此外,主机托管提供多种电源和连接选项。 如果主要路径发生故障,这将用作备用路由。

一些托管服务提供商可能会额外提供一系列地理上分散的数据中心,允许企业选择最符合其特定要求的场所。 为方便起见,组织可以选择靠近其总部的主要位置,并选择更偏远的次要位置以便在灾难后进行恢复。 托管数据中心的定期维护计划和机器更新也支持业务连续性,从而优化系统可用性和性能。

结论

随着灾难和业务中断的处理变得越来越复杂,这些 BCDR 最佳实践将帮助您的 IT 团队做好准备。 您还可以探索云计算帮助灾难恢复规划 (DRP) 的潜力,并使用数据恢复工具在小事故后检索丢失的信息。