災害が発生したとき、組織が迅速に回復対応するか、それともオフラインになってデータ損失や財務的影響を受けるかは、準備によって決まります。災害から上手に回復したいのであれば、ディザスタリカバリ(DR)操作指示書は、DR戦略の不可欠な一部となります。
DR操作指示書は、テストやライブフェイルオーバーの実行時にDR環境の管理を簡素化するための、復旧プロセスとドキュメントの集合体です。これらの手順により、組織はタイムリーかつ効率的な方法で災害に対応し、ダウンタイムとデータ損失を最小限に抑えることができます。
DR操作指示書は、DRaaS(Disaster Recovery as a Service)プロバイダが、組織として完全なDRソリューションを構築し管理する際に使用するガイドでもあります。DRaaSプロバイダは、DR操作指示書が以下の3つのポイントに従っていることを強調しています:
●チームとDRaaSプロバイダの役割と責任を明確に定義する
●エスカレーションプロセスと手順の継続的な更新
●定期的にテストされたDRプロセス、段階的なリカバリー
以下の簡単な手順で、効果的なDR操作指示書の作成方法を、最初から最後まで説明します。
目次
ステップ1:重要なシステムとデータの特定
DR操作指示書の構築を開始するには、災害時に保護する必要がある重要なシステムとデータを特定します。これには、サーバ、データベース、アプリケーション、重要な文書、ビジネスの運営に必要なその他のシステム、顧客情報や財務記録などのビジネスクリティカルなデータなどが含まれます。
すべてのビジネスにおいて、ネットワークへの備えは、識別し管理することが重要なシステムです。最低限、以下のことがDR操作指示書に記録されていることを確認してください:
●現在使用されているサブネット範囲とIPアドレス
●ネットワークやインフラのユーザー名とパスワード
●ライセンス情報(キー、ログイン)
●ログインや変更が必要な重要なDNSレコードなど、ドメインレジストラやDNSレコードの管理に関する内容
ステップ2:ビジネスインパクト分析(BIA:Business Impact Analysis )の策定
重要なシステムとデータを特定したら、次はビジネスインパクト分析(BIA)の作成です。BIAは、災害がビジネスに与える潜在的な影響を概説する文書です。BIAでは、災害が発生する可能性、金銭的な影響、それらの影響を避けるために保護する必要のある重要なシステムやデータについて説明する必要があります。
ビジネスへの潜在的な影響を特定するために、次のような質問を確認してください:
●最も重要なアプリケーションは何か?
●そのアプリケーションを構成する仮想化インフラは何か。
●これらのアプリケーションの現在のサービスレベル契約(SLA)はどうなっているか?
どのアプリケーションが最も重要かを判断するために、アプリケーションを階層に分類することで検討します。例えば、ティア1アプリケーションはミッションクリティカル、ティア2アプリケーションは依然として重要だがティア1アプリケーションの後に優先されるべき、ティア3アプリケーションは重要だがビジネス機能にとって不可欠ではない、といったようになります。
ビジネスへの潜在的な影響を知るためのもう一つの指標は、総所有コスト(TCO)です。TCOとは、災害が発生し、アプリケーションがオフラインになった場合に想定される総額の影響です。
ステップ3:エスカレーションプランの策定
BIAが完了したら、エスカレーションプランの作成に着手します。エスカレーション・プランには、重要なシステムやデータの復旧手順、従業員、顧客、その他の関係者とのコミュニケーション、通常業務の再開など、災害発生時の対応方法が記載されています。
エスカレーションプランの確立は、DR戦略全体の不可欠な要素であり、適切な人が適切なタイミングで状況に対処できるようにするものです。エスカレーション・プランでは、自社とDRaaSプロバイダの間だけでなく、社内でも役割と責任を明確に定義します。
災害が発生した場合、影響を最小限に抑え、ダウンタイムを短縮するためには、迅速かつ効果的な意思決定が重要です。エスカレーションプランが守られないと、どのようなDRソリューションを導入していても、SLAに直接影響を与えることになります。
ステップ4:DRソリューションのテスト方法を決定する
エスカレーション・プランが完成したら、DRソリューションが期待通りに機能するかどうかを検証する必要があります。DRプランをテストすることで、潜在的な問題を特定し、災害が発生する前に必要な変更を行うことができます。
多くのDRaaSプロバイダは、DRテストを段階的に実施することを推奨しています。そうすることで、予想される回復ポイント目標(RPO)と回復時間目標(RTO)をベースラインとして設定することができます。
また、DRaaSプロバイダは、段階的なテストを行うことで、さまざまな変数を使用して、アプリケーションをグループ化して保護するための分類を行うことができます。強力なDRソリューションは、類似した機能を持つ仮想インスタンス(SQLサーバーやドメインネームサーバーのグループ化など)、または単一のアプリケーション(MySQLサーバーやWebサーバーなど)をグループ化して復旧します。これにより、ディザスタリカバリ時のアプリケーションの一貫性を確保することができます。
最後に、段階的なDRテストを行うことで、ネットワークトラフィックの過飽和を避けることができます。DR計画を立てる際には、フェイルオーバー・テストのために特別に隔離されたネットワークを作成することも検討ください。
フェイルオーバーテストのステップバイステップビュー機能があれば、災害時にDRソリューションがどのように機能するかについての強力な洞察を提供しますが、すべてのDRサービスがこの機能を備えているわけではありません。
ステップ5:DR操作指示書のレビューとアップデート
DR操作指示書を最新かつ効果的に保つには、定期的に見直し、更新し、テストする必要があります。これには、エスカレーションプランと連絡先リストの更新も含まれます。これらの情報が定期的に更新され、必要な株主に共有されていれば、RPOが数秒、RTOが数分という、ビジネスを手助けるディザスタリカバリを維持し、ダウンタイムを最小限に抑え、重要なデータを失わないようにすることができます。
最後に操作指示書でDR戦略を完成させる
DR操作指示書の作成は大変な作業に思えるかもしれませんが、以上のステップに従い、適切なDRaaSプロバイダを選択すれば、その必要はありません。DR操作指示書は、組織の災害対応を左右する重要なツールです。ここで説明したステップに従うことで、組織は、役割と責任を明確に定義し、潜在的な影響とそれを軽減する方法を定義し、定期的な更新とテストの計画を概説した包括的で効果的な災害復旧計画を策定することができます。このような準備を整えることで、組織はあらゆる災害から迅速かつ冷静に復旧することができるようになります。
関連トピックス
- Zertoを活用したディザスタリカバリ・テストのメリットについて
- Kasten K10 における Kubernetes のバックアップ、リカバリ、モビリティの扱い方法 (Kubernetesにおけるデータ保護)
- 災害復旧(ディザスタリカバリ)コスト:4つの主要要因とコスト削減方法
- RDSサーバ上のアプリケーション追加手順[Accops]
- CloudBerry BackupとAmazon EC2 を使用してのP2Vディザスタリ・リカバリーの設定方法
- パッチのアップデート通知機能について【Veeam Backup & Replication v8.x】
- AWSとZerto、組み合わせてできること[Zerto]
- AWS環境の最適化を達成するための3段階のステージ ~N2WS Backup & Recovery
- AWSにおけるN2WS Backup & Recoveryのポジショニング
- ZertoとExaGrid