データの損失、ビジネス・チャンスの損失、生産性の損失、そしてそれは最終的には資産の損失です。バックアップは多くの段階で失敗する可能性があり、リカバリは期待通りに進まないかもしれませんし、単純にインフラがリカバリ作業に対応できていないかもしれません。
このような事態を避けるためには、バックアップのテスト方法について総合的なプランを作成する必要があります。ここでは、バックアップされたデータがリカバリ可能であることを確認するための堅固なアクションプランを構築するのに役立ちます。
バックアップ・リストの作成
最初にすべてのバックアップの手順が文書化されていることを確認する必要があります。すでにシステム管理者がすべてのルーチンを把握しているにもかかわらず、なぜリストを作成する必要があるのでしょうか。理由は主に2つあります。
●バックアップを直接知っている人が不在だったり、会社を辞めてしまったりして、バックアップのインフラを完全に理解できないままになってしまう可能性があります。企業トップや新しいシステム管理者は、物事がどのように機能するかを理解するために何年も費やすことになります。言うまでもなく、災害時には、そのような知識の欠如が長時間のダウンタイムにつながります。
●どんなに優秀なプロであっても、事態がコントロールできなくなり、ストレスを感じるようになると、特定の技術的な詳細を間違えたり、忘れたりすることがあります。そこで、実行しているすべてのバックアップ、その種類、保持設定、バックアップやリカバリのプロセスに必要なハードウェアなどを含むリストを作成する必要があります。復旧時間と復旧ポイントの計算も忘れずに記載してください。これらは、後でバックアップをテストし、バックアップ計画が十分であるかどうかを評価するのに役立ちます。
バックアップとリカバリのテスト
先に述べたように、バックアップとリカバリは2つの異なるプロセスです。そして、ストレージからデータを取り戻す必要があるときに、何も問題が起こらないことを確認するために、両方をテストする必要があります。
バックアップのテスト
バックアップをテストする際には、バックアップが必要なインフラとデータのすべての部分のマップを作成する必要があります。ここでは、定期的に実施すべき基本的なチェック項目を紹介します。
●バックアップ・インフラのチェック:ローカルのバックアップ・インフラを使用している場合は、SMARTドライブとNASデバイスの健全性をチェックします。クラウドにバックアップしている場合は、すべてのファイルがストレージ内で一貫しているかどうかをチェックします。
●データの一貫性をチェック:バックアップ・ソリューションの中には、データの整合性を確保するために、マシン上とストレージ内のデータの整合性をチェックする機能を備えているものがあります。
●インフラのすべての部分がカバーされていることを確認:実行しているバックアップ・プランをすべてリストアップしましたが、もし重要なものを見逃していたらどうしますか?インフラを監査し、会社にとって重要なものがすべてバックアップされていることを確認してください。
●セキュリティ設定の確認:転送中および保存中のデータ暗号化は有効になっていますか?ファイル名を暗号化する必要がありますか?最後に、誰がバックアップストレージにアクセスできますか?経験則から言うと、アクセスポリシーには最小特権のルールを使うべきです。
リカバリ・テスト
ここでは、いつでも何でもリカバリできることを確認するために順守すべきテストとチェックの最も一般的なルールを紹介します。
●復旧時間(RTO)と復旧ポイント(RPO)の推定値に基づいてのテスト:これは、ダウンタイムが発生した場合に、どのくらいの速さでリカバリすべきか、どのくらいのデータを失っても大丈夫かを示すものです。これらのパラメータをまだ定義していない場合は、RTOとRPOを推定する方法についてのブログをご覧ください。
●テストの範囲を決める:リカバリ・テストを最も単純なものから最も要求の厳しいものへと分類し、それぞれを定期的にテストするようにします。シングル・ファイルのリカバリ、シングル・マシンまたはサーバー(インフラを含む、または含まない)、ネットワークとインフラの相互接続部分のリカバリ・テスト、そして最後に、様々なシナリオでのディザスター・リカバリのテストを行います。
●テストのスケジュールを決める:テストのスケジュールを決める理由は 2 つあります。まず、定期的にテストを行い、インフラのすべての変更に追いつくようにすることです。次に、テストが業務に影響を与えないようにするため、営業時間外にテストを実施する必要があります。
●すべてを文書化:これには、スケジュール、スコープ、正確なテストとその結果、RTO と RPO の見積もり、テストを実行する権限のある人、テストに関して通知する必要のある他のチームメンバーなどが含まれます。
結論
バックアップとリカバリのテストは、単なる日常的で退屈な演習ではありません。IT担当者にとってはあまり楽しいものではありませんが、災害や人為的なミス、障害が発生した場合に、インフラのすべての部分を取り戻すことができるように設計されています。そして、一部はオンプレミス、一部はクラウドベースで相互に接続された、複雑なインフラとネットワークを見てみると、この複雑さがどれほど脆弱であるかがすぐにわかるはずです。
優れたテスト環境を構築し、ビジネスに不可欠なものをすべてカバーしていることを確認することで、夜によく眠れることができるのです