クラウド・バックアップ
フェイルオーバーとフェイルバックは、予期せぬ障害が発生した場合でもITシステムの回復力を確保する、事業継続における2つの重要な概念です。 ビジネスが中断のない運用にますます依存するようになるにつれ、高可用性を維持し、ダウンタイムを削減するためには、この2つのプロセスを理解することが不可欠です。
このガイドでは、フェイルオーバーとフェイルバックが連携してシステムを保護する方法、実際の使用例、そしてビジネスニーズに合わせてこれらのメカニズムを実装する方法について説明します。
フェイルオーバーとは?
フェイルオーバーとは、プライマリシステムに障害が発生した際に、冗長システムまたはスタンバイシステムにシームレスに切り替えることを指します。 バックアップ環境に自動的に切り替えることで、ダウンタイムを最小限に抑え、サービスの可用性を維持するように設計されています。 パンクした際に備えてスペアタイヤを用意しておくようなものです。
フェイルオーバーの目的は、問題が発生した場合でも、業務を円滑に継続することです。SAN、NAS、ネットワークの世界では、複製されたストレージシステムへの切り替え、バックアップサーバーの起動、ネットワークトラフィックの再ルーティングなどがこれに該当します。
フェイルオーバーの仕組み
フェイルオーバーは、プライマリシステムを継続的に監視し、障害の兆候を検出します。この監視には、ハートビート信号、健全性チェック、その他の診断テストが含まれます。障害が検出されると、フェイルオーバーシステムが自動的にセカンダリシステムへの切り替えを開始します。
このプロセスは通常、以下のステップで構成されます。
- 検出:システムがプライマリシステム内の障害を特定します。
- 起動:セカンダリシステムが起動し、オンラインになります。
- リダイレクト:トラフィックと操作がセカンダリシステムにリダイレクトされます。
- 検証:フェイルオーバーが検証され、セカンダリシステムが正常に機能していることが確認されます。
例えば、クラスタ化されたサーバー環境では、1台のサーバーが故障した場合、クラスタ内の他のサーバーが自動的にその負荷を引き継ぎ、アプリケーションとサービスが引き続き利用可能になります。これがフェイルオーバーの仕組みです。
最新の導入事例では、同期レプリケーションや10秒間隔でシステム指標を監視する自動ヘルスチェックなどの先進技術により、フェイルオーバー時間を1分未満に短縮している例が多く見られます。
フェールオーバーおよびフェールバック導入のメリット
フェールオーバーおよびフェールバックを導入することで、企業には以下のような重要なメリットがもたらされます。
- ダウンタイムの削減:システム障害が業務に及ぼす影響を最小限に抑え、重要なサービスの継続的な可用性を確保します。
- データ保護:データを二次システムに複製することで、停電時のデータの損失や破損を防ぎます。
- 信頼性の向上:冗長システムと自動リカバリプロセスを提供することで、ITインフラの全体的な信頼性と回復力を強化します。
これらのメリットは、顧客満足度の向上、収益損失の削減、業務効率の改善など、具体的なビジネス成果につながります。例えば、フェールオーバーとフェールバックを導入したeコマースサイトでは、プライマリサーバーが故障した場合でも顧客が引き続き購入を続けられるため、販売機会の損失を防ぎ、顧客の信頼を維持することができます。
フェールオーバーとフェールバックのベストプラクティス
フェールオーバーとフェールバックを効果的に導入するには、以下のベストプラクティスを考慮してください。
- 定期的なテスト:フェールオーバーとフェールバックのテストを定期的に実施し、システムが正常に機能していること、およびリカバリープロセスが適切に文書化され理解されていることを確認します。
- 自動化されたプロセス:フェールオーバーとフェールバックのプロセスを可能な限り自動化し、手動による介入を減らし、エラーのリスクを最小限に抑えます。
- 包括的なモニタリング:すべての重要なシステムを包括的にモニタリングし、障害を迅速に検知してフェールオーバー手順を開始します。
- 詳細な文書化:フェイルオーバーおよびフェイルバックのプロセスについて、手順、構成、連絡先情報などを含む詳細な文書を作成しておく。
- データの同期:プライマリシステムとセカンダリシステム間のデータの同期が信頼性が高く効率的であることを確認し、フェイルオーバーおよびフェイルバック時のデータ損失を防ぐ。
これらのベストプラクティスに従うことで、企業はフェイルオーバーおよびフェイルバック戦略の効果を最大限に高め、あらゆる潜在的な混乱に備えることができます。
結論
効果的な災害復旧は、今日のデジタル環境における事業継続性を維持するために不可欠です。フェイルオーバーとフェイルバックのメカニズムは、ダウンタイムの短縮、データの完全性の確保、障害発生時のサービス継続の鍵となります。定期的なテスト、自動復旧、適切な文書化などのベストプラクティスに従うことで、企業はITインフラを強化し、ハードウェアやソフトウェアの障害発生時にデータ損失を回避または完全に最小化することができます。
Azureバックアップ
バックアップとDRのワークフローを効率的かつ費用対効果の高いものにするために、その機能、長所、短所、考慮すべき点は:
●ライフサイクルポリシーを使用して経費を節約: 古いバックアップをAmazon S3 Glacierのような安価なストレージ・オプションに移動するライフサイクル・ポリシーを設定する。これにより、ストレージ・コストを大幅に節約できます。
●異なる地域とアカウントにバックアップする: バックアップを異なるAWSリージョンやアカウントにコピーすることで、ディザスタリカバリプランをより強固なものにする。これにより、リージョン固有の問題やセキュリティの問題からデータを保護できます。
●RTOを減らすためにバックアップを自動化する: AWS Backupを使ってバックアップ間隔を頻繁に設定しましょう。1時間ごと、あるいは数分ごとにバックアップを自動化することで、データを迅速に復旧し、ダウンタイムを最小限に抑えることができます。
●リソースのタグ付けによる容易な管理: タグを使用すると、関連するバックアップをすばやく識別してグループ化できるため、バックアップの管理やコストの監視が容易になります。また、レポートやコンプライアンスチェックも簡素化できます。
●ディザスタリカバリプランを定期的にテストします: DR訓練を自動化し、バックアップとリカバリのプロセスをチェックします。バックアップが機能し、データを迅速にリストアできることを確認し、潜在的な問題を発見して修正しましょう。
AWSコスト
●アーカイブ前にデータの分類を優先:すべてのスナップショットが同じように重要であるわけではありません。 コンプライアンスやDRなどの重要なスナップショットと、より長い検索時間を許容できるスナップショットを区別するために、堅牢なデータ分類ポリシーを導入します。
●アーカイブからの取得に関するSLAをDR計画に統合:GlacierまたはDeep Archiveにスナップショットをアーカイブした場合、取得に数分から数時間かかる場合があります。 災害復旧(DR)計画では、こうした取得SLAを考慮して、予期せぬ遅延を回避する必要があります。
●S3 Object Lockを使用して保持の徹底を自動化:S3 Object Lockを使用して重要なスナップショットの不変性を徹底し、早期の削除を防止して、規制へのコンプライアンスを確保します。 また、誤ってまたは悪意を持って削除されることも防ぎます。
●重要アーカイブスナップショットには、クロスリージョンレプリケーションを活用:スナップショットをアーカイブする前に、クロスリージョンレプリケーション(CRR)を有効にします。これにより、リージョンがダウンした場合でも、アーカイブされたデータは別のリージョンで利用可能になります。
●AWS Cost Explorer を使用して定期的にコスト監査を実施する:S3 GlacierとDeep Archiveはコスト削減をもたらしますが、これらは長期間にわたって気づかぬうちに蓄積される可能性があります。AWS Cost Explorerを使用して定期的にアーカイブコストを監査し、スナップショットのライフサイクルポリシーが最適化されていることを確認してください。
Azureバックアップ
●コスト管理にスナップショットのライフサイクルポリシーを活用:より古いスナップショットを低コストのストレージ層に移行することで、リカバリ性を損なうことなくコストを削減できます。
●代替案としてアプリケーション認識型レプリケーションを検討する:バックアップが大きなオーバーヘッドをもたらすようなシナリオでは、重要なワークロードをリアルタイムで同期し、一貫性を保証するアプリケーション認識型レプリケーションソリューションを評価します。
●バックアップ用にリードレプリカを実装する:データベースの場合、リードレプリカを作成し、そのレプリカに対してアプリケーション一貫性のあるバックアップを実行することを検討します。これにより、バックアップ中のプライマリデータベースのパフォーマンスへの影響を回避できます。
●テスト環境でバックアップをテストする:サンドボックス環境を使用して、本番環境のワークロードに影響を与えることなく、アプリケーション整合性のあるバックアップをテストします。自動化ツールを使用すると、障害をシミュレートし、リカバリ時間を検証することができます。
●変更不可ストレージでリカバリを強化する:Azureで変更不可のバックアップを設定することで、誤って削除したりランサムウェアの被害に遭うことを防ぎます。アプリケーション整合性と組み合わせることで、悪意のあるデータ損失や誤操作によるデータ損失の両方のシナリオにおいて、リカバリの整合性を確保することができます。
AWSとN2WS
●ハイブリッドストレージ戦略で取得コストを最適化:S3 GlacierをS3 StandardまたはS3 Intelligent-Tieringと組み合わせます。 頻繁にアクセスされるデータはStandard/Intelligent-Tieringに残し、長期にわたってアクセス頻度の低いデータをGlacierに移行します。 これにより、より重要なデータへの迅速なアクセスを確保しながら、ストレージコストを大幅に最適化できます。
●S3 Object Lock を活用して変更不可のバックアップを作成:S3 Object Lock を Glacier と組み合わせて使用することで、変更不可のバックアップを作成できます。これにより、重要なバックアップに WORM(Write Once Read Many)モデルを適用することで、誤って削除されたりランサムウェア攻撃を受けたりした場合でも、お客様のデータを確実に保護することができます。
●大きなファイルにはマルチパートアップロードを使用: 大きなアーカイブには、Glacierのマルチパートアップロード機能を使用します。 アップロードの効率が向上するだけでなく、管理しやすい小さな部分に分割してファイルをアップロードすることで、アップロードの失敗リスクを低減し、データの整合性を確保できます。
●DRには地域間レプリケーションを実装: 地域間レプリケーションを設定して、AWSの1つのリージョンから別のリージョンにデータを自動的に複製します。これは、地域的な障害が発生した場合に、重要なデータのコピーが常に別の地理的場所で利用可能であることを保証するため、災害復旧に不可欠です。
●異なるデータセットごとのカスタム取得プラン:異なるデータセットのビジネス上の重要度に基づいて、カスタム取得プランを定義します。例えば、優先度の高いデータについては迅速な取得、重要度は低いがサイズの大きいデータセットについては一括取得などです。これにより、コストのバランスを調整し、重要な情報が迅速に利用可能であることを保証します。
●詳細はこちらまで
クラウド・バックアップ
N2WSは、DR戦略の有効性を高めながら、ディザスタリカバリのコストを大幅に削減します:
- 複数のリージョン、アカウント、クラウドにまたがるDRを自動化します: 自動化されたクロスリージョン、クロスアカウント、クロスクラウド機能により、ディザスタリカバリを簡素化し、安全性を確保します。
- DRテストと訓練の実行と自動化: ゼロコストで自動化されたDRドライランにより、ディザスタリカバリのテストを簡単に実施し、万全の準備を整えることができます。
- リカバリシナリオによるフェイルオーバーのオーケストレーション: ワンクリックで複数のリソースのフェイルオーバーを管理し、復旧作業を効率化します。
- 暗号化リソースのサポート: 暗号化されたリソースのクロスリージョンおよびクロスアカウントDRを実現し、セキュリティのレイヤーを追加します。
- カスタムDR生成によるコスト削減 N2WSのカスタムDR生成オプションにより、ディザスタリカバリコストを削減します。
- イミュータブルバックアップでセキュリティを強化 DRバックアップを不変性で保護し、データの整合性を確保します。
- 頻繁なバックアップ 最短60秒間隔でバックアップを取得し、RPOを最小化します。
- ほぼゼロのRTOを達成: 重要なシステムを数秒で復旧し、業務への影響を最小限に抑えます。
- フェイルオーバーとフェイルバックの自動化 リカバリプロセスを自動化することで、ダウンタイムを短縮し、一貫した信頼性の高い結果を保証します。
- 完全に機能するDRバックアップのリストア: すべてのVPCとネットワーク設定をそのままにバックアップをリストアし、シームレスなリカバリを実現します。
クラウド・バックアップ
1. 誤って削除した場合
ユーザを削除すると、その意図の有無にかかわらず、その削除はビジネスアカウントとメールボックスの削除とともにネットワーク全体に複製されます。Microsoft 365 に含まれるネイティブのごみ箱とバージョン履歴では、データ損失の保護に限界があります。バックアップからの単純なリカバリは、Microsoft 365がデータを永久に削除した後、あるいは保持期間が過ぎた後に大きな問題に変わる可能性があります。
2. 保持ポリシーのギャップと混乱
保持ポリシーを含め、継続的に進化するポリシーは、管理はおろか、対応することも困難です。Microsoft 365のバックアップと保持ポリシーは限定的であり、状況に応じたデータ損失しか管理できず、包括的なバックアップソリューションとして意図されていいません。
3. 内部セキュリティの脅威
一般的にセキュリティの脅威というと、ハッカーやウイルスを思い浮かべます。しかし、企業は内部からの脅威を経験しており、それは想像以上に頻繁に起こっています。企業は、意図的であれ無意識であれ、自社の従業員による脅威の犠牲になっています。ファイルや連絡先へのアクセスはすぐに変更されるため、最も信頼してインストールしたファイルから目を離すことは困難です。マイクロソフトは、通常のユーザと、退職前に会社の重要なデータを削除しようとする解雇された従業員との違いを知る術がありません。さらに、ユーザは感染したファイルをダウンロードしたり、信頼できると思っていたサイトに誤ってユーザ名やパスワードを流出させたりすることで、知らず知らずのうちに深刻な脅威を作り出しています。
4. 外部からのセキュリティ脅威
ランサムウェアのようなマルウェアやウイルスは、世界中の企業に多大な損害を与えている。企業の評判だけでなく、社内データや顧客データのプライバシーやセキュリティも危険にさらされています。外部からの脅威は、電子メールや添付ファイルを通して忍び込む可能性があり、特に感染したメッセージが非常に説得力があるように見える場合、どのような点に注意すべきかをユーザに教育するだけでは必ずしも十分ではありません。定期的なバックアップは、感染していないデータの別コピーを確保し、データの復旧をより確実かつ簡単にするのに役立ちます。
5. 法的およびコンプライアンス要件
法的措置が取られる中で、不意に電子メールやファイル、その他の種類のデータを復元する必要が生じることがあります。マイクロソフトはいくつかのセーフティネット(訴訟ホールドとリテンション)を組み込んでいますが、これらはユーザ企業を法的トラブルから守る強固なバックアップソリューションではありません。法的要件、コンプライアンス要件、アクセス規制は業界や国によって異なり、罰金、罰則、法的紛争はどの企業も遭遇したくないものです。
株式会社クライムではMicrosoft 365ユーザのデータを保護を手助けする多くのソリューションを提供しています。
クラウドバックアップの社会的通念
誤り:ほとんどのソリューションでできることは限られていますが、バックアップやアーカイブ以上の機能を持つツールもあります。次のような高度な機能を提供するソリューションもあります:
●eDiscoveryとジャーナリングオプション
●高速検索機能
●保存およびアーカイブされたデータからのビジネス洞察と分析
クラウドバックアップについて迷いがありましたらクライムまでお問合せください。
クラウドバックアップの社会的通念
誤り:それは非効率な場合だけです。洗練されたバックアップ・アーカイブソリューションは、最近更新または追加されたファイルを優先的にバックアップし、プロセス全体を高速化します。これにより、プロセスが迅速化され、データが完全に安全にバックアップされます。
クラウドバックアップの社会的通念
誤り:データを人質に取らないソリューションもあります。重要なアドバイス:適切なソリューションを選択する際には、他のソリューションやサービスに移行する際にデータを取り戻すための費用が発生するかどうかをプロバイダーに確認してください。
クラウドバックアップの社会的通念
誤り:むしろ、下記のこれらが真実です:
市場に出回っているソリューションの多くは、UXデザインが貧弱で、使い勝手が悪い。
これらのソリューションの多くは、エージェントとしてダウンロードしなければ動作しない。
バックアップとアーカイブは別物であり、ほとんどのベンダーは一緒に提供していない。
多くのソリューションはモジュールとして販売されており、非常にコストがかかる。
バックアップとアーカイブのソリューションのうち、保存やアーカイブされたデータに基づく洞察や分析を提供するものはごく少数である。
さらに、ほとんどのソリューションは、カレンダーやタスクなど、すべてをバックアップしているわけではない。