データレプリケーションは、アクセスに関する問題を緩和し、災害に備えることができます。詳しいメリットについてはこちらをご覧ください。
2020年のリモートワークへの移行は、多くの企業の事業運営に大きな変化をもたらしました。社員が地域や世界に散らばるようになり、ITチームはさまざまな場所でのデータアクセスをサポートしなければならなくなりました。
複数の拠点からデータにアクセスすることは、多くの作業者にとって面倒で非効率的です。しかし、データレプリケーションを導入した企業では、可用性とアクセシビリティが大幅に改善されます。 また、クラウド上でアプリケーションを実行することで、いつでもどこでもデータを利用できるという柔軟性も、分散したチームには大きなメリットとなります。
目次
データレプリケーションとは?
データのレプリケーションは、データのコピーを作成し、オフサイトやクラウドなど、複数の場所に保存するプロセスです。前述したように、データの複製は、地理的に分散した作業環境にあるチームメンバーが同じデータにアクセスし、そのデータに加えられたすべての変更がシステム間で共通であることを保証する効率的な方法でもあります。
また、レプリケーションはデータの信頼性と回復力を高めるため、ディザスタリカバリの取り組みにおいて重要な機能となっています。データのレプリケーションは、予期せぬ障害やサイバー攻撃の際のデータ損失から組織を保護することができます。データの複数のコピーをバックアップすることで、運用とITシステムの稼働を保証し、コンプライアンスとサービスレベル合意(SLA)要件に抵触するリスクを最小限に抑えることができます。
お客様のビジネスニーズに応じて、以下のような複数の方法でデータを複製することができます。
・クラウドホストとの双方向のやり取り
・オンプレミスホスト間
・異なる場所にあるホスト間
・同一ホスト上のストレージデバイスを分離する場合
データレプリケーションの種類
データレプリケーションにはいくつかの種類があり、それぞれ特定のデータ環境に最適なものがあります。これらのタイプは以下の通りです。
・フルテーブル:ジョブが実行されるたびに、テーブルのすべての行がレプリケートされます。キーベースの増分レプリケーションが実行できない場合に最適です。
・キーベースの増分:レプリケーションキー(ソーステーブル)により、テーブル内のどのデータをレプリケートするかを特定します。修正タイムスタンプのカラムを含むテーブルに最適です。
・マージ:双方向レプリケーションを使用し、2つ以上のデータベースからの変更を1つの更新されたデータベースに統合します。サーバー・ツー・クライアント環境での使用に最適です。
・スナップショット:複数のサーバーに分散されたデータベースをポイントインタイムでレプリケートする。変更頻度の少ないデータベースに最適です。
・トランザクショナル:データベース間でほぼリアルタイムにレプリケーションとディストリビューションを自動化します。変更が予測可能で、かつ頻繁でない環境に最適です。
データレプリケーションのメリット
データは常に変化しているため、複数の人が異なるサーバーから「同じ」データを取り出した場合、品質に問題が生じる可能性があります。また、システム障害発生時には、データの不整合や古いデータが復旧の妨げになることもあります。データレプリケーションは、これらの領域でいかに優雅にデータを共有し、セキュリティを確保するかに不可欠な役割を担っています。
ディザスタリカバリ
ディザスタリカバリとは、技術的な障害や自然災害、その他の障害発生後にITサービスやシステムを復旧させるプロセスのことである。災害時に失われるデータの量は、バックアップの品質に左右されるため、データの複製は災害復旧の成功に欠かせない要素です。
サイバーレジリエンス
災害復旧と同様に、サイバーレジリエンスも計画外の障害によって真価を問われることになります。しかし、災害復旧とは異なり、サイバーレジリエンスは、ダウンタイムやデータの損失をほとんど伴わずに、その事象に総合的に対応し、回復する能力がどれだけ備わっているかによって評価されます。
アクセシビリティ
今日のビジネスは、地理的な制約を受けることはありません。複数の拠点、あるいは複数の国に支店を持つ組織も珍しくありません。そのため、すべての拠点の従業員が、正確なビジネス・データに確実にアクセスできることが必要です。データのレプリケーションは、各ユーザーの近くにデータのコピーを置くことで、全員が同じバージョンを使用でき、レイテンシーが問題になることも少なくなります。
サーバーの性能
組織のデータのコピーを複数のサーバーに配置することで、帯域幅と容量への負担を軽減することができます。サーバーに負荷がかからなければ、ユーザーは効率的な作業に必要なデータに素早くアクセスできるようになります。
データレプリケーションの課題
データレプリケーションは必要不可欠なビジネスプロセスですが、だからといって課題がないわけではありません。組織が導入に苦労しがちな部分がいくつかあります。
コスト
データのレプリケーションを行うには、処理能力、ネットワーク容量、ストレージ容量を増やす必要があり、多くの予算が限られている現在、これらはすべて追加的な費用となります。しかし、レプリケーションは比較的短期間で大きなROIをもたらすため、この課題は一般に短期間で解決されます。それに比べ、ホールセール移行は、より多くのリソースを消費し、効果が現れるまでの期間も長くなります。
取り組み
データレプリケーションのプロセスでは、更新、監視、定期的なテストなど、ITによる監視が必要です。世界的な技術者不足と、多くのITチームの過度な拡張のために、このプロジェクトにスタッフを割くことは難しいかもしれません。
整合性
データのコピーを必要とする場所が多ければ多いほど、整合性を維持することは難しくなります。分散した多くのオフィス間でデータを更新し、整合性を保つことは、複雑さを増し、リスクを増大させます。
データレプリケーションプロセスの価値を最大限に引き出す
データのレプリケーションは、すべてのサーバーでコピーが同一である場合にのみ有効です。レプリケーション・プロセスで正確なコピーを作成し、保存することを確実にするために、プロセスは一貫して所定のステップに従う必要があります。たとえば、次のような場合です。
・ソースコネクションの定義
・トランザクションログ設定の定義
・ターゲットコネクションの定義
・ターゲットテーブルの作成
・レプリケーションのソースログ、マップ、スケジュールの作成
・レプリケーションの実行
・結果の確認と管理
このステップを守ることで、ビジネスクリティカルなデータの正確なレプリカが作成され、地理的に離れた場所でも使用でき、セキュリティイベントや他のシステム障害の後でもシステムを復元することができます。
データレプリケーションを手動で行う場合、時間がかかるだけでなく、キー操作のミスなどのエラーが発生しやすいです。データレプリケーションのプロセスをすべてのステップに則って確実に行うには、データレプリケーションソフトウェアを活用するのが最も効果的です。
Syniti Data Replicationの詳細については、こちらをご覧ください。
関連したトピックス
- データレプリケーションソリューションに求められる9つのポイント
- DBMotoからSyniti Data Replicationへのアップグレード方法
- データ分析基盤へもSyniti Data Replication(旧DBMoto)で簡単レプリケーション! Google BigQueryへの接続方法
- Webセミナー録画 『多種DBからKafka、Hadoop、S3への対応 データ統合/分析基盤へ簡単連携!』2019/12/10 開催
- Syniti Data Replication (DBMoto) の監視方法について
- Syniti Data Replication 新機能ブログ② Amazon S3へのレプリケーション対応
- Syniti Data ReplicationにおけるDb2 LUWへのバルクミラーリングについて
- [DBMoto]API(C#, VB, C++)の開発環境構築手順 ~APIを使用してバッチからジョブを制御~
- RDS PostgreSQLからの差分セットアップ【Syniti DR 9.6】
- Syniti Data Replication: OracleからKafka StreamsへのCDC(Change Data Capture)方法