Amazon Web Service(AWS)の RedshiftはPostgreSQLベースのデータウェアハウスであり、最低料金は 2 TB データウェアハウスの XL ノード 1 つで 1 時間あたり US$0.85という低価格です。DBMotoでは、PostgreSQLをターゲット(レプリケーション先)としてサポートしており、このRedshiftに対してリアルタイムに各DBのデータをロード(レプリケーション)することができます。これにより既存環境を並列して使用した状態でRedshiftに移行することも可能です。
図 システムCのみ先行してRedshiftに移行し、他のデータはDBMotoを使用してロード
実際にDBMotoのターゲットDBとして指定する方法ですが、まずAWSのコンソールのRedshiftのConfigurationタブからエンドポイント等の情報を取得します。
また、このときにDBMotoサーバがRedshiftへアクセスできるようにするため、Security GroupのCIDR/IP等も設定しておきます。
取得した情報をDBMotoのターゲット接続に設定します。接続設定は基本的にPostgreSQLの場合と同様です。
DBMotoからPostgreSQLへ接続するには・・・Npgsqlと外部接続の設定
※2014/12/22追記
現在のNpgsql最新版2.3にはRedshiftに接続ができない不具合がございます。
バージョン2.0.14.3のNpgsqlをダウンロードし、そちらをご利用いただきますよう、お願いいたします。
https://github.com/npgsql/npgsql/releases/tag/v2.0.14.3
ターゲットの接続ウィザードでServerにエンドポイント名、User、Password、Databaseにデータベース名を入力します。このときPostgreのポート番号はデフォルトで5432ですが、Redshiftのデフォルトは5439であるため、Portの項目も変更する必要があります。
これで登録は完了です。ターゲットDBとして各種DBからデータをレプリケーションできます。
関連したトピックス
- DBMotoからPostgreSQLへ接続するには・・・Npgsqlと外部接続の設定
- PostgreSQLに対してバルクインサートが可能に【DBMoto Ver8.5新機能①】
- ビッグデータ分析のためのデータウェアハウスAmazon Redshiftの特長と利点
- Amazon Web Service(EC2/RDS)へオンプレミス(自社)データべースをリアルタイムにレプリケーション[DBMoto]
- 進化するクエリと PostgreSQLの台頭:そのデータベー スパフォーマンス重要性
- Oracleトランザクションセットアップ例(Log ReaderまたはLog Server Agent)[Syniti Data Replication]
- PostgreSQLパフォーマンス・チューニング・ツール(クエリアナライザ付き) [DPA]
- SQL Server, IBM DB2 for iで使用するポート番号【リアルタイムレプリケーションツールDBMoto】
- データベースのバックアップはどのように業務を遂行しているかに依存する
- Azure Database for PostgreSQLを使い始めるにあたって
Amazon Redshiftに接続しビッグデータを活用、そして自社Webへチャート/レポート/ダッシュボードで展開するEspressReport ES等のEspressシリーズ:
http://www.climb.co.jp/blog_espress/archives/1169