AWS re:Invent2024でベールを脱いだAWSストレージ・イノベーション


昨年12月に開催されたAWS re:Inventで最も注目を集めたのは、機械学習とAIに関連するイノベーションでした。例えば、全面的に改良されたSageMaker、Novaと呼ばれる新世代の基礎モデル、AmazonのジェネレーティブAIアプリケーション作成用プラットフォームであるBedrockの機能アップデートの数々などです。

しかし、Amazonがre:Inventでクラウドストレージの分野におけるいくつかの主要なアップデートも初公開しました。ストレージはAIほど流行している分野ではありませんが、re:Inventのストレージに関する発表についても、興味を引く理由がたくさんあります。

re:Inventの期間中(またはその直後)に発表された、クラウドストレージのゲームを変えるかもしれないイノベーションについて、クラウドでのデータ管理と保護を重視する方にとってなぜそれらが重要なのかを説明します。

Amazon S3 Table機能

S3オブジェクトストレージサービスは、従来、特定のタイプの使用事例にはあまり適した選択肢ではありませんでした。特に、データ分析が挙げられます。S3は、もともと大容量のデータを低コストで、高い拡張性をもって保存する方法として設計されました。しかし、従来のS3バケットはデータを特定の方法で整理しないため、分析作業の一部としてデータを迅速に解析するには最適ではありません。

re:Inventで発表されたS3テーブル機能により、この状況は変わります。このテーブル機能は、S3上で構成可能な新しいタイプのバケットを作成します。汎用S3バケットとは異なり、Amazonの表現を借りれば、テーブルバケットは「分析用データベース」として機能します。テーブルバケットを使用して表形式のデータ(購入取引記録やユーザログインイベントなど)をホストする場合、クエリが高速化されます。Amazonによると、Amazonがホストするクエリーエンジンを使用する場合、クエリーの速度は最大3倍速くなるということです(S3データを分析するサードパーティツールを使用する顧客のクエリーパフォーマンスがどの程度向上するかについては言及していません)。また、標準のS3バケットと同等のスケーラビリティと信頼性も維持されます。

S3を分析用に最適化することで、TablesはAmazonクラウドのオブジェクトストレージの用途に、興味深い新しい可能性の扉を開きました。S3バケットは、特定の方法で整理されていない大量のデータを単に保存する便利な場所ではなくなり、迅速かつ大規模に分析する必要がある表形式のデータをホストする場所としても利用できるようになりました。

Amazon S3ストレージブラウザ

AmazonはS3の新たな利用事例を公開しました。同社は「ストレージブラウザ(Storage Browser)」を発表しました。これは、エンドユーザがS3バケットにホストされたデータを閲覧できるようにするものです。ストレージブラウザは、開発者がアプリケーションに組み込むことができるオープンソースのインターフェースコンポーネントとして機能します。このコンポーネントを導入すると、承認されたアプリケーションユーザに対してS3バケットの内容が公開されます。開発者は、S3データを読み取り専用モードで閲覧できるように設定することができます。また、必要に応じて、ユーザのアップロード、ダウンロード、コピー、削除の権限を設定することも可能です。

以前からこのような機能の構築は可能でしたが、サードパーティによるS3ストレージバケットの閲覧を可能にするには、開発者が独自のコードを実装する必要があったため、多くの労力を要しました。しかし現在では、開発者は簡単にこの機能をアプリケーションに追加することができます。

もちろん、すべてのS3バケットが、開発者がエンドユーザに閲覧や修正を許可したいようなデータをホストしているわけではありません。しかし、この目的に適うS3データを簡単に公開できるようにすることで、Amazonは、S3バケットを社内データの保存場所としてだけでなく、顧客が直接アクセスする必要のあるデータも保存できる場所として考えるよう、企業に促そうとしています。

ストレージに最適化された新しいEC2インスタンス

膨大なデータを効率的に処理したいユーザにとって、さらに嬉しいニュースがあります。Amazonは、新世代のストレージ最適化EC2インスタンスであるI7ieを発表しました。Amazonによると、旧世代のI3enインスタンスと比較して、I7ieクラスはI/Oレイテンシを50%削減し、リアルタイムのストレージパフォーマンスを65%向上させます。

また、同社は、ストレージ最適化インスタンスの新世代では価格性能比が20%向上するとしていますが、その計算方法の詳細はまだ明らかにしていません。

新しいインスタンスタイプは、高性能なローカルストレージを備えたクラウドサーバーを作成する必要がある場合に、非常に有益なニュースです。今回のアップデートは、I/O集約型の分析などのワークロードを簡素化するもう一歩となるでしょう。

EBSの時間ベースのスナップショット

Amazon Elastic Block Storage(EBS)にデータを保存している場合、データのバックアップ方法としてEBSスナップショットを作成することができます。EBSスナップショットの生成には予想以上の時間がかかる場合もあります。このような場合、スナップショットが完了するまでにデータが古くなりすぎて、RPO(Recovery Point Objective)の目的に合わなくなるため、RPOの目標を達成できなくなる可能性があります。

Amazonの新しい時間ベースのEBSスナップショットコピー機能(re:Inventが始まる数日前に発表された)により、スナップショットが時間内に完了するかどうかを祈る必要はなくなりました。代わりに、スナップショットを開始する前に、完了までの希望する期間を指定することができます。Amazonは、現在のスループット率を追跡することで、要求された期間が実現可能かどうかを自動的に判断します。

この機能は、EBSスナップショットを望む通りに素早く作成できるというものではありません。しかし、スナップショット処理を開始する前に完了時間を計算することで、スナップショットが予想よりも早く完了してしまうという事態を防ぐことができます。この新機能により、計画したスナップショットの所要時間が実際に達成可能であるという確信が持てるようになります。

FSxインテリジェント・ストレージ・ティアリング

Amazon FSxは、クラウド内にファイルシステムを作成できるクラウドストレージサービスです。Windows File ServerやOpenZFSなど、企業がネットワーク上でデータを共有するために一般的に使用する複数のファイルシステムタイプをサポートしています。

FSxは、NFSやSMBなどの従来のネットワーク共有ファイルプロトコルに付加を加えたものです。独自のネットワーク接続型ファイル共有をセットアップして管理する代わりに、FSx経由でクラウドにデータを保存し、標準のネットワーク接続型ストレージアプリケーションを使用して、オンプレミスまたはクラウドベースのエンドポイントからクラウドに接続することができます。

従来、FSxデータは高性能ソリッドステートドライブ(SSD)を使用してホスティングされていました。これは、ネットワーク接続型ファイルシステムで高いI/Oレートを実現したい企業にとっては素晴らしいものでした。しかし、ファイルシステム形式でコスト効率の高い汎用ストレージを求める企業にとっては、それほど素晴らしいものではありませんでした。

インテリジェント・ティアリングが実際にコスト削減につながるかどうかは議論がありますが、Amazonクラウドを使用した低コストのネットワーク接続ストレージが選択肢のひとつとして登場したことは事実です。Amazonは、この新機能(現時点ではFSxのOpenZFSバージョンにのみ対応)を使用したストレージの価格を、従来のFSxストレージよりも85%も低く設定しています。さらに、この新機能では、データのアクセス頻度に応じて、自動的に異なるストレージ階層にデータを循環させるため、ストレージ階層を手動で管理する必要がありません。

FSxは、他のAWSストレージサービス(S3など)ほど広く使用されているわけではありませんが、従来のネットワーク接続ストレージで簡単にデータにアクセスできるようにしたいが、SSDインフラストラクチャに伴う割高な価格設定を避けたい方にとっては、FSxのこの新しいストレージオプションは非常に有益である可能性があります。

AWS対応ソリューション 移行・データ保護 特集

関連トピックス:
カテゴリー: AWS, クラウド・仮想インフラ タグ: , , , , , , , , パーマリンク

コメントを残す

メールアドレスが公開されることはありません。 が付いている欄は必須項目です

 

このサイトはスパムを低減するために Akismet を使っています。コメントデータの処理方法の詳細はこちらをご覧ください

この記事のトラックバック用URL