皆さま、お久しぶりです!FIXER ヘルスケア・イノベーション領域の千賀です!
今年の AWS re:Invent 2023 がラスベガスでいよいよ始まりました。
Amazon S3 Standard ストレージクラスより最大10倍高速という「Amazon S3 Express One Zone」ストレージクラスが基調講演(キーノート)の中で発表され、東京リージョンでもGA(General Availability - 一般公開)されましたので、早速お伝えしたいと思います。
これまで、データ分析やMLで S3 を既に利用していらっしゃる方々、レイテンシーが気になって EBS を使っていらっしゃった方々に朗報です!1桁ミリ秒という極めて低いレイテンシーでアクセスできる、新しい S3 のサービス「Amazon S3 Express One Zone」の登場です。
Amazon S3 Express One Zoneの特長
とっても速い!
- 一貫した1桁ミリ秒という低レイテンシで毎秒数十万のリクエストを処理可能
- 低レイテンシのため、特に小さなオブジェクトは S3 Standard より最大10倍速く読取り可能
インフラコストが下がる!
アクセスが速くコンピューティングリソースの稼働時間を減らせるため S3 Standard よりも50%安い
→ ストレージのコストがそのものが今までより安いということではなく、EMRやRedshift、SageMakerなどのデータ待ち時間短縮 → 全体の処理時間が短くなる → インスタンスの稼働時間が短縮 → 課金が安くなる、ということです。
可用性は注意が必要!
オブジェクトは単一のAZ内の専用ハードウェアに保存
→ 高速化のため、単一AZ内にデータが保存されますので、そのAZが火災等で失われた場合にはデータを消失する可能性があります。SLAは 99.9% です。
対応するAWSサービス
Amazon EMR、Amazon Redshift、Amazon SageMaker、Amazon Bedrock などの AWS サービスから利用することができます。
データ分析系ですね。Bedrock が対応しているということなので、LLM にも使ってみたいところです。
Mountpoint for Amazon S3 にも対応しているようなので、クライアント端末からのアクセスもこれまで通り可能ですね。
最適なユースケース
AI/MLトレーニング、金融モデリング、メディア処理、リアルタイム広告配信、ハイパフォーマンスコンピューティングなど、頻繁にアクセスされるデータや最も要求の厳しいアプリケーションに最適と説明されている通り、いわゆるクラウドネイティブなアーキテクチャに向いていそうです。
スループットについての言及は今のところ見当たりませんが、レイテンシーが極めて小さくなるため、大量に小さなサイズのデータがある場合の並列分散処理に向いていると思われます。同時アクセスについても毎秒数十万リクエストに対応しているとのことですので、そういったユースケースで、今までレイテンシーが気になって EBS を EC2 にマウントして処理していたといったような場合に、直接 S3 上に置いて高速で並列処理するということができるようになりそうです。
処理時間が短縮され、これまでより早く結果を得ることができるとともに、コンピューティングリソースの稼働時間を減らしてコストを低減することができます。非常に大量のコンピューティングリソース(とコスト)が必要となるLLMにも向いているように思います。
但し、単一AZにデータが保存される(マルチAZ構成にできない)ため、現実にはめったなことでは起こらないと思いますが、利用しているAZに大規模な災害等が発生した場合にはデータが失われる可能性があります(ホストやラックレベルの障害については99.999999999%の可用性で設計されています)。ミッションクリティカルな基盤というよりも、データ分析を素早く実施したいといった場合に利用に向いているかもしれません。
もしミッションクリティカルな基盤に利用したい場合や、SaaSの基盤などとして利用する場合には、オリジナルのデータを S3 Standard にマルチAZ構成で保存しておき、そこから S3 Express One Zone に複製して利用するのが良いと思います!
公式アナウンスの中でもキャッシュソリューションが不要になるという言及もありましたので、S3 Express One Zone をキャッシュとして利用するというユースケースもありそうですね。
アプリケーション開発者向け留意事項
- 「ディレクトリバケット」という新しいバケットタイプとなります。
- 名前付けが階層構造となり、パスは "/" で区切られる必要があります。
- CreateSession がバケットに対する5分間のアクセス権を許可するセッショントークンを返す、新しい認証方式となりますので、最新の AWS SDK を使いましょう。
- バケット名にリージョン名とAZ名を含め、AZ内でユニークとなるように命名する必要があります。
公式情報はこちら
▼ ニュースリリースはこちら(英語)
▼ 公式ブログはこちら(英語)
https://aws.amazon.com/jp/blogs/aws/new-amazon-s3-express-one-zone-high-performance-storage-class/
★AWS re:invent 2023 の基調講演とイノベーショントークは、オンラインで無料で視聴できますよ。