【AWS GenU】1クリックデプロイの罠?放置で数万円溶かさないためのコスト注意点
2026-03-17
azblob://2026/03/17/eyecatch/2026-03-17-genu-cost-management-000.png

はじめに

AWS GenU(Generative AI Use Cases on AWS)は、AWSが公開している生成AIのサンプルアプリケーションです。社内向けのチャットボットやRAG(社内文書検索)などの機能を、公式サイトからCloudFormationで1クリックデプロイできるのが特徴です。

手軽に試せるのは非常にありがたいのですが、コスト面で事前に知っておきたいポイントがいくつかあったのでまとめます。

特に以下のような状況の方におすすめです。

  • GenUをPoCで立ててみたけど、裏側のコスト構造がよく分からない
  • RAG機能を有効にしたけど、裏側で何が動いているかよく分かっていない
  • 複数部署でGenUを使いたいけど、コスト按分ってどうするの?と悩んでいる

前提

本記事は以下の知識をお持ちの方を対象としています。

  1. AWSの基本的なサービス(CloudFormation、S3など)をなんとなく理解している
  2. GenUの存在を知っている、またはデプロイしたことがある
  3. Amazon BedrockやRAG(検索拡張生成)の概念をざっくり理解している

GenUのコスト構造を調べてみた

GenUをRAG機能付きでデプロイして検証していたのですが、料金体系を調べてみると「これ、放置したらけっこうかかるのでは?」ということに気づきました。

Bedrock(LLM)のほうはトークン課金なので、使わなければほぼゼロなんですよね。ただ、RAGを有効にしたときに裏側でデプロイされるOpenSearch Serverlessのほうは、使っていなくても固定費がかかり続けるという仕組みになっています。

「サーバーレスなのになんで?」と思った方、自分もまったく同じことを思いました。

1. RAGを有効にすると発生する「固定費」の罠

OpenSearch Serverlessはゼロスケールではない

GenUでRAG機能(社内文書をアップロードして検索・回答させる機能)を有効にすると、裏側でAmazon OpenSearch Serverlessのコレクションが自動的にデプロイされます。

「サーバーレス」と聞くとLambdaみたいにリクエストがないときは課金ゼロになるイメージがありますが、OpenSearch Serverlessはそうではありません。インデックスの保持と検索のために**OCU(OpenSearch Compute Unit)**というものが常時稼働していて、アクセスがゼロでも課金が止まらないんです。

最小構成でも月額2〜5万円

AWS公式の料金ページ(※1)によると、OpenSearch Serverlessには「標準モード」と「開発テストモード」があり、最小OCU数が異なります。

モード最小OCU数構成
標準モード2 OCUインデックス用 0.5×2(プライマリ+スタンバイ)+ 検索用 0.5×2(HAレプリカ)
開発テストモード1 OCUインデックス用 0.5 + 検索用 0.5(冗長スタンバイなし)

OCUの時間単価は**$0.24/OCU時間**(米国東部バージニア北部リージョンの場合)です。ざっくり月額を計算すると以下のようになります。

モード月額(730時間)
開発テストモード(1 OCU)$175(≒ 約2万6千円
標準モード(2 OCU)$350(≒ 約5万3千円

※リージョンによって料金は異なります。

「ちょっと試しただけ」のつもりが、1ヶ月放置するだけでこの金額です。S3のデータ格納やデータ転送量も加わるので、実際にはもう少し高くなることもあります。

2. OpenSearch Serverlessの「タグ付け・コスト管理」の落とし穴

部署ごとのコスト按分ができない問題

コストの問題に気づくと、次に「せめてどの環境がいくらかかっているか把握したい」と思いますよね。AWSでは普通、リソースにタグを付けてCost Explorerでプロジェクトごとにコストを可視化します。

ただ、OpenSearch Serverlessではこれがうまくいきません。

従来のプロビジョンド型OpenSearchならドメイン単位でタグを付けてコスト配分ができたのですが、Serverlessの場合はOCUがアカウント・リージョン単位で集約されて請求される仕様になっています。コレクションごとにタグを付けても、Cost Explorer上では**タグキーなし(untagged)**として表示されてしまうことがあります。

複数部署で使いたい場合は要注意

「部署ごとにGenU環境を分けてデプロイして、費用をチャージバックしたい」と考えている場合、この仕様は導入前に知っておかないとかなり困ります。

回避策としては、部署ごとにAWSアカウントを分ける(マルチアカウント戦略)か、OpenSearch Serverlessではなくプロビジョンド型を検討する、といった判断が必要になってきます。

3. コスト爆発を防ぐためにやっておくこと

注意点ばかりだとつらいので、「じゃあどうすればいいの?」という対策もまとめておきます。

A. RAGが不要なら無効にしてデプロイする

純粋にLLMとチャットしたいだけなら、デプロイ時のCloudFormationパラメータで**RAG機能を「無効」**にしましょう。これだけでOpenSearch Serverlessがデプロイされないので、固定費を丸ごとカットできます。

B. 検証が終わったらスタックごと削除する

GenUの良いところは「1クリックで立てられる=壊すのも簡単」というところです。PoCが終わったらCloudFormationコンソールからスタックをまるごと削除してしまいましょう。再度必要になったらまたデプロイし直せばOKです。

C. Bedrockのモデル選択を見直す

OpenSearch以外のコスト要因として、Bedrockで使うモデルの選択も地味に大事です。Anthropic公式のモデル情報(※2)によると、2026年3月時点での最新モデルの料金は以下の通りです。

モデル入力(/1M tokens)出力(/1M tokens)特徴
Claude Opus 4.6$5.00$25.00最高精度、エージェント向け
Claude Sonnet 4.6$3.00$15.00速度と精度のバランス型
Claude Haiku 4.5$1.00$5.00最速・安価

まずはHaiku 4.5やSonnet 4.6をデフォルトにして、精度が必要なときだけ上位モデルに切り替える運用がおすすめです。

D. AWS Budgetsでアラートを設定する

これは基本中の基本ですが、AWS Budgetsで予算上限とアラートを設定しておきましょう。「$50を超えたらメール通知」みたいにしておけば、放置してても早めに気づけます。

ただし、セクション2で触れた通り、OpenSearch Serverlessはタグベースのコスト配分が困難な仕様です。Budgetsでタグフィルタを使ってプロジェクト単位のアラートを設定しようとしても、OpenSearch Serverless分はフィルタに引っかからない可能性があります。アカウント全体の予算アラートとして設定しておくのが無難です。

まとめ

自分なりにポイントをまとめると以下の通りです。

  1. OpenSearch Serverlessは「サーバーレス」でもゼロスケールではない。最小構成でも月額2〜5万円の固定費がかかる
  2. タグベースのコスト按分が難しい。チャージバックしたい場合はアカウント分離を検討する
  3. RAGが不要なら無効にする。検証後はスタックごと削除する

「1クリックで簡単」は本当にその通りなのですが、裏側の仕組みを理解しておかないとコスト面で痛い目を見ます。

最後に

GenUのコストまわりで自分が気になったポイントをまとめてみました! 
急な請求で困っている方の参考になると幸いです~。

参考