はじめに
本資料の目的
本資料は、AWSが提供する生成AIサービス「Amazon Bedrock」の料金体系を分かりやすく整理することを目的としています。料金の全体像から各プランの特徴、具体的な料金例、コスト最適化のポイントまで網羅的に解説します。
想定読者
クラウドの利用を検討しているエンジニア、プロダクト責任者、経営層、そしてコスト管理を担当する方を想定しています。専門知識が深くない方でも理解できるよう、専門用語は最小限にして説明します。
本資料の構成と使い方
本資料は全8章で構成します。第2章でサービス概要、第3章で料金の全体像、第4章で各料金プランの詳細を解説します。第5章では具体的な料金例(想定シナリオ)を示し、第6章でコスト最適化のコツ、第7章で他サービスとの比較、第8章で総括と利用時のアドバイスを掲載します。必要な章だけを参照しても全体を把握できるように作成しています。
注意点
リージョンや利用するモデル、リソースの使い方で料金は変わります。ここで示す情報は整理と理解の助けとしてください。
AWS Bedrockとは?サービス概要
サービスの目的
AWS Bedrockは、Amazonが提供するフルマネージド型の生成AI基盤サービスです。複数の高性能モデルを単一のAPIで利用できるため、環境構築やモデル管理の手間を減らして、開発に集中できます。
対応モデルと特徴
- サードパーティモデル(例:Anthropic、Meta、Mistral AI)とAmazon独自モデルを同時に利用可能です。
- モデル切替をAPIレベルで行えるため、用途やコストに応じて柔軟に選べます。
主な機能と利用例
- テキスト生成:文章作成、要約、対話システム。
- 画像生成:プロンプトからの画像作成(対応モデル利用時)。
- カスタム指示:プロンプトやパラメータで出力を調整できます。
開発者向けの利点
- フルマネージドのためインフラ管理をAWSが担います。
- 単一APIで複数モデルにアクセスできるため、導入が早く、運用負担が軽減します。
運用・セキュリティ面
- AWSのID・アクセス管理(IAM)やログ管理と連携できます。機密データは暗号化やアクセス制御で保護してください。
利用イメージ(非技術者向け)
Bedrockは「複数の賢いエンジンをまとめて借りられる窓口」のようなサービスです。用途に合わせてエンジンを選び、APIに指示を出すだけで結果が返ります。
AWS Bedrockの料金体系(全体像)
概要
2025年時点のBedrockは、用途に応じた主に4種類の料金体系を提供します。利用量や運用方法で選べるため、想定する使い方に合わせて選択します。最新の料率はAWS公式で必ず確認してください。
主な4種類の料金
- オンデマンド料金:API呼び出しや生成したトークン数に応じて課金します。短時間の実験や少量利用に向きます。
- バッチモード:大量のバッチ処理に最適化された課金です。まとめて処理する際にコスト効率が良くなります。
- プロビジョンド・スループット:一定量の容量を前もって確保し、安定した処理速度を得るための定額型です。安定運用や高スループットに向きます。
- カスタマイズ料金:独自モデルの微調整や学習を行う場合の追加料金です。データ量や学習回数で変動します。
価格が変わる要素
リージョン、選ぶモデル(軽量〜高性能)、出力量(トークンや推論時間)、保存するデータ量などで費用が変わります。運用形態で最適なプランが違う点に注意してください。
選び方のポイント
まず利用パターン(試験的か本番か、リアルタイムかバッチか)を整理し、想定月間利用量に基づき概算します。小規模ならオンデマンド、大量処理や安定性重視ならプロビジョンドやバッチを検討すると良いです。
各料金プランの詳細と特徴
オンデマンド(従量課金)
使った分だけ支払う仕組みです。テキスト系モデルは入力と出力のトークン数に基づいて課金され、画像系モデルは生成した画像1枚ごとに課金されます。短期間の利用や試作、利用量が不規則な場合に向きます。例:試験運用や少人数のアプリに適しています。
バッチモード(まとめて割安)
複数のリクエストをまとめて一括処理する方式で、最大約50%の割引が適用される場合があります。大量データを定期的に処理するバッチ処理や夜間の一括変換に向いています。レイテンシーはやや高くなりますが、コストを抑えたいときに有効です。
プロビジョンド・スループット(予約型)
時間単位でリソースを予約して定額で使う方式です。長期契約ほど割引率が高くなり、高負荷なリアルタイム処理やカスタマイズモデルの運用に適します。需要が予測でき、安定したパフォーマンスが必要な場合はこちらを選びます。
カスタマイズ料金(モデル保存・トレーニング)
モデルの保存やトレーニングには追加費用が発生します。カスタマイズモデルはオンデマンドでの利用ができず、プロビジョンド契約が必須となる点に注意してください。トレーニングコストや保存容量は用途次第で増減しますので、まずは小規模で試すことをおすすめします。
選び方のポイント
- 利用が少ない・不定期:オンデマンドを優先
- 大量バッチ処理:バッチモードでコスト削減
- 常時高負荷・カスタム利用:プロビジョンドを検討
- カスタマイズを行う場合はプロビジョンド契約が必須
簡単な条件で使い分けると管理しやすく、コストも安定します。
具体的な料金例(2025年時点)
概要
ここでは、オンデマンドで利用したときの代表的な料金例をわかりやすく示します。小さい単位での比較を入れて、日常的な利用シーンでの目安を出します。
画像生成(512×512)
- Titan画像ジェネレーター(512×512)
- 標準品質:1枚あたり1.19円
- プレミアム品質:1枚あたり1.48円
- カスタムモデル画像
- 標準品質:1枚あたり2.67円
- プレミアム品質:1枚あたり2.97円
簡単な目安:標準品質を1,000枚生成すると約1,190円、カスタムモデルで100枚なら約267円です。
カスタマイズ(モデルの保存と利用)
- Titan Text Lite
- 保存:289.57円/月
- 利用:1,054.46円/時間
- Titan Text Express
- 保存:289.57円/月
- 利用:3,044.56円/時間
実例:Titan Text Liteを1か月保存し、合計2時間利用した場合は289.57 + 2×1,054.46 = 2,398.49円です。Expressを1時間利用するなら289.57 + 3,044.56 = 3,334.13円が目安になります。
リージョン差について
東日本(東京)リージョンはやや高めに設定されることがあります。同じモデルでも1,000トークンあたり数セント〜数十セント高くなる場合があるため、トークン単位の多い処理では差が積み重なります。
実務での使い方のヒント
- まず小ロットで試算してからスケールすることをおすすめします。
- 画像枚数や稼働時間を事前に見積もるとコスト管理がしやすくなります。
コスト最適化・運用時の注意点
利用パターンに応じたプラン選択
少量の試験や短期検証はオンデマンドを使うと無駄が少ないです。例えば月数千リクエスト程度ならオンデマンドで十分です。定期的に大量利用するサービスではプロビジョンドを選び、安定したスループットを確保します。バッチ処理やまとめて処理するワークロードはバッチモードで料金と処理効率を抑えられます。
料金差とデータ転送の考慮
リージョンごとに料金が異なることがあります。安価なリージョンを選ぶとコストを下げられますが、遅延やデータ規制を確認してください。データ転送(特にリージョン間やインターネットへのアウト)は追加費用が発生します。ログや結果を外部に送る頻度を減らすことで通信コストを抑えます。
モデル選定と精度のトレードオフ
モデルごとに料金と精度が異なります。高精度モデルは高コストになりやすいので、用途に応じて最小限の精度を満たすモデルを選んでください。軽量モデルで十分な場合はそちらを優先します。
運用時の実践的対策
- リクエストやトークンサイズを最適化する(入力を簡潔にする、不要データを省く)
- バッチ化とキャッシュを活用する(繰り返し問合せの結果はキャッシュ)
- 監視とアラートを設定する(予算超過の通知、異常な増加の検知)
- 利用状況のタグ付けでコスト配分を明確にする
- IAMや暗号化でセキュリティを確保する
運用では定期的に利用状況を見直し、モデルやプランを見直すことが重要です。これにより無駄な支出を抑え、必要な性能を確保できます。
AWS Bedrockと他サービスの比較ポイント
モデルの選択肢
AWS Bedrockは複数のベンダーの大規模モデルを同一環境で試せます。モデルの挙動を比較しやすく、用途に応じて切り替えられます。例:生成重視なら1つ、要約重視なら別のモデルを使う、といった運用がしやすいです。
料金と割引
明確な無料枠は少ない一方、バッチAPIや長期契約で割引を受けられます。短期の検証でコストを抑えたい場合は課金体系を事前に確認してください。
統合と運用
AWSの他サービス(S3、IAM、CloudWatchなど)と直接連携できます。既にAWS基盤で運用している場合、運用負荷を下げられます。
向き不向き(実例)
- 向いている場面:多様なモデルを試して比較したい、AWSで一元運用したい。
- 別サービスが良い場面:明確な無料枠や特定ベンダーの最新機能を優先する場合は、Azure OpenAIや直接OpenAIの利用が向きます。
選ぶ際は、モデル性能だけでなく運用コスト・統合性・将来の拡張性を総合で比較してください。
まとめと利用時のアドバイス
要点のまとめ
AWS Bedrockの料金は、利用するモデル(小型〜大型)、呼び出し頻度、生成するトークン数、リージョンで大きく変わります。公式の料金ページや見積もりツールで最新情報を必ず確認してください。概算だけで判断せず、実データでのシミュレーションを行うことが重要です。
導入前のチェックリスト(具体的手順)
- ユースケースを明確にする(短文応答、長文生成、検索補助など)。
- 1リクエストあたりの平均トークン数を見積もる(例:要約なら入力300トークン・出力100トークン)。
- 期待するQPS(秒間・分間のリクエスト数)を見積もる。
- 複数モデルでPoC(小〜中規模の試験)を行い、精度とコストを比較する。
- 見積もり結果で予算上限とアラートを設定する(AWS BudgetsやCloudWatchを活用)。
運用時の具体的アドバイス
- キャッシュとバッチ処理で呼び出し回数を削減する。短い返信やテンプレート化でトークンを抑える。
- 非同期処理やキューを使い、急激な負荷増加を平滑化する。
- モデル切替を容易にし、初期は低コストモデルで運用して段階的に移行する。
- データ転送や他サービス連携の追加費用に注意する(S3連携やログ保存など)。
コスト評価の習慣
定期的に実使用ログからコストを再計算し、モデルや設定を最適化してください。定期レビューで無駄を削減できます。
最後に、導入時は小さなPoCで実際の料金感を掴み、運用体制と予算アラートを整えてから本番に移行することをおすすめします。公式の最新料金確認を忘れないでください。












