Agent Search(旧Vertex AI Search)は、Googleが提供するAI検索エンジン構築サービスで、高度な自然言語処理や生成AI技術を活用した検索システムを簡単に構築できます。
Agent Searchの料金プランには従量課金モデルとサブスクリプションモデルが用意されており、アプリ作成時に選択する必要があります。そのため、自社の利用規模や要件に合わせて適したプランを選択し、適切にコストを管理することが重要です。
本記事では、2つの課金モデルの違いや課金体系について、分かりやすく解説します。
Agent Searchについては、以下の記事もぜひご参照ください。
Agent Searchで課金対象となる要素
Agent Searchでは、ユーザーの入力に対して発生する検索のリクエスト(公式ドキュメントに合わせて、以下クエリと呼びます)と、検索対象となるデータストア(以下、ストレージと呼びます)の両方が課金対象になります。これに加えてアドオンの機能を追加するとその分の料金が上乗せされます。
Agent Searchの2つの課金モデル
Agent Searchには「一般的な料金」(原文ではGeneral Pricing)と「構成可能な料金」(原文ではConfigurable Pricing)の2つの課金モデルが用意されており、どちらかを選択する形になります。
ざっくりと言えば、「一般的な料金」が小規模・テスト導入向けの従量課金モデル、「構成可能な料金」は大規模向けのサブスクリプションモデルです。公式のドキュメントでは1か月あたりのクエリ数1,500万超がモデル選択の閾値になると説明されています。
どちらの課金モデルを選択しても、クエリ+ストレージ+アドオンの3階建ての課金体系になります。
各モデルの課金体系を詳しく見ていきます。
一般的な料金(General Pricing)
クエリ、ストレージ共にシンプルな従量課金制のプランで無料枠も用意されています。エンタープライズ向けの大規模なアプリケーションでない限りこちらのモデルを選択することになります。
クエリ料金
以下の2つのエディションから選択します。検索結果の取得だけの用途ならSearch Standard Edition、生成AIによる回答生成を利用するならより上位のSearch Enterprise Editionを選択します。なお、ウェブサイトをデータソースに使用する場合にはSearch Enterprise Editionしか選択できません。
| Search Standard Edition | $1.50 / 1,000 クエリ |
| Search Enterprise Edition | $4.00 / 1,000 クエリ |
どちらのモデルにも10,000クエリの無料枠が付きます。
どちらのモデルにも「高度な生成回答」というアドオンを付けることができます。このアドオンを有効にすると以下のような機能が付けられます。
- ユーザーの質問への回答に加えて、関連する質問を提示する
- ユーザーの複雑な質問をいくつかの簡単な質問に分解して、回答の精度を高める
- データストア内の画像や、回答内容を元にしたグラフを回答に含める
アドオンの料金は以下です。
課金単位が「ユーザー入力クエリ」となっているのは、このアドオンでは必要に応じて、複雑な質問をより簡単な複数の質問に分解することがあるため、分解後ではなく分解前のクエリの件数が課金単位だという意味です。
| 高度な生成回答 | $4.00 / ユーザー入力クエリ 1,000 件 |
ストレージ料金
月額で以下の料金になります。
| インデックス ストレージ | $5.00 / 1GiB |
基本的にはデータストアの容量が課金の単位になりますが、ウェブサイトをデータストアに使用している際には、500KiB*ウェブサイトのページ数で計算されます。10GiBまでは無料枠となっています。
構成可能な料金(Configurable Pricing)
クエリ・ストレージの想定利用量に応じたサブスクリプション契約の課金モデルです。サブスクリプション料金に加えて、アドオンの料金がクエリ・ストレージの利用量に対して従量で課金されます。月間のクエリ数が1,500万を超えるような大規模なアプリケーションでの利用が想定されています。
サブスクリプションはプロジェクト単位での契約になるので、同一プロジェクト内に複数のアプリケーションを作成して、それらを同じサブスクリプションの枠内で賄うことも可能です。
クエリ料金
月額で以下の料金になります。
| クエリユニット | $6.00 / 1分当たり1クエリ |
1分当たりに想定されるクエリ数に応じたサブスクリプションを購入します。1分あたりの使用量で購入分を超えた分は、「一般的な料金」のSearch Standard Editionで計算して課金されます。なお、契約の下限値が設けられており、最低でも1分当たり1,000クエリの契約からになります。
アドオンは以下になります。
| セマンティック | $0.75 / 1,000 カウント + $1.50 / GB / 月(エンべディング) |
| KPIとパーソナライズ | $0.20 / 1,000 カウント |
| コア生成回答 | $2.00 / 1,000 カウント |
| 高度な生成回答(AI モード) | $4.00 / 1,000 カウント |
「一般的な料金」ではデフォルトで含まれている、セマンティック検索やユーザー毎の回答結果のパーソナライズといった機能もアドオン扱いになっています。これにより、要件に応じて細かくコストを管理することができます。
セマンティック検索を使用する場合にはクエリ回数とストレージの容量の両方が追加の課金対象になります。また、コア生成回答や高度な生成回答を利用するには、セマンティック検索のアドオンが必須になります。
ストレージ料金
月額で以下の料金になります。
| ストレージ ユニット | $1.00 / 1GB |
こちらも契約の下限値が設けられており、最低50GBからの契約になります。購入分を超えた場合は「一般的な料金」による課金となります。
Agent Searchの無料枠
「一般的な料金」では以下の無料枠が付与され、テスト運用など初期の段階では無料で利用できます。
- クエリの無料枠: 10,000クエリ
- ストレージの無料枠: 10GiB
なお、無料枠は請求先アカウント単位になる点と、「高度な生成回答」アドオンは無料枠の対象外となる点に注意が必要です。
月額の料金シミュレーション
より具体的にイメージできるよう、月額費用をシミュレーションしてみます。
ケースA:5000ページ規模のサイト・月間検索回数8,000回のサイト検索AIエージェント
(高度な生成回答を利用、KPIとパーソナライズは利用しない)
データ容量が小さく、月間検索回数も1,500万には遠く及ばないので、「一般的な料金」を選択します。
- ストレージ(500KiB * 5000ページで約2.4GiB):無料枠の10GiB以内なので$0
- クエリ(回答生成が必要なのでSearch Enterprise Edition): $4.00 / 1,000 クエリ * 8,000 = $32
- アドオン(高度な生成回答):$4.00 / 1,000 クエリ * 8,000 = $32
合計費用は月額$64となります。
ケースB:大規模なBtoC向けカタログ検索
(セマンティック検索を使用、AIによる回答生成は行わない)
データストアの容量は50GiB、クエリ回数は最大で1分間に1,200クエリ、月間2,000万クエリとします。
こちらは比較のため、両方のモデルでシミュレーションします。
一般的な料金
- ストレージ:50GiB(うち10GiBは無料枠) → $5 * 40 = $200
- クエリ(Search Standard Edition):$1.50 / 1,000 クエリ * 20,000,000 = $30,000
合計費用は月額$30,200です。
構成可能な料金
- ストレージ(50GiBは約54GB):$1.00 * 54 = $54
- クエリ(1分間12,00クエリ) → $6 .00 * 1200 = $7,200
- セマンティック検索(クエリ):$0.75 / 1,000カウント * 20,000,000 = $15,000
- セマンティック検索(ストレージ):$1.50 / 1GB * 54 = $81
合計費用は月額$22,335となります。クエリ毎の料金が抑えられる分、「構成可能な料金」の方が安くなりました。
料金のシミュレーションについては公式のドキュメントもご参照ください。
意図せぬ高額課金を防ぐための対策
特に従量課金モデルの場合、プログラムの不具合や悪意のある大量アクセスによって意図せず高額な料金が発生する可能性があります。対策としては以下のような項目があります。
予算アラートの設定
Google Cloudの予算アラートを使って、毎月の想定予算の50%や100%といった一定の基準に達した時点で通知が届くように設定しておきましょう。これにより、異常なコストの発生にいち早く気付いて対応できるようになります。
クォータ管理
短期間での大量リクエストによるコストの跳ね上がりを防ぐための利用制限枠です。Google Cloudには標準でデフォルトの上限値が設定されていますが、本番リリースの規模やアクセス予測に合わせて、事前に適切な上限値へ見直しておく必要があります。 なお、クォータの画面ではAgent Search関連のAPIは「Discovery Engine API」という名前で表示されます。
呼び出し元のアプリケーションでの流量制御
過剰なリクエストが発生しないよう、呼び出し元となるアプリケーション側でもレートリミットやボタンの連打防止を実装することも検討しましょう。
まとめ
Agent Searchではクエリとストレージの両方が課金対象となり、これにアドオンの料金を加えて総額の料金となります。課金モデルには、従量課金モデルの「一般的な料金」とサブスクリプションモデルの「構成可能な料金」があります。エンタープライズ向けのアプリケーションでない限りは、「一般的な料金」を選択するケースが多いでしょう。
特に外部に公開するシステムの場合には、意図せぬ高額な料金の発生に注意が必要です。予算のアラートやクォータ管理など、必要な対策を講じるようにしましょう。
AIサイト内検索を手軽にサイトに導入!「SiteAsk(サイトアスク)」のご紹介
弊社が提供する「SiteAsk(サイトアスク)」は、Agent Searchを活用したAIサイト内検索を手軽かつ安全に導入できるAIサイト内検索サービスです。
- Agent Searchを採用、回答データの作成や保守が不要
Agent SearchがWebサイトのデータから自動的にRAGを構築するため、面倒なデータ処理は不要です。Webサイトの更新と共にデータは更新されるので、運用中のデータ保守も不要です。
- 強力なハルシネーション防止機能
Agent Searchの安全構造に加え、SiteAsk独自の「3層AIガードレール」を搭載。悪意のある質問による不適切な回答やブランドを毀損する回答をブロックします。
- システム改修不要で導入可能
JavaScriptを読み込むコードを追加するだけで導入できます。Googleタグマネージャー(GTM)を利用した導入も可能なため、既存のシステムやサイトのソースコードを改修する必要がありません。
Agent Searchを活用したAIサイト内検索を手軽にWebサイトに導入したい方は、ぜひSiteAskの導入をご検討ください。
Agent Searchについては、以下の記事もぜひご参照ください。
参考ドキュメント







