Next'25 速報 - What's new with grounding LLMs in Vertex AI まとめ
はじめに
現在ラスベガスで開催されている Google Cloud の旗艦イベント「Google Cloud NEXT'25(以下、Next'25)」に現地参加中の Shanks / kazz / 小堀内 / 岸本 です。
Next'25 で発表された 最新情報 を現地からお届けしています!
近年、大規模言語モデル (LLM) は目覚ましい進化を遂げていますが、その知識はトレーニングデータに依存するため、最新情報への追随や事実に基づいた正確な回答には課題がありました。
特にエンタープライズ領域では、LLM の回答の信頼性 (事実性) が導入の大きな障壁となることがあります。
この課題に対する解決策として注目されているのが「グラウンディング」技術です。
本セッション What's new with grounding LLMs in Vertex AI
では、LLM の回答を Google 検索や Google Maps に接続し、より正確で最新、かつ説明可能な応答を生成するための最新機能が多数発表されました。
本記事では、グラウンディングの最新動向とその重要性、具体的な技術詳細、そして日本のエンジニアがどのように活用できるかを解説します。
主要ポイント
- グラウンディングによる劇的な品質向上: LLM の回答を外部の信頼できる情報源に接続することで、事実性が大幅に向上し、ハルシネーション (幻覚) が劇的に削減されます (Google 検索グラウンディングでは精度 150% 向上、ハルシネーション 80% 削減)。
- 多様な情報ソースへの対応: Google 検索 (GA)、Google Maps (Public Experimental)、エンタープライズ向けウェブグラウンディング (GA)、などに対応し、ユースケースに応じた情報源を選択できます。
- Gemini モデルファミリーとの統合: 最新の Gemini 2.0 / 2.5 Pro / Flash モデルで、Query Fanout (複数検索並列実行)、マルチステップ検索、マルチモーダル (画像・ドキュメント・動画) グラウンディングなどの高度な機能を利用できます。
技術詳細
グラウンディングとは? なぜ重要なのか?
グラウンディングとは、LLM が回答を生成する際に、その根拠となる情報を外部の信頼できるデータソースから取得・参照する技術です。これにより、以下のメリットが得られます。
- 事実性の向上 (Factuality): LLM の内部知識だけでは答えられない最新情報や、トレーニングデータに含まれない専門的な情報に基づいて回答を生成できます。
- ハルシネーションの抑制: もっともらしい嘘や不正確な情報を生成してしまう「ハルシネーション」を大幅に削減できます。
- 説明可能性の提供 (Explainability): 回答の根拠となった情報ソース (URL など) を提示できるため、ユーザーは情報の正当性を確認したり、さらに深く調査したりすることが可能です。
特にエンタープライズ利用においては、これらの要素がユーザーの信頼を得て、AI アプリケーション導入を成功させるための鍵となります。
Google 検索によるグラウンディング (GA)
Google 検索の広範なインデックスを活用して LLM の回答をグラウンディングする機能が、今回 一般提供 (GA) となりました。
- 効果: オープンデータセットでの評価では、精度が 150% 以上向上し、ハルシネーションが 80% 以上減少するという顕著な結果が示されています。
- Gemini との統合: Gemini モデル (特に Flash 2.0 以降) にネイティブ統合されており、Query Fanout 技術により、1 つのユーザープロンプトに対して最大 10 件の Google 検索を並行して実行し、複雑な質問に対して網羅的で多様な回答を生成します。
- マルチステップ検索: Gemini 2.5 Pro では、モデルの思考プロセスの一部として複数の検索を段階的に実行できます。例えば「2024年オリンピック100m走の勝者はどこで生まれたか?」という質問に対し、まず勝者を検索し、次にその勝者の出身地を検索するといった処理が可能です。
- マルチモーダル対応: Gemini 2.0 / 2.5 では、画像、PDF ドキュメント、動画を入力として、その内容に関する情報を Google 検索でグラウンディングして回答できます。例えば、PDF 内の企業リストに基づいて、各社の従業員数を検索して回答するといったことが可能です。
Google Maps によるグラウンディング (Public Experimental)
世界最大級の地理情報データベースである Google Maps を活用したグラウンディングが、Public Experimentalとして利用可能になりました。
Public Experimental とは?
Public Experimental は、Google Cloud の機能提供状態の一つで、一般に利用可能ではあるものの、まだ実験的な段階にあることを示します。
Gemini の exp モデルに近い位置づけで、今後仕様変更や機能の調整が行われる可能性があります。
正式リリース(GA: General Availability)と比べて機能が限定されていたり、将来的に変更される可能性があることを理解した上で利用することが推奨されます。
- 豊富なデータ: 2 億 5 千万以上の場所情報 (店舗、施設、観光地など) と、毎日 1 億件以上の更新 (営業時間、レビュー、評価、写真など) を活用できます。
- ローカル検索: API でユーザーの位置情報を指定することで、「近くの〇〇」といった質問に対して、関連性の高いパーソナライズされた情報を提供します。
- 独自データとの連携: 自社の顧客データや物件情報などと Google Maps の情報を組み合わせることで、旅行プランの提案 (子供向け施設のハイライト) や不動産情報 (realtor.com 事例) など、ユニークな体験を構築できます。
また、今回のデモで使用されたリポジトリはこちらになります。
エンタープライズ向けウェブグラウンディング (GA)
金融、ヘルスケア、公共セクターなど、規制が厳しい業界向けに設計されたグラウンディング機能も GA となりました。
- コンプライアンス: Google 検索インデックスの厳選されたサブセットを使用し、HIPAA や FedRAMP (米国政府) といった厳格なコンプライアンス要件に準拠しています。
- セキュア: 顧客データのロギングは行われず、セキュアな環境で利用できます。
- 互換性: 既存の Gemini 2.0 / 2.5 モデルと同一の API で利用可能です。
まとめ
Google Cloud Next '24 で発表された LLM のグラウンディング技術は、AI アプリケーションの事実性、最新性、信頼性を飛躍的に向上させる可能性を秘めています。
- Google 検索、Google Maps、エンタープライズウェブグラウンディングなど、多様な情報ソースとの連携が可能になったこと。
- Gemini モデルファミリーの進化により、Query Fanout やマルチステップ検索、マルチモーダル対応など、より高度なグラウンディングが実現できるようになったこと。
これらの点は、日本のエンジニアにとっても非常に重要です。
自社サービスへの LLM 導入や、社内業務効率化のための AI ツール開発において、グラウンディング技術はユーザー体験と信頼性を大きく左右する要素となるでしょう。
まずは、Vertex AI のドキュメントを参照し、今回紹介された機能を試してみることから始めてみてはいかがでしょうか。
特に Google 検索や Google Maps Platform との連携は、多くのアプリケーションで即効性のある改善をもたらす可能性があります。
Discussion