TECH PLAY

SQL

イベント

該当するコンテンツが見つかりませんでした

マガジン

技術ブログ

G-gen の佐々木です。当記事では、Google Cloud Next '26 で発表された Google Cloud のデータベースに関する新機能について、公式の投稿記事「 What’s new with Databases: Powering the agentic future 」の内容をもとに紹介します。 はじめに Embed AI into every layer of the data stack AI Studio とのバイブコーディング連携(GA) データエージェント向けツール(Preview) Database Onboarding Agent / Database Observability Agent(Preview) AlloyDB AI-Powered Search at Scale(Preview) AlloyDB の AI 関数の追加と最適化(Preview) データベース向けマネージドリモート MCP サーバー(GA / Preview) MCP Toolbox for Databases 1.0(GA) Break down walled gardens with lakehouse integrations AlloyDB の Lakehouse Federation(Preview) BigQuery から AlloyDB への Reverse ETL(Preview) Datastream による継続レプリケーション(GA) Knowledge Catalog(旧称 : Dataplex Universal Catalog)(Preview) Spanner Columnar Engine(GA) Database Center の BigQuery サポート(Preview) Commitment to open data and multi-cloud flexibility Spanner Omni(Preview) Bigtable In-Memory(Preview) Memorystore for Valkey 9.0(GA) Oracle AI Database@Google Cloud の拡張 Compute Engine からマネージドサービスへの移行機能(Preview) Firestore の全文検索 / 地理空間検索(Preview) はじめに 以下の Google 公式投稿を参考に、Google Cloud Next '26 で発表された Google Cloud のデータベース製品に関する新機能を紹介します。なお、当記事で紹介する機能の提供ステータス(GA / Preview / Coming Soon)は 2026年4月23日現在の情報です。 Google Cloud Next '26 では、AI モデル、データ分析、運用データベースを単一の AI ネイティブ基盤に統合するアーキテクチャとして Agentic Data Cloud が提唱されました。当記事では以下の公式投稿の内容に沿って、データベースに関する新機能を紹介します。 参考 : What’s new with Databases: Powering the agentic future 他の Google Cloud Next '26 の関連記事は、Google Cloud Next '26 カテゴリの記事一覧から参照してください。 blog.g-gen.co.jp Embed AI into every layer of the data stack AI Studio とのバイブコーディング連携(GA) Google AI Studio とデータベースの統合が GA となり、自然言語プロンプトから、データベースと接続済みで即座に動作するアプリケーションを数秒で生成できるようになりました。現時点では Firestore との接続が GA で提供されており、Cloud SQL for PostgreSQL のサポートも近日提供予定とされています。 プロトタイピングから本番運用まで、エージェント主導の自動化ワークフローとデータベースをシームレスに接続できる点が特徴です。 参考 : From prompt to production: Build full-stack apps faster with Google AI Studio and Firebase データエージェント向けツール(Preview) AlloyDB、Cloud SQL、Spanner で、データエージェントから使えるツール群が Preview 提供となりました。その中核となる QueryData ツールは、自然言語から SQL を生成する text-to-SQL を扱う機能で、公式ブログでは「ほぼ100%の精度」と説明されています。 QueryData は、 コンテキストセット と呼ばれる JSON 形式のナレッジベースを利用する点が、従来の汎用的な text-to-SQL との違いです。開発者があらかじめ監査・整備したコンテキストセットを参照してクエリを組み立てるため、LLM に自由生成させる方式と比べて、実データや業務要件に即したクエリを安定して生成できます。 また QueryData からデータへのアクセスは、 パラメータ化セキュアビュー (Parameterized Secure Views)を介して行われます。パラメータ化セキュアビューは、 PostgreSQL のセキュアビューの拡張機能であり、行レベルセキュリティやフィルタ条件をビュー側にあらかじめ組み込んでおける機能です。エージェントが自然言語から組み立てたクエリであっても、ログインユーザーに許可された範囲のデータだけが参照される状態を保つことができます。 カスタマーサポートの自動化、e コマースのショッピングアシスタントなど、定型的な問い合わせが大量に発生するユースケースでの利用が想定されています。 参考 : QueryData helps agents turn natural language into queries for AlloyDB, Cloud SQL and Spanner 参考 : QueryData の概要 参考 : パラメータ化されたセキュアなビューの概要 Database Onboarding Agent / Database Observability Agent(Preview) データベースの導入と運用を支援する2つのエージェントが Preview 提供となりました。 Database Onboarding Agent は、小規模システムからエンタープライズ要件まで、要件に応じた最適なデータベースを選択し、プロビジョニング作業をガイドするエージェントです。 Database Observability Agent は、AlloyDB、Bigtable、Cloud SQL、Spanner のパフォーマンスを監視し、潜在的な問題の根本原因の特定や、改善策の提示を行うエージェントです。運用中のデータベース群の観測と改善を自動化する機能となっています。 AlloyDB AI-Powered Search at Scale(Preview) AlloyDB のベクトル検索基盤に、Google が開発した ScaNN インデックスを活用した大規模ベクトル検索機能が Preview 提供となりました。最大100億ベクトルまでスケールし、標準 PostgreSQL の HNSW インデックスとの互換性を実現しながら6倍高速なベクトルクエリを実現します。また、カラム型エンジンによる高速化により、HNSW を使用する場合でも標準 PostgreSQL の4倍高速になります。 加えて、キーワード検索とベクトル検索を組み合わせたハイブリッド検索を可能にする BM25 のネイティブサポートも近日追加予定です。BM25 は Elasticsearch をはじめとする主要な検索エンジンで広く採用されている、単語の一致を基準に関連度を算出するキーワード検索のランキングアルゴリズムです。固有名詞や厳密な語句一致が得意な BM25 と、意味の近さを捉えるベクトル検索を1つのデータベース上で組み合わせられる点が特徴です。 参考 : ベクトルインデックスの概要 参考 : Okapi BM25 - Wikipedia AlloyDB の AI 関数の追加と最適化(Preview) AlloyDB に、SQL から直接 LLM を呼び出せる新しい AI 関数が Preview 提供となりました。 新規に ai.analyze_sentiment (感情分析)、 ai.summarize (要約)が追加され、既存の ai.if 、 ai.rank 、 ai.generate 、 ai.forecast についても最適化が施されています。各関数の用途とユースケースを以下にまとめました。 AI 関数 用途 ユースケース例 ai.if 自然言語による条件判定(インテリジェントフィルタリング) 振る舞いパターンから不正の疑いがある取引を検出 ai.rank ベクトル検索結果の再ランク付け 文脈に即して検索結果を並べ替え ai.generate コンテンツ生成、データフォーマット変換 生のサーバーログを解析しやすい JSON へ変換 ai.analyze_sentiment テキストの感情(ポジティブ / ネガティブ / ニュートラル)を分類 商品レビューから顧客満足度を評価 ai.summarize 長文テキストの要約 議事録から決定事項やアクションアイテムを抽出 ai.forecast TimesFM による時系列予測 過去の売上データから将来の在庫需要を予測 参考 : AI 関数の概要 参考 : AI 関数を使用してインテリジェントな SQL クエリを実行する データベース向けマネージドリモート MCP サーバー(GA / Preview) Google Cloud の各データベースで、 Model Context Protocol (MCP)に対応したフルマネージドのリモート MCP サーバーが提供開始となりました。Gemini をはじめとする MCP 準拠のクライアントが、データやインフラストラクチャと安全にやり取りするためのインターフェースを提供します。 参考 : Powering the next generation of agents with Google Cloud databases MCP サーバーの提供ステータスはサービスにより異なるため、最新のステータスは以下の公式ドキュメントの原文(英語)をご確認ください。 参考 : Supported products Google Cloud が提供している MCP サーバーの詳細については、以下の記事を参照してください。 blog.g-gen.co.jp MCP Toolbox for Databases 1.0(GA) MCP Toolbox for Databases は、AI エージェント、IDE、アプリケーションといった MCP クライアントからデータベースに直接接続するための、オープンソースの MCP サーバーです。Gemini CLI や Claude Code などの MCP 準拠クライアントから、Google Cloud のマネージドデータベースに加え、PostgreSQL、MySQL、Oracle、MongoDB、Redis、Snowflake など、合計40以上のデータベースを扱えるようにします。 テーブル一覧の取得( list_tables )や SQL 実行( execute_sql )といった汎用ツールがデフォルトで利用できるほか、独自のロジックをカスタムツールとして定義することで、エージェントが実行可能な操作をあらかじめ限定できます。 参考 : googleapis/mcp-toolbox(GitHub) Break down walled gardens with lakehouse integrations AlloyDB の Lakehouse Federation(Preview) AlloyDB から BigQuery や Apache Iceberg のライブデータを、PostgreSQL のインターフェースで直接照会できる Lakehouse Federation が Preview 提供となりました。 AlloyDB Studio の UI から BigQuery や Iceberg のテーブルを探索でき、フィルタや集計は BigQuery 側にプッシュダウンされます。データを移動せずに、オペレーショナルデータと分析データのライブ結合が可能です。 BigQuery から AlloyDB への Reverse ETL(Preview) BigQuery で算出したインサイト(顧客セグメント、レコメンドスコア、需要予測など)を、AlloyDB にワンクリックで同期できる Reverse ETL 機能が Preview 提供となりました。 アプリケーションから BigQuery を直接参照するのは、レイテンシや同時実行数、コストの観点で現実的でないケースが少なくありません。あらかじめ BigQuery で計算しておいたインサイトを AlloyDB に戻しておけば、アプリは普段通り AlloyDB を参照するだけで、分析結果を画面表示やレコメンドなどのリアルタイム機能に組み込めます。 同期先の AlloyDB は、読み取りを高速化するカラム型エンジンと高速キャッシュによって、多数の同時リクエストに低レイテンシで応答できるアプリケーションバックエンドとして機能します。 参考 : AlloyDB にデータをエクスポートする(リバース ETL) Datastream による継続レプリケーション(GA) Datastream を介して、AlloyDB から BigQuery や Apache Iceberg テーブルへ 継続的レプリケーション を行える機能が GA となりました。 Datastream はサーバーレスで動作し、特に AlloyDB から BigQuery へのストリームには無料枠が提供されます。リアルタイムの ML 特徴量生成など、分析側との連携を前提としたユースケースに適しています。 参考 : ストリームの作成 Knowledge Catalog(旧称 : Dataplex Universal Catalog)(Preview) データガバナンス サービスである Dataplex Universal Catalog が、 Knowledge Catalog へ名称変更されました。Dataplex Universal Catalog は、BigQuery のテーブルや Cloud Storage 上のファイルなど Google Cloud 上のデータ資産に対して、メタデータ、データ品質、リネージ、アクセス制御を一元的に扱えるサービスです。 名称変更に合わせ、AI エージェントがデータの業務的な意味を踏まえて動けるようにするための「コンテキストエンジン」としての機能が Preview 提供となりました。Google Cloud の製品だけでなく、パートナーのデータプラットフォームやサードパーティカタログからも情報を取り込み、組織横断のデータガバナンスの起点として機能します。 Knowledge Catalog の詳細については、以下の記事をご一読ください。 blog.g-gen.co.jp Spanner Columnar Engine(GA) Spanner Columnar Engine が GA となりました。行ベースのストレージと並行して列指向フォーマットでデータを保持し、複数行をまとめて処理するベクトル化実行を組み合わせることで、稼働中のトランザクションデータに対する集計・分析クエリのスキャンを最大200倍高速化するとされています。 また、Iceberg テーブルのサポートや、BigQuery からの継続的な Reverse ETL、フェデレーションクエリの高速化にも対応したことで、Spanner を単独で HTAP (Hybrid Transactional/Analytical Processing)的に使える範囲が広がりました。HTAP は、トランザクション処理(OLTP)と分析処理(OLAP)を、ETL を介さずに1つのデータベースで兼ねるアーキテクチャを指す用語です。 参考 : Spanner カラム型エンジンの概要 Database Center の BigQuery サポート(Preview) Database Center は、Google Cloud のデータベースサービスを横断して、フリート全体の健全性、パフォーマンス、セキュリティ、コンプライアンスを一元的に可視化・管理する管理コンソールです。 この Database Center での BigQuery サポートが Preview 提供となりました。これにより、Google Cloud のマネージドデータベースや Compute Engine 上で運用しているデータベースに加えて、BigQuery も一元的に扱えるようになります。 Gemini によるフリートアナリティクスによってパフォーマンス改善の余地を検出できるほか、メトリクスをサードパーティツールへ連携するための API とマネージド MCP サポートも提供されます。 参考 : Database Center の概要 Commitment to open data and multi-cloud flexibility Spanner Omni(Preview) Spanner Omni が Preview 提供となりました。Spanner Omni は、従来 Google Cloud 上でのみ提供されていた Spanner を、自社データセンター、他クラウド、エッジなど任意の場所で稼働できるダウンロード可能なエディションです。 Spanner のスケーラビリティ、高可用性、強整合性、エンタープライズセキュリティ、マルチモデル機能を、自社データセンターや他クラウドなどの環境でも利用できるようになります。 参考 : Spanner Omni を発表:あらゆるインフラで Google のイノベーションを活用 参考 : Spanner Omni の概要 Bigtable In-Memory(Preview) Bigtable に、1ミリ秒未満の読み取りレイテンシを実現する新しい インメモリ階層 が Preview 提供となりました。Bigtable は2026年4月から Enterprise と Enterprise Plus の2つのエディションを提供しており、このインメモリ階層は Enterprise Plus エディションの一部として提供されます。 インメモリ階層は Bigtable ノードの一部として統合されており、RAM / SSD / HDD のハイブリッド ストレージアーキテクチャによって、頻繁にアクセスされるホットデータをメモリに、長期保管データを低コストストレージに置く、といった使い分けが透過的に行えます。 参考 : エディションの概要 参考 : インメモリ階層の概要 Memorystore for Valkey 9.0(GA) Memorystore for Valkey が Valkey バージョン 9.0 に対応しました。Memorystore 以外で独自に運用している Redis や Valkey を Memorystore へ移行するためのパスも提供されます。 また、選べるノードサイズに小型と大型が加わり、ワークロードの規模に応じて性能とコストのバランスを取りやすくなりました。ブルームフィルタを提供する valkey-bloom 、JSON ドキュメントをネイティブに扱える valkey-json といったモジュールへの対応や、ACL、トークンベース認証、柔軟な認証局設定などのエンタープライズレベルのセキュリティ機能も整備されています。 参考 : Memorystore for Valkey の概要 Oracle AI Database@Google Cloud の拡張 Oracle AI Database@Google Cloud の提供が20リージョンまで拡大しました。なお、東京リージョンは2025年6月に対応済みです。 加えて、 Oracle GoldenGate Service のサポートが追加され、Oracle DB から BigQuery へのニアリアルタイムなデータレプリケーションが可能になります。さらに、前述の Knowledge Catalog(旧称 : Dataplex Universal Catalog)および Database Center との統合も発表されました。 参考 : Oracle Database@Google Cloud overview Compute Engine からマネージドサービスへの移行機能(Preview) Compute Engine 上で自前運用している PostgreSQL などのデータベースを、Cloud SQL や AlloyDB といったマネージドサービスへ移行できる機能が Preview 提供となりました。移行フローは Database Center にネイティブに統合されており、Database Center の画面からそのまま移行を開始できます。 PostgreSQL 向けにはネットワーキングとレプリケーションが自動化されており、最小限の作業とダウンタイムで移行できる点が特徴です。 Firestore の全文検索 / 地理空間検索(Preview) Firestore で 全文検索 および 地理空間検索 機能が Preview 提供となりました。これまで別サービスと組み合わせる必要があった検索機能が、Firestore 単体でサーバーレスに提供され、キーワード / フレーズ / 地理空間クエリに対して高い関連度で応答できます。 参考 : Use text searches 参考 : Use geo queries 佐々木 駿太 (記事一覧) G-gen 最北端、北海道在住のクラウドソリューション部エンジニア 2022年6月に G-gen にジョイン。Google Cloud Partner Top Engineer に選出(2024 / 2025 Fellow / 2026)。好きな Google Cloud プロダクトは Cloud Run。 趣味はコーヒー、小説(SF、ミステリ)、カラオケなど。 Follow @sasashun0805
G-gen の佐々木です。当記事では、Google Cloud Next '26 で発表された BigQuery に関する新機能について、公式の投稿記事「 What’s new in BigQuery: Powering the Agentic Era 」の内容をもとに紹介します。 はじめに Open, cross-cloud lakehouse Managed Iceberg Tables(GA) Iceberg REST Catalog の読み書き相互運用性(Preview) Cross-Cloud Lakehouse(Preview) Catalog Federation(Preview) リアルタイムデータレプリケーション(GA / Preview) Graph-based reasoning for enterprise agents BigQuery Graph(Preview) BigQuery Graph におけるメジャーのネイティブサポート(Preview) BigQuery Conversational Analytics におけるグラフサポート(Preview) BigQuery Graph と Looker の統合(Preview) BigQuery Studio での視覚的なモデリング機能(Preview) Native AI processing to unlock structured and unstructured data AI.PARSE_DOCUMENT(Preview) TabularFM(Preview) ObjectRef(GA) AI 連携関数の最適化モード(Preview) BigQuery ネイティブの Gemma エンベディング(Preview) 自律型エンベディング生成(GA) BigQuery Hybrid Search(Preview) Python UDF(GA / Preview) コネクテッドシートにおける TimesFM モデルの利用(GA / Preview) Geospatial Analytics Datasets(Preview) Agentic experiences BigQuery における Conversational Analytics(GA / Preview) Proactive Agentic Workflows(Preview) BigQuery Agent Analytics(GA / Preview) BigQuery Studio の新機能群(GA / Preview) データサイエンスエージェント(GA) Colab Data Apps(Preview) BigQuery Remote MCP Server(GA) BigQuery ADK Toolset(GA) Google Cloud Data Agent Kit(Preview) Unparalleled performance and scale Fluid Scaling(GA) 高度なランタイム、小規模クエリ、履歴ベースの最適化(GA) 新しいワークロード管理機能(GA / Preview) 可観測性の向上(GA / Preview) はじめに 以下の Google 公式投稿を参考に、Google Cloud Next '26 で発表された BigQuery の新機能を紹介します。なお、当記事で紹介する機能の提供ステータス(GA / Preview / Coming Soon)は 2026年4月23日現在の情報です。 参考 : What’s new in BigQuery: Powering the Agentic Era 他の Google Cloud Next '26 の関連記事は、Google Cloud Next '26 カテゴリの記事一覧から参照してください。 blog.g-gen.co.jp Open, cross-cloud lakehouse Managed Iceberg Tables(GA) Google Cloud Lakehouse (旧称 : BigLake )は、 Apache Iceberg などのオープンテーブル形式と Google Cloud のマネージドストレージを組み合わせた、オープンデータレイクハウス向けのストレージエンジンです。 Google Cloud Lakehouse における Managed Iceberg Tables は、OSS である Apache Iceberg のマルチエンジン互換性と BigQuery の高度な機能を組み合わせたマネージドな Iceberg テーブルで、自動テーブル管理、Iceberg パーティショニング、マルチテーブルトランザクション、変更データキャプチャ(CDC)、強化されたベクトル化(Enhanced Vectorization)、履歴ベースの最適化(History-based Optimizations)を提供します。 参考 : Google Cloud Lakehouse とは 参考 : Apache Iceberg テーブル Iceberg REST Catalog の読み書き相互運用性(Preview) Iceberg REST Catalog は、BigQuery、Spark、その他 OSS / サードパーティエンジンの間で Iceberg テーブルを共有するためのカタログです。 カタログ上での Iceberg テーブルに対する 読み書きの相互運用性 (Read/Write Interoperability)により、複数の Iceberg 互換エンジン(Apache Spark、Trino など)から Iceberg テーブルを作成 / 更新 / クエリできるようになります。 参考 : Openness without compromises for your Apache Iceberg lakehouse Cross-Cloud Lakehouse(Preview) Cross-Cloud Lakehouse は、AWS や Azure など Google Cloud 以外のクラウド上のデータに対して、データ移行や ETL を行うことなく BigQuery の分析機能や AI 機能をそのまま適用できる機能です。たとえば、Amazon S3 Iceberg 上のデータに対して Gemini Enterprise のエージェントや BigQuery の AI 関数などを実行できます。 Iceberg REST Catalog によるオープンスタンダードなテーブル共有と、 Cross-Cloud Interconnect によるクラウド間の高帯域幅ネットワークを組み合わせることで実現されています。 参考 : クロスクラウド レイクハウスについて 参考 : The future of data lakehouse: Open and interoperable for the agentic era 基盤技術である Cross-Cloud Interconnect については以下の記事をご一読ください。 blog.g-gen.co.jp Catalog Federation(Preview) Catalog Federation は、外部のメタデータカタログを BigQuery 側でフェデレーションする機能です。 AWS Glue、Databricks、SAP、Salesforce、Snowflake のカタログに対応しており、Confluent Tableflow についても2026年後半に提供予定です。データの発見、分析、ゼロコピー共有を、複数のカタログをまたいで実現できます。 リアルタイムデータレプリケーション(GA / Preview) Spanner 、 AlloyDB 、 Cloud SQL から BigQuery へのリアルタイムレプリケーション(GA)と、Iceberg テーブルへのレプリケーション(Preview)が提供されます。これにより、データベースの変更をリアルタイムに分析基盤側へ反映でき、レプリケーションパイプラインを別途整備する必要がなくなります。 Graph-based reasoning for enterprise agents BigQuery Graph(Preview) BigQuery Graph は、BigQuery 上でデータをグラフとしてモデル化 / 分析 / 可視化できるグラフ分析機能です。SQL の CREATE PROPERTY GRAPH 文で既存の BigQuery テーブルに対してエンティティ(ノード)と関係性(エッジ)を直接定義でき、データの移動や重複を伴わずにグラフ分析を行えます。 従来の SQL では「友達の友達の友達」のような多段階の関係性分析に複数の JOIN を入れ子にする必要があり、SQL の記述・読解が難しいうえ、データ規模が大きくなるとパフォーマンスが急激に低下する点が課題でした。グラフ分析では、データをノードとエッジの集合としてモデル化することで、こうした多段階の関係性を直感的に記述でき、深い探索もスケーラブルに実行できます。 BigQuery Graph はこうしたグラフ分析を BigQuery 上でネイティブに実行できる基盤として、不正検知、Customer 360、サプライチェーン分析、ソーシャルネットワーク分析などのユースケースに対応します。 参考 : BigQuery Graph の概要 参考 : BigQuery Graph のご紹介 : データに潜む関係性を明らかに BigQuery Graph におけるメジャーのネイティブサポート(Preview) メジャー (売上や解約率といった集計値を再利用可能な形で定義したもの)が BigQuery Graph 上でネイティブサポートされるようになりました。 これにより、メジャーとエンティティ間のリレーションシップを1つのガバナンスされた定義に統合でき、AI エージェントは単なる検索や集計に留まらず、あるビジネスイベントが他の指標にもたらす影響をマルチホップで辿るような構造的推論を行えるようになります。 参考 : メジャーを使用する BigQuery Conversational Analytics におけるグラフサポート(Preview) 自然言語データ分析の Conversational Analytics が BigQuery Graph と連携できるようになりました。会話分析エージェントが生テーブルではなくグラフ上のエンティティと関係を辿って推論するため、回答の精度が向上します。メジャーを用いて正確な KPI を計算すると同時に、関係性を辿ることで「なぜその数字になっているか」を発見できます。 BigQuery における Conversational Analytics の詳細については、以下の記事をご一読ください。 blog.g-gen.co.jp BigQuery Graph と Looker の統合(Preview) BigQuery Graph と Looker の統合により、BigQuery Graph をそのまま Looker のビューとして公開でき、定義した指標をデータスタック全体で再利用できます。 逆方向のユースケースとして、Looker 側で BigQuery Graph を定義することもできます。これにより、Looker が標準で備えるバージョン管理(Git 連携)や検証機能を、グラフ定義の変更管理にそのまま適用できます。 BigQuery Studio での視覚的なモデリング機能(Preview) BigQuery Studio 上で、BigQuery Graph のエンティティ、リレーションシップ、ビジネスロジックを視覚的に構築 / 管理できる新しいインターフェースが追加されました。グラフスキーマの設計を SQL の CREATE PROPERTY GRAPH 文だけでなく UI 上からも進めることができます。 Native AI processing to unlock structured and unstructured data AI.PARSE_DOCUMENT(Preview) マネージド AI 関数の1つである AI.PARSE_DOCUMENT は、OCR(光学文字認識)、レイアウト解析、チャンク分割を自動化する SQL 関数です。複雑なドキュメント処理ワークフローを別途のパイプラインを構築せずに簡素化でき、非構造化ドキュメントの取り込みを SQL で完結できます。 TabularFM(Preview) TabularFM は、表形式データに対する高品質な回帰・分類機能を提供する基盤モデルです。事前学習済みのモデルとして提供されるため、特徴量選択、チューニング、モデルトレーニング、デプロイ後のモデル管理といった工程を経ずに、SQL から直接呼び出して予測結果を得られます。 従来の BigQuery ML では、表形式データに対する分類・回帰モデルをユースケースごとに用意する必要があり、本格的に運用するまでに一定のセットアップコストがかかっていました。TabularFM はこれを共通の基盤モデルに置き換え、典型的な分類・回帰タスクをモデル開発の工程を踏まずに試せるようにします。 ObjectRef(GA) ObjectRef 値 は、SQL や Python から非構造化データと構造化データを並行して扱うための値です。以下のフィールドを持つ STRUCT として表現されます。 フィールド 型 モード 説明 uri STRING REQUIRED Cloud Storage オブジェクトの URI version STRING NULLABLE オブジェクトのバージョン authorizer STRING NULLABLE 委任アクセス用の BigQuery 接続 ID。直接アクセスの場合は NULL details JSON NULLABLE オブジェクトのメタデータや処理時のエラー情報などが入る ObjectRef 値を操作するための SQL 関数として、以下の4種類がサポートされています。 関数 用途 OBJ.FETCH_METADATA URI のみが埋まった ObjectRef 値に Cloud Storage 上のメタデータを取り込み、完全な ObjectRef 値を返す OBJ.GET_ACCESS_URL ObjectRef が指す Cloud Storage オブジェクトへのアクセス URL(読み取り / 読み書き)を JSON 値で返す(委任アクセスが必要) OBJ.GET_READ_URL ObjectRef が指す Cloud Storage オブジェクトの読み取り用 URL を STRUCT( url 、 status )で返す(URL は45分で失効、委任アクセスが必要) OBJ.MAKE_REF Cloud Storage URI などから ObjectRef 値を生成する 参考 : ObjectRef functions 参考 : ObjectRef 値を操作する AI 連携関数の最適化モード(Preview) Optimized Mode により、 AI.CLASSIFY や AI.IF などの SQL から呼び出せる AI 関数で、タスク固有のモデルをクエリ実行時に動的にトレーニングして利用できます。これにより、従来の行単位でモデルを呼び出す場合と比較して、トークン消費量を230分の1に削減できます。 BigQuery ネイティブの Gemma エンベディング(Preview) Gemma ベースの組み込みテキストエンベディングモデル embeddinggemma-300m が、 AI.EMBED 関数および AI.SIMILARITY 関数で利用できるようになりました。エンベディング生成には BigQuery のスロットがそのまま使われるため、GPU 環境を別途用意することなく、検索や RAG 向けのエンベディングパイプラインを構築できます。 参考 : The AI.EMBED function 参考 : The AI.SIMILARITY function 自律型エンベディング生成(GA) Autonomous Embedding Generation (自律型エンベディング生成)は、テーブルのテキスト列(STRING 列)から生成するベクトルエンベディングをフルマネージドで維持する機能です。エンベディングモデルが生成したベクトルを自動メンテナンスし、ソース列のデータが追加・更新されるたびに自動で再生成されます。これにより、煩雑になりがちなエンベディング作成・更新ジョブの運用を簡素化できます。 参考 : 自律型エンベディング生成 BigQuery Hybrid Search(Preview) BigQuery Hybrid Search はセマンティック検索と全文検索を単一の関数に統合する検索機能で、RAG や複雑な探索系ユースケースにおいて、単独の検索よりも高い精度を実現します。 Python UDF(GA / Preview) Python UDF は、Python で独自実装したスカラー関数を BigQuery で利用する機能です。データの拡張・変換・クリーニングなどが行え、コンテナを用いたサーバーレス実行環境により数百万行規模まで自動スケールします。 以下の機能が新たに Preview 提供となり、Python UDF は今後数週間にわたって段階的に GA となる見込みです。 Apache Arrow の RecordBatch インターフェースを使ったベクトル化 Python UDF を作成でき、行単位の呼び出しと比べてパフォーマンスを改善できる CPU 使用率、メモリ使用率、インスタンスごとの最大同時リクエスト数などのメトリクスを Cloud Monitoring にエクスポートできる CREATE FUNCTION 文に追加された container_request_concurrency オプションで、Python UDF のコンテナインスタンスごとの最大同時リクエスト数を制御できる イメージストレージのバイト数(プロジェクト・リージョンごとに 10 GiB)とミューテーションレート(プロジェクト・リージョンごとに1分あたり30回)の新しいクォータが適用される INFORMATION_SCHEMA.JOBS ビューの external_service_costs 列、および Job API の ExternalServiceCosts フィールドから Python UDF のコストを確認できる 参考 : Python のユーザー定義関数 コネクテッドシートにおける TimesFM モデルの利用(GA / Preview) コネクテッドシート は、BigQuery のスケールを Google スプレッドシート上で利用できる機能です。アップデートにより、組み込みの時系列予測モデル TimesFM を使った予測(GA)と異常検知(Preview)に対応し、業務担当者がスプレッドシートから大規模データに対する予測や異常検知を行えるようになります。 参考 : コネクテッド シートの使用 参考 : TimesFM モデル コネクテッドシートの利用方法については、以下の記事をご一読ください。 blog.g-gen.co.jp Geospatial Analytics Datasets(Preview) Geospatial Analytics Datasets は、 Google Maps Platform 由来のデータセットと Earth Engine のラスターデータおよび解析機能を BigQuery 上で直接扱えるようにする機能です。地理空間データの取得・前処理を自前で組まなくても、BigQuery の他のデータセットと同じ感覚で参照できます。 提供されるデータセットは以下の4種類です。 データセット 内容 Imagery Insights ストリートビューの画像 Places Insights Google マップ上のビジネス / スポットの集約データ Roads Management Insights 道路ネットワークの交通流・混雑状況 Earth Engine in BigQuery Earth Engine の衛星画像・ラスターデータと解析機能 参考 : Power up your BigQuery analysis with Google's new geospatial datasets Agentic experiences BigQuery における Conversational Analytics(GA / Preview) BigQuery の Conversational Analytics (対話型分析)は、自然言語を用いて BigQuery 上のデータに対する質問を生成 AI に投げかけ、分析を行うことができる機能です。予測分析や、構造化・非構造化データを横断した推論もサポートします。 BigQuery Studio および API 経由での利用は GA、データポータル(英名 : Data Studio、旧称 : Looker Studio)および Gemini Enterprise からの利用は Preview 提供となっています。 参考 : BigQuery の会話型分析 BigQuery の対話型分析機能の詳細については、以下の記事をご一読ください。 blog.g-gen.co.jp Proactive Agentic Workflows(Preview) Proactive Agentic Workflows は、エージェントが単なる対話型の質問応答を超えてプロアクティブに動作する機能です。指標の変化を検知して根本原因分析を行い、定期的な調査レポートをメールで直接配信するといったユースケースに対応します。 BigQuery Agent Analytics(GA / Preview) BigQuery Agent Analytics は、AI エージェントのアクティビティ(イベント)を BigQuery に記録し、分析できるようにする機能です。エージェントのトラブルシューティング、最適化、定量評価に活用できます。 エージェント向けのプラグインとして、 Agent Development Kit (ADK)向けのプラグインは GA、 LangGraph 向けのプラグインは Preview として提供されています。 BigQuery に記録されるイベントの種類は、以下のようなものがあります。 イベントの種類 内容 LLM interactions LLM へのプロンプト、モデル出力、エラーに関するイベント トークン使用量、生成にかかった時間なども記録される Tool usage ツール呼び出しの開始、完了、エラーに関するイベント ツールの呼び出し元( tool_origin )も記録される State Management エージェントの内部状態の変更に関するイベント Agent lifecycle & Generic Events エージェントの起動、実行完了、ユーザー入力の受信などのイベント Human-in-the-Loop (HITL) Events ユーザー認証情報の要求、ユーザーへの確認要求、ユーザーからの入力要求などの割り込みイベント 参考 : Use BigQuery agent analytics 以下の記事では、BigQuery Agent Analytics の ADK 向けプラグインの使い方を紹介しています。 blog.g-gen.co.jp BigQuery Studio の新機能群(GA / Preview) BigQuery Studio は BigQuery の各種機能を Google Cloud コンソールに統合した BigQuery 向けのワークスペースです。今回のアップデートで複数の機能が追加されました。 機能 ステータス 内容 コンテキスト認識型アシスタント Preview リソース探索やトラブルシューティングを支援 SQL Cells GA SQL と DataFrames を統合 Visualization Cells GA ノートブック内で直接ビジュアルを作成 Files Explorer GA フォルダ形式でコード資産を整理・共有・管理 Git Integration and Workflows Preview GitHub、GitLab、Bitbucket、Azure DevOps に対応した Git 連携 参考 : BigQuery 分析の概要 - BigQuery Studio データサイエンスエージェント(GA) データサイエンスエージェント (Data Science Agent)は、Colab Enterprise ノートブック上で動作する AI エージェントです。自然言語で目標を述べるだけで実行計画を自動生成し、データのロード、クリーニング、ビジュアライゼーションを自動で進めます。内部的には BigQuery ML、DataFrames、Spark を組み合わせて利用しています。 Colab Enterprise のほか、BigQuery Studio 上で Colab Enterprise ノートブックを開くことでも、データサイエンスエージェントを利用することができます。 参考 : BigQuery で Colab Enterprise データ サイエンス エージェントを使用する データサイエンスエージェントの詳細については、以下の記事をご一読ください。 blog.g-gen.co.jp Colab Data Apps(Preview) Colab Data Apps は、BigQuery Studio のノートブックで作成したデータ分析を、Python 製のインタラクティブアプリに変換できる機能です。アプリは BigQuery のスロットを使用してフルマネージドな環境で実行されます。 アプリの公開・共有はデータポータル側で行い、エンドユーザーはコードを編集することなく、UI 上で日付範囲やフィルタなどのパラメータを変更してデータを操作できます。 参考 : BigQuery とデータポータルで Colab Data Apps を使用する BigQuery Remote MCP Server(GA) BigQuery Remote MCP Server は、 Model Context Protocol (MCP)対応のリモートサーバーをマネージドで提供するものであり、AI エージェントが MCP を介して BigQuery を操作できるようになります。 参考 : Use the BigQuery MCP server Google Cloud が提供している MCP サーバーについては、以下の記事をご一読ください。 blog.g-gen.co.jp BigQuery ADK Toolset(GA) BigQuery ADK Toolset は、Agent Development Kit(ADK)を用いて構築したエージェントが BigQuery 上のデータを閲覧・操作するためのツールセットです。 参考 : BigQuery tool for ADK Google Cloud Data Agent Kit(Preview) Google Cloud Data Agent Kit は、IDE、ノートブック、ターミナルといった開発環境を問わずに利用可能な、エージェントによるデータ活用を支援する一連の機能を提供するスイートです。VS Code 拡張機能、MCP サーバー、Gemini CLI / Codex / Claude Code 向けのスターターパックといった複数の形態で提供されます。 エージェントは BigQuery、AlloyDB、Cloud SQL(MySQL / PostgreSQL)、Spanner、Cloud Storage などの Google Cloud 上のデータソースに接続し、以下のような作業を支援します。 Python や SQL でのクエリ実行、および自然言語による問い合わせを介したデータの検出・探索 Managed Service for Apache Spark や BigQuery でのデータエンジニアリングパイプラインの構築・テスト・デプロイ データの探索・クリーンアップから ML モデルの学習・デプロイまでを行う AI / ML 開発 組み込みの AI スキルやツールを使った反復的なタスクの自動化 参考 : VS Code 用 Data Agent Kit 拡張機能の概要 参考 : Data Agent Kit Starter Pack(GitHub) Unparalleled performance and scale Fluid Scaling(GA) Fluid Scaling は、変動の大きいワークロードに対して、コストとパフォーマンスのトレードオフを必要としない BigQuery 向けのオートスケーリング機能です。秒単位課金により細かい粒度でスケールでき、最大34%のコスト削減が可能です。 高度なランタイム、小規模クエリ、履歴ベースの最適化(GA) BigQuery のクエリエンジンに、 高度なランタイム 、 小規模クエリの最適化 、 履歴ベースの最適化 が適用されました。これらは BigQuery ネイティブテーブルと Iceberg テーブルの双方のワークロードに対して、コードやスキーマの変更なしに自動で適用されます。これにより、前年比でクエリ速度を35%向上させつつ、クエリ処理コストを40%削減しています。 新しいワークロード管理機能(GA / Preview) reservation groups (GA)、 flexible dynamic assignments (Preview)、 プロジェクトレベルのスロット / 同時実行制御 (Preview)といった新しいワークロード管理機能が追加され、きめ細かなコスト配分と価格性能比の制御ができるようになりました。さらに、 宣言型・ルールベースのワークロード管理 (Preview)により、これらの管理を簡素化できます。 可観測性の向上(GA / Preview) ミッションクリティカルなワークロード向けに、 Enhanced Observability (GA)、 Intersection Routing (Preview)、 Agent-Ready Security Center (Preview)といった可観測性・ディザスタリカバリ・セキュリティ関連の機能が追加・強化されました。さらに、 Agent-Powered Observability (Preview)により、AI エージェントによるターンキーなトラブルシューティングで運用を簡素化できます。 佐々木 駿太 (記事一覧) G-gen 最北端、北海道在住のクラウドソリューション部エンジニア 2022年6月に G-gen にジョイン。Google Cloud Partner Top Engineer に選出(2024 / 2025 Fellow / 2026)。好きな Google Cloud プロダクトは Cloud Run。 趣味はコーヒー、小説(SF、ミステリ)、カラオケなど。 Follow @sasashun0805
データベースでNULL値を扱う際に問題となる「3値論理」について解説します。従来の真偽(True/False)に未知(Unknown)が加わることで、SQLクエリがエンジニアの想定外の挙動を引き起こすことがあります。PostgreSQLの具体的な例を用い、NULL許容列に対する比較処理で発生する問題と、`IS NULL`や`COALESCE`関数を使った正しいデータ取得方法を紹介し、NULL値の適切な扱い方の重要性を説明します。

動画

書籍