
DX
イベント
マガジン
技術ブログ
本ブログは 【寄稿】AI民主化に向けた丸紅の取組 (丸紅株式会社)の続編です。 みなさん、こんにちは。総合商社を担当しているソリューションアーキテクトの林です。 前回のブログでは、 丸紅株式会社 デジタル・イノベーション部が内製で開発した社内生成 AI プラットフォーム「Marubeni Chatbot」の誕生から、7,500 人以上への展開、そして業務時間 25〜65% 削減という成果をご紹介しました。 あれから約1年半。丸紅グループの生成AI活用は、さらに大きく進化しています。前回のブログに引き続き、デジタル・イノベーション部 芹川 武尊 氏からお話を伺いました。 今回は、Marubeni Chatbot のその後の進化に加え、新たに立ち上がった 3 つの取り組みをご紹介します。丸紅グループが生成 AI をどのように業務や開発の現場に根付かせてきたか、ぜひご覧ください。 Digital Experts 株式会社について 丸紅グループの生成 AI 活用を語る上で欠かせない存在が、 Digital Experts 株式会社 です。丸紅グループ各社の新たな取り組みに対し、高いエンジニアリング力で実証から実装・運用まで一気通貫で支援する会社です。 Digital Experts の最大の特徴は、 全社員がコーディングエージェントを用いて日常の開発業務を行っている 点です。 社内プレゼン作成ツールをはじめ、業務に必要なシステムを自分たちで開発・活用するなど、生成 AI を日常の開発業務に深く組み込んでいます。本ブログで紹介する取り組みの多くは、丸紅 デジタル・イノベーション部と Digital Experts の緊密な連携によって実現したものです。 取り組み1:Marubeni Chatbot — エージェント AI への進化 前回ブログでご紹介した Marubeni Chatbot は、登録ユーザー数が 7,500 人以上から 10,000 人以上 へと拡大し、丸紅グループ全社の日常業務に欠かせないプラットフォームへと成長しました。 AI エージェントの搭載 基本的な対話 UI に加え、LLM が自律的に試行錯誤を行い複雑なタスクをこなすエージェント機能の搭載を進めています。 このエージェント機能の中核を担うのが、 Amazon Bedrock AgentCore です。AgentCore Runtime を活用することで、従来のサーバーレス構成では課題となっていた長時間実行のタイムアウト問題を解消し、複雑なエージェントタスクを安定して実行できる環境を実現しています。 Marubeni Chatbotのアーキテクチャ図 今までの機能に加え、新たに以下のような機能も追加されています。 PowerPoint 自動生成ツール :高品質なプレゼンテーションを半自動で生成。社内プレゼン作成の工数を大幅に削減 データ分析・ドキュメント生成システム :社内情報を参照した上で、データ分析からドキュメント生成までを一気通貫で実行 Marubeni Chatbotの画面イメージ 取り組み2:競合分析システム — 対話形式で市場を読み解く 総合商社において、市場や競合の動向を迅速に把握することは、事業判断の精度を左右する重要な要素です。丸紅は、外部データソースや Web 上の情報を AIと組み合わせることで、競合分析を支援するシステムを構築しました。 本システムでは、財務データベース、Web データ、ユーザーがアップロードした PDFなど、複数のデータソースを横断的に蓄積・参照できる基盤を整備しています。LLM が Tool useを通じて必要なデータへ動的にアクセスすることで、競合企業の候補を AI が列挙し、各社の事業概要や財務状況の要約、 比較分析からレポート作成までを対話形式で AIが支援 します。 競合分析システムの画面イメージ 競合分析業務では、多数の企業情報の収集・整理に加え、財務指標の横断分析や市場ポジションの評価など、長時間かつ複雑な処理が求められます。こうした要件に対応するため、AI エージェントの実行基盤として Amazon Bedrock AgentCore を採用しました。これにより、 AWS Lambda の実行時間制約を超える長時間の自律的な情報収集・分析を実現しています。 さらに、Web 上の公開情報に加え、信頼性の高い外部データソースの定量データを組み合わせることで、実務の意思決定に活用できる分析品質を確保しています。 ユーザーは、「このセクターの競合他社の財務状況を比較して」「最新のニュースを踏まえてリスクを整理して」といった自然言語での問いかけを行うだけで、AIがリアルタイムに関連データを参照しながら回答を生成します。 競合分析システムのアーキテクチャ図 取り組み3:水道管路 AI 劣化予測診断サービス — 作業時間を 99% 削減 丸紅株式会社の旧環境インフラプロジェクト部と Digital Experts 株式会社が共同で開発した、水道管路の AI 劣化予測診断サービスです。日本全国の自治体が抱える水道インフラの老朽化問題に対し、人手不足・技術継承の困難・予算制約という課題を AI で解決することを目指しました。 自治体から管路データを受領し、データの前処理・AI での分析・レポーティングまでの業務全体の作業時間を 5 ヵ月から 1.5 ヵ月へ大幅に削減 。さらに、AI を活用したデータサイエンス業務の自動化により、 分析作業を約 99% 削減 することに成功しました。 AI による分析結果を GIS(地理情報システム)上に反映することで、更新が必要な管路を視覚的に把握できるようになり、自治体の意思決定を大きく支援しています。スモールスタートから始め、ビジネスの成長に合わせて柔軟にスケールできる構成を採用しており、 AWS Control Tower と AWS IAM を活用したマルチアカウント構成により、異なるアクセスレベルのメンバーへの適切な権限分離を実現。機密保護と効率的な共同開発を両立しています。 水道管路 AI 劣化予測診断サービス アーキテクチャ図 取り組み4:AI DLC Unicorn Gym — 「AI と共に開発する」文化の醸成 Marubeni Chatbot の展開や競合分析・水道管路診断といった取り組みを通じて、丸紅グループ内で生成 AI の活用が着実に広がっていました。こうした流れを受け、AWS から「開発プロセスそのものに AI を組み込む」次のステップとして提案・実施したのが、AI DLC Unicorn Gym です。 2026 年 2 月、丸紅株式会社と Digital Experts 株式会社、 丸紅I-DIGIOホールディングス株式会社 の合計 23 名が参加した 3 日間の AI DLC Unicorn Gym を開催しました。 AI DLC Unicorn Gym とは AI-DLC とは、AI をソフトウェア開発の中心的な協働者として位置づけ、開発ライフサイクル全体に AI の能力を組み込む新しい開発手法です。AI が計画を立案・実行し、人間が重要な意思決定を担うという役割分担のもと、Inception(要件定義)・Construction(設計・実装)・Operations(デプロイ・運用)の 3 フェーズで開発を進めます。 Kiro といったコーディングエージェントを活用することで、開発速度を大幅に向上させることができます。AI DLC Unicorn Gym は、この手法を実際のプロダクト開発を通じて体験する AWS のプログラムです。 実業務テーマで挑む 3 日間:開発から成果発表まで 「社内ユーザー用のサンドボックスアプリ基盤」「牛体重推定アプリ」「Marubeni Chatbot 内でのSkills 共有プラットフォーム」「稼働管理ツール」「議事録作成システムの高度化」と、領域・規模感の異なる 5 テーマに取り組みました。途中で方向修正が発生したチームもありましたが、生成 AI を活用することで修正コストを大幅に抑え、 全チームが 3 日間で成果物を完成 させました。最終発表では AWS にデプロイした環境を用いたデモを実施するチームもいました。非エンジニアはAIに要件を伝えるとともにビジネス上の意思決定を行い、エンジニアはAIが生成した成果物をレビューし、要件が正しく反映されていることを確認することで、「AI を使えば自分たちでも作れる」という実感を得る場となりました。「AI-DLC がいかに強力なツールであるかは、ワークショップを体験してみないとなかなか伝わりづらい」というアンケートコメントが象徴するように、実際に手を動かすことで初めて実感できる体験となりました。 最終発表会の様子 議事録作成システム(成果物デモ画面) おわりに Marubeni Chatbot はエージェント機能を搭載し 10,000 人超の日常業務を支えるプラットフォームへと進化。競合分析システムや水道管路 AI 劣化予測診断サービスでは、AI が業務の中核を担い、定量的な成果を生み出しています。そして AI DLC Unicorn Gym では、エンジニア・非エンジニアが共同するAIネイティブなソフトウェア開発プロセスを体感できました。 AWS は今後も、丸紅グループの生成 AI 活用がさらに広がり深まるよう、技術・知見の両面から支援を続けてまいります。本ブログが、皆さまの生成 AI 活用の参考になれば幸いです。 著者プロフィール 芹川 武尊 (Takeru Serikawa) 丸紅株式会社 デジタル・イノベーション部 2022年 東京大学大学院情報理工学系研究科修士課程修了。情報理工学修士(数理最適化に関する研究)。大学院修了後、丸紅株式会社に入社。入社後は、物流関連最適化システムの開発や、生成AIを活用したグループ会社向けChatbotアプリの開発など丸紅グループを横断したプロジェクトに参画。 林 隆太郎 (Ryutaro Hayashi) アマゾンウェブサービスジャパン 総合商社・エネルギー業界担当 ソリューションアーキテクト 大手ガス会社にてガススマートメーター・電力トレーディングのシステム開発を経験した後、総合商社にて全社の IT/DX 推進と国内外のエネルギー領域での事業投資・新規事業開発を担当。現在は AWS 総合商社・エネルギー業界のソリューションアーキテクトとして、業界知識を活かした AWS 活用に携わる。
定義・導入メリットから実装戦略までを役立つ形で解説 第1章:データガバナンスとは? 1-1. データガバナンスの定義 データガバナンスとは、「誰が、どのようなデータを、どのような状況で、どのような方法で利用できるか」を組織的に定義・統制するためのルール、プロセス、そしてそれらを支えるテクノロジーの包括的な枠組みです。 単にデータを「保管」することではなく、企業全体でデータを「資産」として捉え、その価値を最大化するための戦略的な取り組みです。データの品質、セキュリティ、アクセス権限、コンプライアンスなど、多岐にわたる要素を一元的に管理することが求められます。 具体的には、データガバナンスは以下のような問いに答えるための仕組みです。 データの所在と内容: 自社にどのようなデータが存在し、どこに保管されているのか? 権限と責任: そのデータに対して誰がアクセスでき、誰が品質に責任を持つのか? 品質の担保: そのデータは正確で、完全で、最新の状態に保たれているか?信頼して意思決定に使えるか? 利用ルール: どのような目的で、どのような条件のもとで利用が許可されるのか? ライフサイクル: データはいつ作成され、どう加工され、いつ廃棄されるのか? これらの問いに対して、場当たり的な対応ではなく、組織として一貫した方針と仕組みを持つこと——それがデータガバナンスの本質です。 1-2. データガバナンスの対象範囲 データガバナンスが対象とする「データ」は、基幹システム内の構造化データだけではありません。現代の企業が扱うデータは、以下のように多様化しています。 構造化データ: データベースやスプレッドシートに格納された、行と列で整理されたデータ(売上、顧客情報、在庫数など) 半構造化データ: JSON、XML、ログデータなど、一定の構造はあるが固定スキーマに収まらないデータ 非構造化データ: テキスト文書、画像、音声、動画、メールなど、フォーマットが定まっていないデータ 特に生成AIの普及により、非構造化データの活用ニーズが急速に拡大しています。これらすべてのデータを横断的に統制できるガバナンスの枠組みが、今日の企業には求められています。 1-3. データマネジメントとの違い データガバナンスと混同されやすいのが「データマネジメント」です。両者は密接に関連しますが、役割が明確に異なります。 観点 データガバナンス データマネジメント 役割 戦略・統制(What / Who) 実行・運用(How) たとえ 交通ルールを策定する 実際に車を安全に運転する 主な問い 何をすべきか?誰が責任を持つか? どう実行するか?どう維持するか? 主な担い手 経営層、データオーナー、ガバナンス委員会 データエンジニア、DBA、運用チーム 成果物 ポリシー、基準、役割定義 データベース、ETLパイプライン、バックアップ ガバナンスなきマネジメントは「地図なき航海」 に等しく、いくら技術力があっても組織として正しい方向に進めません。逆に、 マネジメントなきガバナンスは「絵に描いた餅」 であり、立派なルールがあっても実行されなければ意味がありません。 つまり、ガバナンスは「何を、誰が、なぜやるか」を決め、マネジメントは「それをどう実行するか」を担います。両者は車の両輪として機能すべきものであり、どちらか一方だけでは成果は生まれません。 1-4. データガバナンス導入のメリットと、不在時のリスク データガバナンスは「あると便利」なものではなく、不在の場合に深刻な問題を引き起こすものです。導入によるメリットと、ガバナンスが欠如した場合に起こる典型的な問題を対比して整理します。 データ品質の向上: 組織全体でデータの定義やルールを統一することで、信頼できるデータに基づく意思決定が可能になります。ガバナンスがなければ、部署ごとにKPIの定義が異なり、経営会議で「どの数字が正しいのか」が議論の的になる——こうした日常的な混乱が生まれます。 意思決定の迅速化: データへのアクセスルールが明確に定義されていれば、適切な権限を持つユーザーはセルフサービスでデータを活用できます。一方、ガバナンスがなければ、セキュリティ懸念からIT部門がすべてのデータ提供を手動で管理せざるを得ず、「依頼待ち」のボトルネックが常態化します。 dotDataがお客様とAI・データ活用プロジェクトを実施する中で、もっとも時間・工数・手戻りが大きいのが「仕様通りのデータにプロジェクトメンバーがアクセスできるようになること」です。しっかりとしたガバナンスが整備されているお客様と、そうでない場合とでは、データ準備の不備による期間・工数の圧迫に明確な差が表れており、プロジェクトの期間短縮と成果の品質に直結しています。 セキュリティ・コンプライアンスの強化: 「誰がいつ何のデータにアクセスしたか」を追跡可能にすることで、規制対応と監査の負荷を大幅に軽減します。ガバナンスが不在のままでは、アクセス権限の管理が属人化し、情報漏洩や法規制違反のリスクが高まり続けます。 AI活用の加速: AIモデルの精度は投入されるデータの品質に直結します。「Garbage In, Garbage Out」の格言どおり、データの品質や来歴が不明な状態ではAIプロジェクトは頓挫しやすく、ガバナンスの整備がAI開発の生産性を左右します。 コスト最適化: ガバナンスによりデータの信頼性が担保されることで、重複管理や誤った意思決定の手戻りといった「隠れたコスト」を削減できます。逆に、各部署が独自にデータを管理するサイロ化の状態では、同じデータの重複コピーが乱立し、ストレージコストと運用負荷が膨張します。 これらの問題は、小さな組織では見過ごされがちですが、データ量やAI活用が拡大するにつれて指数関数的にリスクが増大します。だからこそ、早期にガバナンスの枠組みを構築することが重要なのです。 第2章:なぜ今、データガバナンスが再注目されているのか? データガバナンスが今再注目されている理由は、AI/MLの急速な普及、「守り」から「攻め」へのパラダイムシフト、グローバルな規制強化、そしてデータのサイロ化という4つの構造的変化にあります。データガバナンスという概念自体は新しいものではありませんが、2020年代に入り、その重要性はかつてないほど高まっています。 2-1. AI/ML活用の急速な進展とデータ爆発 生成AIや機械学習の急速な普及により、企業が扱うデータの量・種類・複雑性は爆発的に増大しています。構造化データだけでなく、テキスト、画像、音声といった非構造化データもAIの入力となる現在、従来の管理手法では対応しきれない状況が生まれています。さらに、AIエージェントが自律的にデータを参照・処理する時代に入りつつある今、「どのデータにどのAIがアクセスしてよいか」という新しい次元の統制も必要になっています。 一方で、AIモデルの学習には大量の高品質データが不可欠です。「データの量は十分だが、品質がAIに使えるレベルに達していない」——これは多くのAIプロジェクトが直面する共通課題です。AIの精度を高めるためには、データの正確性、完全性、一貫性、鮮度を組織的に保証するガバナンスの仕組みが欠かせません。 2-2. 「守り」から「攻め」へのパラダイムシフト かつてのデータガバナンスは、セキュリティやコンプライアンスといった「守り」の側面が主でした。しかし現在、データをビジネス価値に直結させる「攻め」のガバナンスが求められています。ガバナンスの目的が「データを制限する」ことから「データを安全かつ迅速に活用する」ことへとシフトしているのです。 この変化を象徴するのが、「ガードレール」という考え方です。従来の「関所型」ガバナンス(=IT部門に申請して許可を得ないとアクセスできない)から、「ガードレール型」ガバナンス(=ルールの範囲内で自由に活用できる)への移行——高速道路のガードレールが安全に高速で走行するための仕組みであるように、現代のデータガバナンスも現場の活用を加速させるための仕組みであるべきです。 2-3. 規制強化とグローバル化 GDPR(EU一般データ保護規則)、日本の改正個人情報保護法、米国のCCPA/CPRA、中国のPIPLなど、世界各地でデータプライバシーに関する規制が強化されています。これらの規制は、データの取り扱いに対する組織的な説明責任(アカウンタビリティ)を厳しく求めています。 特にグローバルに事業を展開する企業にとっては、各国・地域の異なる規制に同時に準拠する必要があり、統一されたガバナンスフレームワークなしには対応が困難です。違反時の制裁金も高額化しており(GDPRでは年間売上高の最大4%)、ガバナンスはもはや「あればよい」ではなく「なくてはならない」ものとなっています。 2-4. データのサイロ化と「野良データ」問題の深刻化 2010年代のセルフサービスBI・データ分析ブームは、現場のデータ活用を加速させた一方で、新たな問題も生みました。各部署が独自のデータマートやスプレッドシートを作成し、定義の異なるデータが組織内に乱立する「スプレッドマート(野良マート)」問題です。過去の担当者が構築したデータパイプラインが、退職後もブラックボックスとして動き続けるケースも増えています。 こうした「野良データ」や「ブラックボックス化したパイプライン」は、データの信頼性を蝕み、全社的な意思決定の質を低下させます。この反省から、単なる「自由なデータ活用」ではなく、「統制された自由」——すなわち、ガバナンスの枠組みの中でセルフサービスを実現するアプローチが求められるようになりました。 2-5. データ管理の歴史的変遷から見る必然性 こうした背景を俯瞰すると、データ管理のアプローチは大きく3つの世代を経て進化してきたことがわかります。 世代 時代 主なアプローチ 強み 課題 第1世代 〜2000年代 中央集権型MDM(IT部門主導) データの正確性・一貫性 変化への対応が遅い、「箱物化」のリスク 第2世代 2010年代〜 セルフサービス型(現場主導) 分析のスピード・機動力 サイロ化、野良データの乱立、ガバナンス不在 第3世代 2020年代〜 統合データガバナンス(IT+現場の協調) 信頼性とスピードの両立 実装の技術的複雑性、組織文化の変革が必要 第1世代の「堅牢だが遅い」管理と、第2世代の「速いが統制が効かない」活用。この両者の長所を融合し、AI時代に対応する「第3世代」のアプローチが、まさに今求められている統合データガバナンスです。この詳細については、第5章で改めて掘り下げます。 第3章:データガバナンスを支える「3つの柱」 データガバナンスを実効性あるものにするには、「人」「プロセス」「テクノロジー」の3つの要素が不可欠です。どれか一つが欠けても、ガバナンスは「絵に描いた餅」に終わります。よくある失敗パターンは、テクノロジー導入だけに注力し、それを運用する人や業務プロセスの設計が後回しになるケースです。3つの柱をバランスよく整えることが、持続可能なガバナンスの鍵となります。 3-1. 人(組織・役割・文化) データガバナンスの成否を分ける最大の要因は、実はテクノロジーではなく「人」です。まず経営レベルでは、CDO(Chief Data Officer)のようなデータ戦略を統括するリーダーが、ガバナンスの全社推進を牽引する役割を担います。その下で、データの品質や定義に責任を持つ「データオーナー」、日常的に品質を監視・維持する「データスチュワード」、物理的な基盤を管理する「データカストディアン」といった役割を明確に定義することが重要です。 現場レベルでは、ガバナンスを「自分ごと」として根付かせる文化の醸成が不可欠です。特に、ビジネス部門・データアナリスト・データエンジニアの三者が連携する「三位一体モデル」は、ビジネスの知見・分析の専門性・技術基盤を結びつける実践的なフレームワークとして注目されています。 dotDataは多数の企業に ビジネスアナリティクス人材育成プログラム を提供していますが、その中で強く実感しているのは、ガバナンスとデータ活用を大きく推進するためには「データを分析する人材」以上に、分析結果からビジネスの価値を引き出す「理解者・活用者」の層を厚くすることが重要だという点です。こうした活用者層が増えることで、ガバナンス(守り)と活用(攻め)の好循環が加速します。 関連記事: CDOが知るべき成功する組織モデル(データドリブン組織の設計図 第2回) ガバナンスを推進するための経営レベルのリーダーシップと組織構造について解説しています。 関連記事: DX人材育成は「分析スキル」だけでは失敗する?(データドリブン組織の設計図 第3回) 現場でガバナンスを機能させるための「三位一体モデル」について詳しく解説しています。 3-2. プロセス(ルール・ワークフロー) データの収集・加工・共有・廃棄に至るライフサイクル全体をカバーする明確なプロセスを定義します。具体的には、データ品質の基準(どの項目がどの精度であるべきか)、アクセス申請と承認のフロー、新規データソース追加時のレビュー手順、問題発生時のエスカレーションルートなどが含まれます。 プロセス設計で最も重要なのは、「属人化しないこと」と「現場が無理なく従えること」の両立です。過度に厳格なプロセスは現場に無視され、形骸化の原因になります。一方、ルールが曖昧すぎると再びサイロ化や野良データの温床になります。現場の業務フローに自然に組み込まれる「ちょうどよい厳格さ」を見極めることが、プロセス設計の腕の見せどころです。 3-3. テクノロジー(ツール・基盤) 人とプロセスを支える土台が、テクノロジー基盤です。代表的な要素としては、データの所在と内容を一覧化する「データカタログ」、誰が何にアクセスできるかを制御する「アクセス制御」、データの加工経路を可視化する「データリネージ」などがあります。これらのツールにより、ガバナンスポリシーを自動的に適用・監視でき、人的リソースだけでは不可能なスケールでの統制が実現します。 テクノロジー選定にあたっては、個別のツールを積み上げるのではなく、プラットフォーム全体でガバナンス機能が統合されているかを重視すべきです。ツールごとにガバナンスが分断されると、管理の複雑性が増し、かえって統制が効かなくなるためです。この点については、第5章(統合データガバナンスとその実装)で詳しく掘り下げます。 第4章:ガバナンスの土台を築く ガバナンスを機能させるための土台は、データ基盤の整備、パイプラインとリネージの管理、データ品質の段階的向上、そしてセキュリティの確保の4つです。データが各システムに散在した「サイロ化」の状態では、どれほど立派なガバナンスポリシーも適用できません。まずこれらの土台を整備することが、ガバナンスの実効性を高める第一歩となります。 4-1. データ基盤の整備 データ活用のための基盤とは、単なるストレージではなく、データの収集・蓄積・加工・提供の一連のプロセスを支えるアーキテクチャ全体を指します。近年では、大量の非構造化データを低コストで保管できるデータレイクの柔軟性と、高速な分析クエリを可能にするデータウェアハウスの性能を融合した「レイクハウス」アーキテクチャが主流となっています。 データ基盤の構築において陥りがちな失敗は、「まず箱を作り、データを集めてから活用を考える」というアプローチです。基盤構築とユースケースの設計を並行して進める「アジャイルデータモデリング」の考え方を取り入れることで、投資対効果を早期に実感しながら基盤を成長させることが可能になります。 関連記事: データ活用のためのデータ基盤とは?構築プラクティスとアジャイルデータモデリング データ基盤の構築プラクティスとアジャイルデータモデリングの考え方を解説しています。 4-2. データパイプラインとリネージ管理 データがソースから最終的なレポートやAIモデルに至るまでの「移動・加工の経路」を統制することも、ガバナンスの重要な構成要素です。現実の企業では、散在する複数のデータソースから複雑なETL/ELT処理を経てデータが加工されています。この過程が手作業やアドホックな対応に依存していると、品質の劣化やロジックの不整合が紛れ込むだけでなく、属人化による「ブラックボックス化」のリスクも高まります。データパイプラインを構築してこの一連の処理を自動化することが、ガバナンスの実効性を支える基盤となります。 さらに、パイプラインの統制と合わせて重要なのが「データリネージ(来歴管理)」です。データの「家系図」を自動生成し、ソースから最終成果物までの全経路を可視化することで、上流の変更が下流のどの分析に影響するかを事前に把握(インパクト分析)できるようになります。問題が起きてから原因を追う「事後対応」から、影響を予測して備える「事前統制」への転換が実現します。 関連記事: データ活用とデータガバナンスに貢献するデータパイプライン データパイプラインの基本機能(収集・加工・統合・配信)と、データ品質およびガバナンスとの関係について詳しく解説しています。 4-3. データ品質の段階的向上:メダリオンアーキテクチャ 「データの品質を高めなければAIに使えない。しかし、品質を完璧にしてからでは永遠にAI活用が始まらない」——多くの企業が抱えるこのジレンマに対する現実的な解がメダリオンアーキテクチャです。ブロンズ(生データをそのまま蓄積)→ シルバー(クレンジング・標準化済み)→ ゴールド(特定の分析・AIユースケースに最適化)と、3つのレイヤーで段階的に品質を向上させます。 このアプローチの利点は、すべてのデータを一度に完璧にする必要がないことです。まず生データをブロンズに取り込み、優先度の高いユースケースからシルバー・ゴールドへと昇格させていくことで、ガバナンスとデータ活用を並行して進められます。特にゴールドレイヤーの構築においては、AIモデル向けの「特徴量エンジニアリング」が品質とビジネス価値を大きく左右します。 ある欧州の大手企業では、膨大な数の変数を「Big Feature Store」として手作業で管理していましたが、管理の肥大化と陳腐化が進み、新たなビジネスインサイトを届けられない状態に陥っていました。同社ではdotData Feature Factoryを導入し、シルバーからゴールドへのデータ加工(特徴量の作成)の大部分を自動化。結果としてBig Feature Storeを廃止し、管理コストの削減、最新インサイトの迅速な提供、分析サイクルの大幅な高速化を実現しています。 関連記事: Databricks DeltaとUnity Catalogを超えて:dotDataのFeature Factoryによるメダリオンアーキテクチャの革新 メダリオンアーキテクチャの各レイヤーと、特徴量エンジニアリングによるゴールドレイヤーの革新について解説しています。 4-4. AI時代のセキュリティとリスク管理 データを「攻め」に活用するためには、同時に堅固な「守り」も不可欠です。特に生成AIやLLM(大規模言語モデル)の活用が広がる中、AIモデルの学習データやプロンプトを通じた情報漏洩リスク、モデル自体のバージョン管理やバイアス検出といった、従来のデータ管理にはなかった新しいセキュリティ要件が浮上しています。 ここで難しいのが「攻めと守りのバランス」です。過度なセキュリティはイノベーションを阻害し、緩すぎればリスクが高まります。ガバナンスの土台として、データのアクセス制御やマスキングといった基本的な保護を確実に整備しつつ、現場のAI活用を萎縮させない設計が求められます。 関連記事: 生成AIセキュリティの最前線:LLM活用で考える「攻め」と「守り」のバランス 生成AI・LLM時代におけるセキュリティの最新要件と、攻めと守りのバランスについて詳しく解説しています。 第5章:統合データガバナンスとその実装 統合データガバナンスとは、中央でのポリシー管理と現場での分散活用を高度に両立させるアプローチであり、その実現にはクラウドデータプラットフォームのネイティブ機能の活用が不可欠です。多くの企業が直面する現実は、各ツールやシステムごとにガバナンスが「サイロ化」しているという問題であり、この課題を打破するのが統合データガバナンスの考え方です。 5-1. 従来のガバナンスの限界 ツールごとに異なるガバナンスポリシーが存在し、それらが連携していない状態では、組織全体での一貫したデータ統制は不可能です。たとえば、BIツールではアクセス制御が効いているのに、データレイクでは同じデータが無制限に参照できる——こうした「ガバナンスの穴」は、ツールが増えるほど広がります。 また、ガバナンスが「制限」として機能してしまうと、現場のイノベーションを阻害し、AI活用のボトルネックになりかねません。必要なのは、ツールやシステムを横断して一貫したポリシーを適用しつつ、現場の活用を妨げない仕組みです。 5-2. 「統合データガバナンス」という解 統合データガバナンスは、第2章で触れた第1世代(中央集権型MDM)の「信頼性」と、第2世代(セルフサービス型)の「機動力」を技術的に融合する第3世代のアプローチです。全社共通のガバナンスポリシーを一元管理しつつ、データの加工や分析の権限を現場に開放することで、AI時代に不可欠な「確実かつ迅速な意思決定」を組織全体で実現します。 その核心となる要素——データカタログ、Policy as Codeによるアクセス制御、データリネージ、セマンティックレイヤー、Zero-Copy、オープンテーブルフォーマット——これらを統合的に実装することが、AIが即座にビジネス価値を創出するための「AI Ready Data」への道筋を開きます。 関連記事: AI時代のデータ活用の鍵を握る「統合データガバナンス」とは? 統合データガバナンスの6つのコア要素と、クラウドデータプラットフォームを活用した実装戦略について深く掘り下げます。 5-3. 実装例:Databricksのレイクハウス思想とUnity Catalog 統合データガバナンスの考え方を具体的にシステムへ落とし込んでいる代表的なプラットフォームの一つがDatabricksです。Databricksは、データレイクとデータウェアハウスを統合した「レイクハウス」アーキテクチャを提唱しており、その中核となるUnity Catalogは、SQL分析からPython、機械学習モデルまでを共通のガバナンス下に置くことができます。オープンフォーマット(Delta Lake)をベースとした高い透明性と拡張性が特徴です。 関連記事: Databricks AI + Data Summit 2025レポート Unity Catalogの最新進化やAIエージェントの動向など、Databricksの最新ガバナンス機能についてレポートしています。 5-4. 実装例:SnowflakeのデータクラウドとSnowflake Horizon もう一つの代表的なプラットフォームがSnowflakeです。Snowflakeは、SaaSとしての運用の容易さと「Snowflake Horizon」による洗練されたガバナンス機能が特徴です。物理的なコピーを作らずにデータを共有できる「セキュアデータシェアリング」や、異なるクラウド間を跨いだ一元的なガバナンスを敷ける能力に優れています。 関連記事: Snowflake Summit 2025レポート AI時代に求められるクラウドデータプラットフォームのガバナンス進化についてレポートしています。 関連記事: 攻めと守りを両立する次世代データガバナンス:DatabricksとSnowflake 両プラットフォームのガバナンス機能を横断的に比較し、具体的な実装方法を詳しく解説しています。 まとめ:自社のフェーズに合わせたガバナンス構築のステップ データガバナンスの構築は、組織・基盤づくり、プラットフォーム活用、統合・高度化の3フェーズで段階的に進めるのが現実的です。一度に完成させるものではなく、自社の現状に合わせたスモールスタートから始め、段階的に成熟させていくことが重要です。 自社の現在地を知る:データ活用 内製化成熟度モデル ガバナンスの整備は、それ自体がゴールではなく、データ活用の内製化を段階的に進めるための基盤です。dotDataは多数の企業のデータ活用を支援する中で、組織のデータ活用力を5段階で捉える「内製化成熟度モデル」を提唱しています。自社がどのフェーズにいるかを把握することで、ガバナンスの優先課題と次のアクションが明確になります。 フェーズ レベル 概要 ガバナンスとの関係 Phase A Lv.1 業務活用 開発済みの分析結果を読み解き、業務成果を出す段階 自動化パイプラインからの出力を正しく活用するために、データ品質の担保が前提となる Lv.2 運用・保守 パイプラインの中身を理解し、保守や軽微な改良ができる段階 データの加工ロジックやエラー対応を理解し、品質を維持する力が求められる Phase B Lv.3 テーマ拡大 類型範囲で新規テーマを横展開できる段階 新しいデータソースの追加に伴い、アクセス権限やデータ定義の拡張管理が必要になる Lv.4 データ拡大 新たなデータを追加し、分析精度やインサイトを強化できる段階 データ品質の検出・クレンジングを自律的に行える力と、リネージ管理が不可欠になる Phase C Lv.5 完全内製化 企画からデータ準備、分析、実装まで全工程を自律的に構築・運用できる段階 統合データガバナンスの枠組みのもと、ガードレールの範囲内で自由にデータを活用できる状態 Phase Aでは「整備されたガバナンスの恩恵を受ける」段階、Phase Bでは「ガバナンスの仕組みを理解し、自ら拡張する」段階、Phase Cでは「ガバナンスのガードレールの中で自律的に活用する」段階と位置づけることができます。 データ活用 内製化成熟度モデル ― セルフチェックシート(PDF)をダウンロード 自社の現在のレベルを診断し、次のフェーズに進むために必要な取り組みを確認できます。各レベルにおける「ユースケース設計」「データ準備・加工」「分析・活用」「自動化パイプライン」の4領域のスキル要件を詳しく解説しています。 フェーズ別おすすめ記事 フェーズ 取り組み内容 おすすめ記事 ① 組織・基盤づくり CDOを中心とした推進体制の構築、データ基盤の整備、役割定義、品質基準の策定 CDOが知るべき組織モデル / 三位一体モデル / データ基盤とは? / データパイプライン / メダリオンアーキテクチャ ② プラットフォーム活用 Databricks / Snowflake等のガバナンス機能をネイティブに活用し、ポリシーをシステムに実装 Databricks・Snowflakeガバナンス / Databricks Summit 2025 / Snowflake Summit 2025 ③ 統合・高度化 統合データガバナンスの実現、AIセキュリティの確立、AI Ready Dataへの昇華 統合データガバナンス / AIセキュリティ 重要なのは、ガバナンスを「制限」ではなく「ガードレール」として捉えることです。第2章で触れたように、データを安全に、かつ迅速に活用できる環境を整えることこそが、AI時代の競争優位性を生み出す基盤となります。 まずはスモールスタートで始め、プラットフォームの機能を活用しながら、組織全体でデータドリブンな文化を醸成していきましょう。 The post データガバナンスとは? ― AI時代の企業競争力を左右する「データの統治」 appeared first on dotData .
はじめに 本ブログは 大豊建設株式会社 様と Amazon Web Services Japan 合同会社が共同で執筆しました。 みなさん、こんにちは。ソリューションアーキテクト 杉山 卓 です。 本ブログでは、大豊建設様が AWS を基盤として生成 AI を活用した「大豊 AI」を構築し、社内で活用されている取り組みを紹介します。議事録の自動生成、資料の要約、社内規程の検索、そして日常的な疑問への回答まで、業務の様々な場面で活躍しています。 2025 年 6 月の全社展開から約 8 ヶ月で、307 名の社員が利用し、累計 32,709 回以上の利用回数を記録するなど、幅広く活用されています。規程検索だけでも約 250 時間の業務時間削減を実現し、文書作成やファイル分析を含めると、さらに大きな効果が生まれています。今後は、施工計画書の作成支援や社内資料作成支援といった、エージェント技術を活用した業務効率化も目指しています。 建設企業が直面する業務効率化の課題 大豊建設様は、土木・建築工事を中心とした総合建設会社です。現場での施工管理や営業活動において、情報へのアクセス、文書作成、そして知識の共有は業務品質を維持する上で重要な要素です。 しかし、大豊建設様では長年、業務効率化において複数の課題を抱えていました。 まず、 社内の情報にアクセスしにくい という問題がありました。従来の文書管理システムでは、フォルダ構成が複雑で、どこに何の情報が格納されているのかが分かりにくい状態でした。「社内規程は、月に数回の頻度でアップデートが必要です」と大豊建設の落藤様が語るように、監査室の指摘や法改正に伴い社内規程が頻繁に更新されます。変更された規程がどこに格納されているのか探すのに時間がかかり、キーワード検索を利用しても意図しない文書まで検索結果に含まれてしまうという問題がありました。 社内規程の検索は、出張旅費規程のような全社員に関わるものから、土木工事における業者との契約に関する専門的なものまで多くの種類があります。現場監督や営業担当者が必要な情報を素早く見つけられないことは、業務効率の低下だけでなく、コンプライアンス上のリスクにもつながっていました。 また、工事が完了すると完成資料がシステムに格納されますが、その後は十分に活用されないまま保管されるだけでした。過去の類似工事の知見を活かすことができれば、施工計画書の作成や見積もりの精度向上に役立つはずですが、そのための仕組みが整っていませんでした。 次に、 文書作成の負担が大きい という課題がありました。資料や議事録の作成など、日々の業務には多くの文書作業が伴います。特に議事録の作成は、会議の内容を思い出しながら整理するのに時間がかかることも珍しくありません。 さらに、 中堅社員不足による知識共有の難しさ もありました。建設業界全体で抱える課題でもありますが、大豊建設様でも年齢層に偏りがあり、特に中堅社員と呼べる世代が不足しています。「現場によっては若手社員とベテランの所長がペアで工事を監督するケースも多く、若手からは『質問があっても聞くタイミングを逃しがち』という声を聴くことがありました」と落藤様は振り返ります。若手社員が基本的な疑問を気軽に相談できる環境が不足していました。 こうした課題を解決するため、生成 AI に法律や社内ルール、過去の知見などを連携させ、必要な情報を即座に得られるようにすることで、ミスを減らし、誰もが共通の情報にアクセスできる環境を整えることを目指されました。 「大豊 AI」を自作する挑戦 大豊建設様が生成 AI の活用を検討し始めたのは、2023 年末の頃でした。 それ以前から社内では竣工データの利活用を目指した検索システムの構築に取り組んでいました。しかし、検索精度を高めるためにはドキュメントへの適切なラベリングなど、システム外の運用負荷が高く、広く利用されるには至っていませんでした。 そういった中、生成 AI が登場しました。「人手によるラベリングなどの労力をある程度削減しながら、社内の文書検索ができるようになるのでは」という期待から、本格的な検討が始まります。さらに、同業他社が既に AWS 環境で生成 AI の検索システムを構築し、活用事例を発表していたことも後押しとなりました。「同業他社様ができるなら、私たちも実現できるはず」という前向きな姿勢で、大豊 AI を作成するプロジェクトを推進しました。 プロジェクトは段階的に進められました。2024 年 3 月、まずは LINE WORKS を使った AI ボットの構築から開始。モバイル端末から手軽に検索できる利便性を確認した一方で、長文のドキュメントを閲覧する際の見づらさといった課題も明らかになりました。 そこで 2024 年 10 月には、Web サイトでの提供へと方針を転換しました。同時に、生成 AI ワーキンググループを設置しました。本社だけでなく、各支店から業務に精通し、生成 AI 活用に興味を持つ 11 名のメンバーを集め、協力会社である ワンダーソフト株式会社 の 1 名を含めた 12 名体制でスタートしました。 生成 AI ワーキンググループでは、2024 年 10 月から 2025 年 4 月まで、計 4 回のミーティングを実施しました。第一回では「こういうことをやった方が便利なのではないか」という機能要件を議論し、その後のミーティングでは構築した機能の説明と今後の方向性を全体で検討していきました。現場の声を取り入れながら段階的に機能を拡充していったことが、後の成功につながります。 そして 2025 年 6 月、全社員に大豊 AI の展開を開始しました。社内の掲示板などを通じて「大豊 AI を作ったので、ぜひ使ってみてください」と案内し、興味を持った社員から順次利用が始まっていきました。 実際にどのように活用しているのか 「大豊 AI で、実際にどんなことをしているのか?」という疑問は、DX 推進を検討する多くの方が持つものです。ここでは、現場での具体的な活用シーンを紹介します。 利用頻度の高い機能トップ 5 ワンダーソフト様の協力のもと、大豊 AI の利用状況を分析したところ、以下の 5 つの機能が多く利用されていることが分かりました。最も利用頻度が高いのはフリートークで、次いで社内規程検索、ファイルチャット、社内資料の全文検索、ユースケース別検索の順となっています。 以下、それぞれの機能について、具体的な使われ方を紹介します。 ① フリートーク:気軽な質問から専門知識まで フリートークは、生成 AI と自由に対話できる機能です。利用データを分析したところ、質問内容は以下のように分類されました。 日常的な質問や翻訳、Excel の関数検索など:60.9% 建設業に特化した専門的な質問:24.1% 文章生成:8.3% 文章の添削・校正:6.7% 一見すると専門性を有しない質問が 6 割を占めているように見えますが、これには意味があります。「身近なことを AI に気軽に質問する」という習慣が社内に根付くことで、本当に必要な時にスムーズに活用できる土台が形成されているのです。 メール作成:正確で丁寧な文面を手軽に 業務の中で、メールの作成は日々発生する作業の一つです。しかし、適切な言葉遣いや内容の整理に負担を感じることも少なくありません。特に、社外の取引先や発注者への連絡では、正しい敬語表現やビジネスマナーに沿った文面が求められるため、一通のメール作成に想定以上の時間がかかるケースもあります。 大豊 AI では、フリートークやユースケース別の「メール作成」テンプレートを活用することで、伝えたい要点を入力するだけで、正しい日本語で適切な文面を生成してくれます。例えば、「工事の進捗報告を発注者に送りたい」「会議日程の変更を関係者に連絡したい」といった要件を伝えるだけで、ビジネスメールとしてふさわしい構成・敬語表現を備えた文面が提示されます。メール作成は一見すると小さな業務に思えますが、1日に何通も作成する社員にとっては、積み重なることで大きな時間削減効果をもたらしています。 若手社員の学習支援 施工計画について分からないことがあっても、ベテランの方に聞くのは気が引けるという若手社員がいます。そんな時、フリートークで「〇〇工法のメリットとデメリットを教えて」「△△の場合の注意点は?」といった質問をすることで、基礎知識を習得できます。ある程度調査したうえでベテランの方に相談すればよいため、若手社員の心理的負担が軽減され、ベテラン社員の時間も有効活用できるようになりました。 ② 規程検索:必要な情報に素早くアクセス 社内規程の検索は、大豊 AI 構築の当初からの主要な目的の一つでした。 従来の文書管理システムでは、フォルダ構成が複雑で、どこに何の情報が格納されているのかが分かりにくい状態でした。現在は、 Amazon Bedrock Knowledge Bases を活用した検索機能により、自然な文章で質問するだけで、関連する規程を見つけられるようになりました。 ③ ファイルチャット:文書分析の効率化 ファイルチャットは、PDF などのファイルをアップロードして、その内容について AI に質問できる機能です。議事録作成、文書の内容確認、添削など、様々な場面で活用されています。 議事録の自動生成 最も効果が大きいのが、議事録の自動生成です。工事現場では定期的にミーティングが実施されます。従来は、会議後に記憶を頼りに議事録を作成していましたが、これには時間がかかることもありました。 現在は、会議を文字起こしでテキスト化し、それを PDF にして大豊 AI のファイルチャットにアップロードします。「この内容から議事録を作成して」と依頼すると、大豊 AI が議事録の初稿を生成してくれます。担当者は手直しするだけで完成するため、議事録作成にかかる時間が大幅に短縮されました。 この仕組みは海外の現場でも活用されています。大豊建設様では海外での事業も展開しています。現地の言語で行われた会議の内容を整理し、議事録として仕上げる作業は従来大きな負担でしたが、大豊 AI を活用することでこの工程が大幅に効率化されました。国内・海外を問わず、同じ仕組みで業務効率化が実現されています。 ④ 社内資料の全文検索:過去の知見と法令情報への横断アクセス 大豊 AI の検索対象は社内資料から外部サイトまで多岐にわたります。外部サイトの例として、法令に関する資料が掲載されている政府の「e-Gov」から労働安全衛生法などの情報を PDF 化して検索対象としています。「手すりの高さに関するルールを教えて」と質問すると、大豊 AI は e-Gov から取得した法令データと社内規程を横断検索し、関連する情報を提示します。複数の資料を探し回る必要がなくなり、正確な情報に素早くアクセスできるようになりました。 ⑤ ユースケース別検索:AI 初心者にも使いやすいテンプレート機能 大豊 AI は、リリース当初、ユーザー自身でプロンプトを設定できる仕様にしていました。しかし、AI 初心者にとって詳細なプロンプト設定は難易度が高く、利用の障壁となっていることが判明しました。そこで、管理者側で一般的なユースケース別にプロンプトを事前設定し、ユーザーは選択するだけで利用できる機能を開発しました。2025 年 12 月にリリースしたこの機能は、利用回数の上位にランクインしており、一定の需要があることが確認できています。 現在提供している 8 種類のユースケースは以下の通りです: 文書校正 文書チェック 議事録作成 議事録要約 メール作成 Excel 関数検索 用語解説 翻訳 自社業務に最適化できる生成 AI 基盤の選択 これらのユースケースを支える技術基盤として、大豊建設様は AWS を選択しました。その理由は大きく三つあります。 まず、 既存システムとの統合のしやすさ です。大豊建設様では、社内アプリケーションの多くをワンダーソフト様に依頼して構築していました。これらのアプリケーションは AWS 環境で稼働しており、生成 AI を組み込む際にも同じ基盤を活用することで、スムーズな連携が可能になると考えたのです。「AWS で稼働している既存の社内アプリに生成 AI 機能を追加する際には、セキュリティや実装における利便性などで AWS が最適」という判断でした。 次に、 カスタマイズの自由度の高さ です。世の中にある SaaS やパッケージ化された生成 AI サービスは、自社の業務要件に合わせた柔軟なカスタマイズが難しい場合があります。大豊建設様では、社内規程だけでなく、外部の法令サイトの情報や、建築部門で配信している資料など、多様な情報源を統合して検索できるようにしたいという要望がありました。AWS を基盤とすることで、こうした独自の要件に対応でき、「自分たちがやりやすくて、見やすいものができるのでは」と考え、カスタマイズ性の高さを評価しました。 そして、 AWS チームとの協業体制 です。ワンダーソフト様は次のように語ります。「実装における AWS サービスのインテグレーションが簡単な点が AWS を選定した一つのポイントです。ドキュメントが充実しているのは、生成 AI 以前から感じていました。また、AWS の担当アカウントチームとの打ち合わせを通じて情報提供をいただけるのは大変ありがたい。」と支援体制を評価しました。 また、将来的には、グループ会社や他社への展開も視野に入れる中で、「AWS Blog で事例化」という形で外部に実績を示すことができるのは、さらなる展開を目指すうえでも有効だと考えています。 システム構成と技術的な工夫 大豊建設様が構築した「大豊 AI」システムは、 Amazon Bedrock を中心とした AWS サービスで構成されています。認証基盤には Auth0 を利用していますが、基本的には AWS のサービスで統一されています。 主要な AWS サービスは以下の通りです。 Amazon Bedrock :さまざまなAI基盤モデルをAPI経由で簡単に利用できるフルマネージドサービス Amazon Bedrock Knowledge Bases :RAG 検索の実装 AWS Lambda :アプリケーションロジックの実行 Amazon S3 :社内ドキュメントを格納するためのオブジェクトストレージ プロジェクトを進める中で、いくつかの技術的な試行錯誤がありました。 当初は Amazon Kendra を使用していましたが、検索精度の課題、特に社内規程に含まれる表の取り扱いが難しかったため、Amazon Bedrock Knowledge Bases へ移行しました。特に、PDF を一枚丸ごと取り込んで表示できる「Advanced RAG」の機能が有効だったとワンダーソフト様は語ります。今後は、Amazon S3 Vectors を利用したコスト削減についても検討を進めていく方針です。 また、新しいモデルが登場した際に、それを大豊 AI に積極的に取り込む点にもチャレンジしています。バージニア北部やオレゴンなどのリージョンでは素早くモデルが追加されるため、それを大豊 AI に取り込むことで、最新モデルを活用できる体制を構築しています。モデルの更新に加え、ユーザーの利便性向上にも日々取り組んでいます。 エージェント技術による次なる業務変革への挑戦 大豊建設様の生成 AI 活用は、エージェント技術を積極的に取り込み、以下の方針でこれからも取り組みを続けていきます。 エージェント機能の実装 Amazon Bedrock AgentCore を活用し、次の二つの業務領域での自動化を検討しています。 施工計画書の作成支援 工事が始まる前に作成する施工計画書は、ゼロから作成するのが大変な業務です。現場の担当者は過去の竣工データから類似工事の施工計画書を探し出し、参考にして作成していますが、この作業を AI エージェントが支援することで、大幅な効率化が期待されています。 社内資料の作成支援 「パワーポイントでこのファイルを作って」といった指示に基づいて、AI が資料の初稿を作成し、担当者が最終調整を行うワークフローの実現を目指しています。既存の資料に対して「この部分を変更して」といった細かい要望にも対応できることを目指しています。 まとめ 大豊 AI は検索システムとして始まりましたが、実際には文書作成、ファイル分析、相談相手など、業務の様々な場面で活用されています。単一の用途に限定せず、ユーザーが自由に活用できる環境を提供することで、想定以上の効果が生まれました。フリートークでの時事ネタの質問も、「AI を気軽に使う習慣」を醸成し、本当に必要な時にスムーズに活用できる土台となっています。 生成 AI の活用は、単なる技術導入ではなく、業務プロセスの再設計や組織文化の変革を伴う取り組みです。「入社当時はまだフロッピーディスクを使用していましたが、10 年を経て最新エージェント技術へ」という落藤様の言葉に象徴されるように、新たなことに挑戦する姿勢は、建設業界における生成 AI 活用のモデルケースとして大いに参考になります。

























