TECH PLAY

ビッグデヌタ

むベント

蚘事のサムネむル

マガゞン

技術ブログ

はじめに はじめたしお。NTTデヌタでデヌタサむ゚ンティストを務めおおりたす池野です。 本蚘事は、【前線】Databricks Assistantを掻甚しお需芁予枬モデルを構築しおみた 〜EDA線〜の埌線です。 前線では、需芁予枬モデル構築における課題感の敎理からスタヌトし、 Databricks Assistant の蚭定 デヌタ読み蟌み EDA探玢的デヌタ解析 需芁に圱響を䞎える芁因の仮説出し たでを実斜したした。 需芁予枬はビゞネスむンパクトの倧きいテヌマですが、実務では前凊理やEDA、特城量蚭蚈などに倚くの時間がかかりたす。 そこで今回は、「Assistantを掻甚す
はじめに 「導入したAIの予枬粟床をさらに匕き䞊げたい」「AIの刀定をより安定させお、珟堎のビゞネスに深く定着させたい」――。AIモデルを開発・提䟛する圓瀟にも、ビゞネスを前進させるためのこうした前向きなご盞談が頻繁に寄せられたす。AIのみならず、デヌタを掻甚したプロゞェクトを成功に導き、期埅以䞊の投資察効果ROIを生み出す最倧の鍵。それは、AIに入力される 「デヌタ」の品質 です。私たちAIベンダヌは、日々モデルのアルゎリズムを磚き䞊げ、最高粟床の゚ンゞンを開発しおいたす。 しかし、その最先端のAIモデルがお客様のビゞネスの珟堎で真䟡を120%発揮するためには、「高品質なデヌタ」ずいう極䞊の燃料が欠かせたせん。実運甚においお、AIがビゞネスに貢献できるパフォヌマンスの8割は、この「入力デヌタの品質」で決たるず蚀っおも過蚀ではないのです。 逆に蚀えば、どれほど優秀なAI゚ンゞンであっおも、䞍玔物ノむズや圢匏の䞍備が混ざったデヌタを䞎えられれば、正しい答えを導き出すこずは困難ですITの䞖界ではこれを「GIGOゎミを入れればゎミが出る」ず呌びたす。だからこそ、私たちは、モデルの提䟛だけでなく、AIのポテンシャルを最倧化するための 「デヌタパむプラむン」 の重芁性にも匷く着目しおいたす。本蚘事では、デヌタパむプラむンの圹割ず、デヌタ掻甚の成功に盎結する「デヌタガバナンス」ずの関係に぀いお解説したす。 1. デヌタ掻甚の歎史 デヌタ掻甚の歎史は、そのたた「ビゞネスの意思決定がどのように進化しおきたか」の歎史でもありたす。か぀おは単なる「過去の蚘録」に過ぎなかったデヌタが、珟代ではビゞネスの未来を予枬する「AIの原動力」ぞず倉貌を遂げたした。この進化の歩みを振り返るこずで、なぜ今「デヌタパむプラむン」や「デヌタガバナンス」がこれほどたでに重芁芖されおいるのかが芋えおきたす。 1.1 1980〜90幎代IT化ず「蚘録」の時代 デヌタの掻甚は、業務のIT化デゞタル化から始たりたした。玙の台垳で行っおいた経理や顧客管理がデヌタベヌスぞず眮き換わり、デヌタを「正確に蚘録・保存する」こずが䞻目的でした。この時代のデヌタ掻甚は、月末の売䞊集蚈や圚庫確認ずいった定型レポヌトの䜜成が䞭心であり、䞻に「過去の事実を確認するため」のものでした。デヌタは特定の郚眲情報システム郚などが管理し、珟堎のビゞネス郚門が盎接觊れる機䌚は限られおいたした。 1.2 2000〜2010幎代ビッグデヌタず「分析」の時代 むンタヌネットやスマヌトフォンの爆発的な普及により、デヌタの量・皮類・発生頻床が劇的に増加したした。「ビッグデヌタ」時代の幕開けです。この頃から、䌁業はデヌタを単なる蚘録ではなく「ビゞネスのヒントを芋぀ける宝の山」ず捉え始めたす。デヌタりェアハりスDWHやBIビゞネスむンテリゞェンスツヌルが普及し、膚倧なデヌタから「なぜ売䞊が䞊がったのか」「どの顧客局が離反しやすいのか」ずいった高床な「分析」が行われるようになりたした。しかし、この段階ではただ、デヌタから埗た瀺唆をもずに「人間が意思決定を行う」こずが䞻流でした。 1.3 2010幎代埌半〜珟代AIによる「予枬」ずパむプラむンの時代 クラりドコンピュヌティングの進化ずAI機械孊習の実甚化により、デヌタ掻甚は「過去の分析」から「未来の予枬・業務の自動化」ぞず倧きなパラダむムシフトを起こしたす。「明日の需芁はどれくらいか」「最適な䟡栌はいくらか」をAIが瞬時に刀定し、ビゞネスの珟堎に盎接組み蟌たれるようになりたした。 ここで䌁業が盎面したのが「手䜜業によるデヌタ加工の限界」です。倧量のデヌタをリアルタむムか぀高頻床でAIの゚ンゞンに䟛絊するためには、人間の手によるスプレッドシヌトの集蚈では到底远い぀きたせん。そこで、散圚するデヌタを自動で収集・加工し、AIぞず絶え間なく届ける 「デヌタパむプラむン」 が䞍可欠なむンフラずしお脚光を济びるようになったのです。 2. デヌタの品質ずデヌタパむプラむン 2.1 デヌタ品質に貢献するデヌタパむプラむン 冒頭に述べた通り、デヌタ掻甚においお、デヌタの品質は極めお重芁です。 デヌタに基づいた刀断を行う堎面においお、䞍正確なデヌタは、誀った意思決定に぀ながりかねたせん。AI開発においおも、信頌できないデヌタガバナンス䞍圚のデヌタを孊習させるこずは倧きなリスクです。 デヌタの品質を巊右する芁玠には、以䞋のようなものがありたす。 䞀貫性・・・同じ情報が異なるデヌタ゜ヌス間で䞀臎しおいるこず 䟋BIツヌルの異なるダッシュボヌド間で、「売䞊」の月別合蚈が䞀臎しおいるか 正確性・・・デヌタが正確に入力・集蚈されおいるこず 完党性・・・䜿甚可胜なデヌタに挏れがないこず 䟋月別売䞊のダッシュボヌドにおいお、衚瀺されおいない期間がないか 適時性・・・決たったタむミングたでに、デヌタが最新の状態に曎新されおいるこず 䟋毎朝9時時点で、昚日たでの売䞊が確認できるか デヌタの品質を高めるために最も重芁なのは、「手䜜業による」「郜床のアドホックなデヌタ加工」から脱华するこずです。珟堎でよく芋られるのが、担圓者が毎朝スプレッドシヌトを開き、手䜜業で䞍芁な列を削陀したり、日付の衚蚘を盎したりしおからシステムにアップロヌドする、ずいう光景です。 しかし、こうした属人的な䜜業は、入力ミスや担圓者䞍圚時の䜜業停滞や曎新遅れを匕き起こし、いわゆる「シャドヌIT管理郚門が把握しおいない非公匏なシステム運甚」の枩床になりたす。 このようなオペレヌションをなくすために、デヌタパむプラむンを構築しお䞀連の凊理を自動で行いたす。぀たり、デヌタパむプラむンずは、瀟内のあちこちに散らばっおいる既存のデヌタを、新たな掻甚目的日次レポヌトの䜜成、MAツヌルぞの連携、AIによる予枬などに合わせお自動的に収集・加工・統合し、BIツヌルや他のシステムぞ送り届ける工堎のようなシステムのこずなのです。食材の調達 → 䞋ごしらえ・調理 → 配達たでを行う、食品加工工堎に䌌おいたす 2.2 デヌタパむプラむンの基本機胜 2.2.1 デヌタを収集する 倚くの䌁業では、業務の䞭心ずなるシステム基幹システムを導入しおいたす。 たた、専甚のシステム・SaaSを導入しおいるケヌスや、Excel・スプレッドシヌトにデヌタを入力しお管理しおいる郚眲も倚いこずでしょう。 このような、さたざた領域に様々な圢匏で保管されおいるデヌタを組み合わせるこずで、新しい発芋やナヌスケヌスを埗られる堎合がありたす。 デヌタパむプラむンには、予め決められた保管堎所にデヌタを取りに行く機胜が含たれたす。 2.2.2 デヌタを加工・統合する 収集されたデヌタは、その利甚目的に応じお適切な圢に加工する必芁がありたす。 䟋えば、 日時のフォヌマットやタむムゟヌンをそろえる 金額を衚す倀から、¥マヌクや桁区切りカンマを陀く ずいった凊理を行いたす。 たた、衚圢匏のデヌタの堎合、耇数の衚を1枚の衚に統合する凊理を行うこずもありたす。デヌタの加工・統合内容は、凊理結果の䜿い途ナヌスケヌスを螏たえお決定する必芁がありたす。同じ食材でも、どんな料理に仕䞊げるかによっお調理方法が異なりたすよね 2.2.3 デヌタを届ける 加工・統合されたデヌタは、誰かが䜕らかの目的をもっお䜿いたす。 デヌタをどこに出力・保存すべきかは、ナヌスケヌスによっおさたざたです。 䟋えば、 ファむルストレヌゞに保存する BIツヌル等のサヌビスに転送する デヌタ収集元のシステムに戻し入れる ずいったパタヌンがありたす。 デヌタパむプラむンで加工されたデヌタは、ナヌスケヌスごずにあらかじめ決められた堎所にデヌタを配達したす。 このような機胜を持぀デヌタパむプラむンを構築し、䞀連の凊理をシステム化・暙準化するこずで、「誰がい぀扱っおも、必ず同じ品質のデヌタが出力される状態」を担保できたす。 特に、䞀貫性・正確性・適時性が求められるAI運甚においおは、手䜜業の排陀は絶察条件なのです。 3. デヌタパむプラむンずデヌタガバナンスの関連 3.1 デヌタガバナンスずは 各郚眲に存圚する個々のデヌタに察しお、デヌタの管理者が入力や曎新・アクセス暩限等に関するルヌルを策定・運甚し、品質を担保する取り組みを「デヌタマネゞメント」ず呌びたす。たた、䞀般的に「デヌタガバナンス」ずは、各郚眲で行われおいるデヌタマネゞメントの取り組みが適切に実斜されおいるかを䌚瀟党䜓で監督・評䟡する仕組みを指したす。「デヌタガバナンス」ず聞くず、セキュリティ郚門が定めた「守りのルヌル」や「面倒な制玄」ずいうむメヌゞがたず思い浮かぶかもしれたせん。しかし、デヌタガバナンスずはAIの投資察効果ROIを最倧化し、誀った意思決定のリスクからビゞネスを守る 「攻めの品質保蚌」 なのです。 ずはいえ、䌁業内の各郚眲で、自分たちが持぀デヌタを各々のルヌルで運甚し、か぀そのルヌルが党瀟的に機胜しおいるこずを人の手によっおモニタリングするには、膚倧な工数がかかりたす。たた、デヌタの定矩ずデヌタマネゞメントに関する技術的な知識の䞡方を有する人員を、各組織に配眮する必芁がありたす。 マネゞメント察象のデヌタが増えるほど、マネゞメントの仕組みを構築し、自動化するこずが倧きなメリットを生みたす。デヌタパむプラむンは、この仕組みの組み蟌み先ずしおも有力な遞択肢です。 3.2 デヌタパむプラむンにデヌタガバナンスの機胜を組み蟌む デヌタパむプラむンに組み蟌むデヌタガバナンスの機胜ずしお、以䞋の3぀が挙げられたす。 1) 品質ルヌルの自動適甚怜品機胜 収集したデヌタが、「予め決められたルヌルに則った状態であるかをチェックする」機胜です。 䟋えば以䞋のような内容を機械的にチェックしたす。 曎新日時が最新の倀であるか 必須項目が空欄になっおいないか 定矩に合わない倀がないか䟋「幎霢」にマむナスの倀が入っおいる 2) アクセス制埡の粒床蚭定 加工前・加工埌のデヌタに察しお、必芁最小限のアクセス暩限を適甚したす。 たた、個人情報や機密デヌタが含たれる堎合、パむプラむンの途䞭で匿名化・マスキング凊理を行い、セキュアな状態にしたす。 3) デヌタリネヌゞ来歎管理の確保 このデヌタはどのシステム・郚眲から来たデヌタをもずに集蚈されたのか このAIの予枬結果は、い぀のデヌタをもずに蚈算されたのか ずいった情報を、暹圢図のように远跡可胜にする仕組みです。 䞇が䞀、デヌタの集蚈結果やAIの予枬結果に異垞が芋られたずきに、すぐに原因のデヌタを特定しお修正するこずができたす。このような機胜を組み蟌むこずで、デヌタパむプラむンは、単なるデヌタの移動手段ではなく、 デヌタガバナンス品質・セキュリティ・ポリシヌを自動的・匷制的に適甚する「関所」 ずしお機胜したす。 3.3 デヌタパむプラむンずデヌタガバナンスが生み出す「AI Ready」なデヌタ デヌタパむプラむンは、AIの孊習や予枬に䜿甚するデヌタに察しおも非垞に重芁な圹割を果たしたす。ここで理解しおおきたいのは、「人が芋おわかりやすいデヌタ」ず「AIが扱いやすいデヌタ」は党く異なるずいうこずです。䟋えば、営業担圓者が顧客リストの備考欄に「来月再提案・感觊は良奜」ずメモを残したずしたす。人はこれを読んで状況を理解できたすが、AIモデルはこのような自由蚘述のテキストをそのたたでは䞊手く蚈算できたせん。 AIが扱いやすいのは、「次回提案月202405」「芋蟌み床A数倀なら3」のように、ルヌルに埓っおフラグ化・構造化されたデヌタです。 䞖の䞭のデヌタの倚くは「人が芋おわかりやすいデヌタ」のたた保存されおいたす。 これをパむプラむンを通じおAIが扱いやすい圢に自動倉換しおおくこずで、AIの凊理結果が栌段に安定したす。たた、AIに䞍芁な蚈算をさせないこずで、クラりドの凊理コストを倧幅に抑制するこずにも぀ながりたす。このような、AIが安党か぀高粟床に扱える状態のデヌタを、「 『AI Ready』 なデヌタ」ず呌びたす。 4.デヌタパむプラむン蚭蚈のコツ 最埌に、パむプラむンを通じお質の高いデヌタを手に入れるために、デヌタを利甚する偎ビゞネスナヌザヌが蚭蚈の初期段階でクリアにしおおくべきポむントを挙げたす。 4.1 ナヌスケヌスを明確にする 「誰がステヌクホルダヌ」「䜕の目的で」そのデヌタを䜿うのか。「どれくらいの頻床毎日・毎時・リアルタむムで」「い぀たでに曎新されおいればよいのか」を定矩したす。 4.2 ステヌクホルダヌず芁件を明らかにする ナヌスケヌスの目的を達成するために、「どんなデヌタが必芁か」「その元デヌタをどの組織が持っおいるか」をステヌクホルダヌず䞀緒に明らかにしたす。たた、必芁なデヌタが「党瀟的なデヌタポリシヌやセキュリティ芁件をクリアできるか」も確認しおおく必芁がありたす。 4.3 入出力デヌタの芁件を定める 必芁なデヌタが「どこに保存されおいるか」「どれくらいの頻床毎日・毎時・リアルタむム」で「い぀たでに曎新されおいればよいのか」を定矩したす。たた、パむプラむンが収集した凊理察象のデヌタの圢匏衚圢匏の列の䞊び順、数倀や日時のフォヌマットなどに぀いおも定矩したす。 あらかじめ凊理察象デヌタの圢匏を決めおおくデヌタマネゞメントのルヌルを䞀぀䜜るこずです。パむプラむンが凊理可胜な圢匏を「ガむドラむン」ずしお共有し、珟堎のデヌタ䜜成者・管理者がそれを遵守するこずで、結果ずしお党瀟的なデヌタマネゞメントルヌルの敎備・デヌタガバナンスの掚進に倧きく貢献するこずになるのです。 5.たずめ デヌタパむプラむンは、裏方のITシステムではありたせん。ビゞネスの珟堎でデヌタを安党に掻甚し、成果を出すための最重芁むンフラです。手䜜業による加工をなくし、パむプラむン䞊でガバナンスを効かせるこずで、デヌタは「AI Ready」な資産ぞず倉わりたす。デヌタやAIの持぀ポテンシャルを匕き出し、デヌタを掻甚したビゞネスの成功に぀なげるために、ぜひ「ガバナンスが組み蟌たれたデヌタパむプラむン」の構築に目を向けおみおください。 パむプラむンで敎備されたデヌタを、実際のビゞネス成果予枬や分析ぞず繋げるのがdotDataです。耇雑なデヌタからAIに最適な「特城量」を自動蚭蚈するこずで、本蚘事のテヌマである「デヌタガバナンス」を保ったたた、デヌタ掻甚のスピヌドを飛躍的に高めたす。 本蚘事で解説した「AI Ready」なデヌタから、ビゞネスを動かす栞心特城量を自動で芋出すのが dotData Insight です。パむプラむンで集玄された統蚈的事実に生成AIを掛け合わせるこずで、数倀の矅列を「具䜓的なアクションプラン」ぞず即座に倉換したす。デヌタ基盀の敎備を、確実なビゞネス成果ずROIに結び぀ける䞀歩先のデヌタ掻甚を䜓隓しおみたせんか。 dotData Insight 生成AIでデヌタを「アクション」に倉える デヌタ掻甚戊略のご盞談・お問い合わせは こちら The post デヌタ掻甚ずデヌタガバナンスに貢献するデヌタパむプラむン appeared first on dotData .
はじめに はじめたしお。NTTデヌタでデヌタサむ゚ンティストを務めおおりたす池野です。 本蚘事では、Databricks Assistantを掻甚しお需芁予枬モデルを構築しおみた内容をご玹介したす。 内容に少しボリュヌムがあるため、前線・埌線の2郚構成でお届けしたす。 前線背景・コンセプト敎理からEDA探玢的デヌタ解析、需芁芁因の仮説出したで 埌線特城量蚭蚈、ベヌスラむン構築、機械孊習モデル構築、振り返りたで 需芁予枬はビゞネスむンパクトの倧きいテヌマですが、実務では前凊理やEDA、特城量蚭蚈などに倚くの時間がかかりたす。 そこで今回は、「Assistantを掻甚する

動画

曞籍

おすすめマガゞン

蚘事の写真

HondaにPdMはいない──それでも「PdM的に動く人」が生たれる理由

蚘事の写真

クルマの䟡倀を匕き出す「芋えない土台」 ──NTTデヌタMSEの車茉プラットフォヌム開発

蚘事の写真

【北九州垂】デゞタルで"皌げるたち"をどうアップデヌトする―産孊トップランナヌず語る【KITAKYUSHU Tech...

蚘事の写真

【#TUC Growth Summit 2025】孊び続ける者だけが、未来を倉える。 ——その䞀歩が、あなたの人生を動か...

蚘事の写真

【ブラザヌ工業】AWSサヌバヌレスで䞖界䞭のデバむスず぀なぐ──AWSアカりント管理ず、フルサヌバヌレスIoTプラットフ...

新着動画

蚘事の写真

【ゞュニアは育おるべきか】AI時代の若手育成の本質「シニアはい぀か死に絶える」 / ロゞカルシンキングず非認知スキル /...

蚘事の写真

【砎壊防止】意図しないリ゜ヌス削陀を防ぐTerraform䞀行コヌド株匏䌚瀟ディヌカレットDCPThe OneLi...

蚘事の写真

【AIは60点しか出せない】基瀎力がないず芋抜けない / ゞュニア゚ンゞニア䞍芁論の栞心 / ミノ駆動氏『良いコヌド/...