イオン・大阪ガス・Hondaのエンジニアが語る「データマネジメントの勘所」──大規模データ分析基盤と組織のリアル

イベント 公開日:
ブックマーク
イオン・大阪ガス・Hondaのエンジニアが語る「データマネジメントの勘所」──大規模データ分析基盤と組織のリアル
エンジニアの“データマネジメントの実現にむけた挑戦”にスポットライトをあてて紹介する『データマネジメントの勘所』シリーズ。今回は「大企業×複雑かつ大規模なデータ」をテーマに、イオン・大阪ガス・Hondaでデータマネジメントに携わるエンジニアが登壇。現場でのリアルな課題や課題解決に向けた取り組み、データマネジメントに対するポリシーについて語ってもらった。

アーカイブ動画

『データマネジメントの勘所』はデータマネジメントにおける知見の共有・価値向上の場

株式会社primeNumber 廣瀬 智史氏
株式会社primeNumber
プロダクト本部 プロダクトマネージャー 廣瀬 智史氏

今回で第3回目の開催となる『データマネジメントの勘所』シリーズ。主催はデータ基盤の整備・運用自動化クラウド「trocco®」の開発・提供を中心にデータマネジメント支援を行なうprimeNumber社だ。

「本シリーズはデータをビジネスに活用できるよう、データの価値を向上させるためのデータマネジメント、そしてデータマネジメントを行う上で重要な要素となるデータ分析基盤を中心の題材としております」と語るのはtrocco®のプロダクトマネージャーを務める廣瀬智史氏。

データマネジメントに最適解はなく、企業や状況、技術の進歩により日々変わりゆくものと言える。各社がどう向き合っているのか、技術スタックだけでなくその中での試行錯誤や苦労、今後の展望など様々な切り口でリアルなお話をお伺いできる場をつくるべく立ち上がったという本シリーズ。国内企業のデータマネジメントの知見の共有・価値向上に繋げたい想いが込められている。

「皆様の気づきや学びのきっかけとなれば」(廣瀬氏)とゲストにバトンを渡した。

【イオン】“超巨大”なデータ基盤を構築・整備し、社会に還元する

イオン株式会 山﨑 賢氏
イオン株式会社 CTO 兼
イオンスマートテクノロジー株式会社 CTO 山﨑 賢氏

イオングループ全体を統括するイオン、そしてテクノロジーの力でイオングループを進化させることを目的とするデジタル専業会社、イオンスマートテクノロジーの両社でCTOを務めるのが山﨑賢氏だ。

山崎氏は新卒で大手SIerに入社後、ヤフー(現、LINEヤフー)やリクルートといった大手企業の新規サービス立ち上げや大規模サービスの開発者として活躍。その後はアソビューなど数社のスタートアップでCTOを経験した後、イオンのテックカンパニー化を加速させるべく、2023年にジョインした。

まず山崎氏は、イオングループを具体的な数字で示した。店舗数に関しては、関連会社も入れると2万店舗以上になるという。イオングループがこれだけ巨大なのは、これまで数多くの企業と吸収合併を繰り返してきた歴史を持つからでもある。

イオン・大阪ガス・Hondaのエンジニアが語る「データマネジメントの勘所」──大規模データ分析基盤と組織のリアル - スライド1

一方で、吸収合併のポリシーとして各社の文化やサービスを大切にしつつ、イオン連合軍というかたちで事業を推進していく。「社内では“緩やかな連携”との言葉が使われています」と山崎氏は語る。

そのため、各社のサービスがそのまま残っている状態であり、これまでは顧客情報は連携されていなかった。それを解決したのが「iAEON」である。

「iAEONにより、これまで個別であった会員基盤がつながるようになりました。その結果、お客様がイオングループのどのアプリを利用しているのか、横断的に分析できるようになりました」(山崎氏)

イオン・大阪ガス・Hondaのエンジニアが語る「データマネジメントの勘所」──大規模データ分析基盤と組織のリアル - スライド2

さらには、iAEONをベースに顧客のデータに限らず、店舗・商品などさまざまなデータを統合するデータ基盤を今まさに構築している。山崎氏は先に示した規模の巨大さを改めて次のように強調するとともに、プロジェクトに臨むやりがいを語っている。

「iAEONの会員数は1億人以上、年間の来店客数は14億以上ですから、データ基盤は日本の小売業の中でも超絶最大規模になるため、チャレンジングな取り組みだと捉えています」(山崎氏)

データ基盤のアーキテクチャも紹介された。Azure上に構成されており、左側はイオングループのさまざまな会社から上がってくるデータであり、SparkをベースとしたETLの数は100以上になるという。

データ量が超巨大なのはもちろんだが、イオングループは数多くの企業の連合体である。そのため企業文化はもちろん、データの種類やフォーマット、収集のタイミングなども異なる。このような違いをどのように考慮し、データ基盤に統合していったのか。山崎氏はいくつかのポイントを紹介した。

まずは「連携システムの多様性」だ。各社がこれまで行ってきたそれぞれのシステムには合わせることはせず、現在構築中のデータ基盤で標準的な連携パターンをいくつか用意し、各社がそのパターンに合わせることをポリシーとした。

イオン・大阪ガス・Hondaのエンジニアが語る「データマネジメントの勘所」──大規模データ分析基盤と組織のリアル - スライド3

続いては「データ構造の多様性」について。こちらも各社で異なるデータの型をそのままアップするのではなく、データ基盤に送る際には必ずデータ基盤側で定めたフォーマットにしてから送ってもらうことに決めた。

「標準のインターフェースを設計するのは我々の役割ですが、送るデータのフォーマットに関しては、送る側に責任を持ってもらう。そのような状態に持っていきたいと考えています」(山崎氏)

イオン・大阪ガス・Hondaのエンジニアが語る「データマネジメントの勘所」──大規模データ分析基盤と組織のリアル - スライド4

3つ目は各社の利害関係にはコミットしない。イオングループ全体として、データ活用によりイノベーションの創出などの成果を考えての取り組みであるからだ。このような方針、ポリシーを明確、かつトップダウン的に示した。

というのも、3000万人分のデータを持つ会社であれば、新たなデータ基盤を活用することなく、自社でデータ活用ができる規模感だからだ。逆に、これまでデータ活用ができなかったような小規模企業は、かなりの恩恵を受けることになる。

「一つひとつの会社の利害関係に配慮して調整していくことは不可能に近いと考え、ポリシーを決めました」(山崎氏)

イオン・大阪ガス・Hondaのエンジニアが語る「データマネジメントの勘所」──大規模データ分析基盤と組織のリアル - スライド5

4番目は、利用者と利用ニーズに対する姿勢だ。「来る者拒まず」という基本的なスタンスで、どのような利用者でもどんなニーズにも応えていく。そのために「必要なシステムも構築していく」と、力強く語った。

一方で集まったデータは、イオングループ全体の共有財産である。そのためデータ基盤の領域については、一部の管理者以外は一切アクセスできない方針とした。「データ基盤の周辺にSnowflakeなどの衛星をつくるイメージです」と説明し、設計方針と具体的な概念図も紹介した。

イオン・大阪ガス・Hondaのエンジニアが語る「データマネジメントの勘所」──大規模データ分析基盤と組織のリアル - スライド6

コア領域であるデータ基盤に関しては、利用者にはアクセスはさせない。あくまでSnowflakeやTiDBを介して、利用者はデータを利活用する設計となっている。

イオン・大阪ガス・Hondaのエンジニアが語る「データマネジメントの勘所」──大規模データ分析基盤と組織のリアル - スライド7

なお、スライドの右側スコープ、データ活用のツールに関しては、4番目の考えを実践するアクションである。山崎氏は「積極的にソリューションを増やしていきたいと考えている」と、今後の展望を3つ述べた。

イオングループが目指しているのはデータを収集することで、見込み客など個人を特定するといった目先、イオングループだけが利益を独占するような未来ではない。

イオン・大阪ガス・Hondaのエンジニアが語る「データマネジメントの勘所」──大規模データ分析基盤と組織のリアル - スライド8

データ基盤が完成し安定稼働した暁には、他社や生産者などにデータをオープン化し提供したいと考えているからだ。こうした取り組みの結果、小売業界全体の商品開発や需要予測、生産性向上に寄与する。そして、日本全体のサプライチェーンのさらなる効率化、最適化を実現するような未来の実現を目指す。

山崎氏は“社会貢献”との言葉を何度も繰り返し、セッションを締めた。

「データ基盤の構築や整備を通じて、イオングループだけでなく社会に還元していきたいです」(山崎氏)

【大阪ガス】データ分析基盤のクラウドシフト・新規構築から学んだこと

大阪ガス株式会社 花牟禮 龍馬氏
大阪ガス株式会社
経営企画本部 DX企画部
アーキテクト 花牟禮 龍馬氏

続いては、大阪ガスの花牟禮龍馬氏が登壇した。花牟禮氏は入社後、データサイエンティストとして、機械学習などを用いたエネルギー需要予測、データ分析業務などに従事。現在はデータ分析プロジェクトの主導、全社のデータ活用基盤の統括などに携わっている。

大阪ガスは100年以上の歴史を誇る企業であり、現在は大きく3つの事業に注力している。主力のガス事業だけでなく、電力事業、海外投資事業、さらには都市開発や材料開発、SIerといった事業も展開する。

イオン・大阪ガス・Hondaのエンジニアが語る「データマネジメントの勘所」──大規模データ分析基盤と組織のリアル - スライド9

大阪ガスにおけるデータ活用の歴史も紹介された。起点は1990年後半に、データ分析専門組織、現在のビジネスアナリシスセンター(以下、BAC)の設立である。2010年には、全社のデータ活用基盤「DUSH(Data Utilization Support & Help)」が稼働を開始した。

2019年には現在も活用しているDUSHを再構築する、分析基盤の進化に向けたプロジェクトがスタート。翌2020年には、ビッグデータをより高度に処理するための「高負荷分析基盤」の構築に着手している。

BACは、15名ほどのプロフェッショナルメンバーから構成されており、「社内におけるコンサルティング集団のような位置付け」だと花牟禮氏は説明する。大きく3つのステップで事業を進め、各事業部に対しビジネス支援を行っている。

イオン・大阪ガス・Hondaのエンジニアが語る「データマネジメントの勘所」──大規模データ分析基盤と組織のリアル - スライド10

花牟禮氏は、2つのデータ分析基盤の特徴や違いも紹介した。DUSHはオンプレを利用しており、Excelなどでも扱うことができるような比較的シンプルなデータを扱う。対して高負荷分析基盤はクラウドを利用しており、これまで扱うことが難しかったIoTやWebのログデータなどを扱っている。

また、高負荷分析基盤を活用して、仮想発電所(VPP)の実証事業に取り組んでいる。

イオン・大阪ガス・Hondaのエンジニアが語る「データマネジメントの勘所」──大規模データ分析基盤と組織のリアル - スライド10

2010年に稼働を開始したDUSHは、現在では100ほどの業務システムから毎日データを収集しており、データ連携プログラムの数は数千を超える。データ量は数TBに上っており、2500人ほどのユーザーがデータを活用。10万を超えるレポートが作成されるまでに利用されている。

一方で、稼働開始から10年以上経過したこともあり、いくつか課題が発生するようになっていたと、花牟禮氏。「事業環境の変化」「システムの老朽化」「データの肥大化」という具体的な3つの課題を挙げ、再構築に向けての取り組みを紹介した。

再構築はクラウドシフト方式で行い、データ連携の部分は他のツールを利用。DWHは国内での導入事例が少ない最新のDWHを採用し、BIツールにおいてはバージョンアップを実施している。

イオン・大阪ガス・Hondaのエンジニアが語る「データマネジメントの勘所」──大規模データ分析基盤と組織のリアル - スライド11

さらに花牟禮氏は、再構築プロジェクトで苦労したこと、その解決方法も紹介した。例えば、移行すべきレポートが膨大過ぎるために工数がかかり過ぎてしまう。そこで利用状況を確認し、一定期間利用がないレポートは削減することとした。

「まさに確認を取っている最中ですが、レポート数は3割減になりました。つまり、約3万に減らせることがわかりました」(花牟禮氏)

このような苦労も経て再構築したDUSHだが、以前とは異なる性質のプロジェクトが増えたことにより、DUSHの再構築が完了しても対応が難しいケースも出てくる。

IoT機器から得た大量のデータを、リアルタイムで分析ならびに制御するプロジェクトだ。そこで、新しいデータ基盤「高負荷分析基盤」を構築することになる。

イオン・大阪ガス・Hondaのエンジニアが語る「データマネジメントの勘所」──大規模データ分析基盤と組織のリアル - スライド12

新しく構築したデータ分析基盤、高負荷分析基盤では、GCPやtrocco®といったクラウドサービスを活用。DUSHでの課題であった、リアルタイムでのデータ分析や機械学習が行えるようになった。

「外部システムとの連携は、trocco®を中心に構成することで、社外とのコラボレーションも柔軟に行える体制が構築できています。また、基盤の開発・運用をサポートしていただく外部エンジニアとの協力体制も構築しました」(花牟禮氏)

成果があった一方で、苦労もあったと花牟禮氏は吐露する。その解決に向けた取り組みも紹介してくれた。

例えば、新たなデータ基盤を構築しただけに留まることなく、利用することに価値があることを自ら分析プロジェクトを立ち上げた取り組みだ。

「社内プロモーションを行い、高負荷分析基盤の認知度を高めていきました」(花牟禮氏)

イオン・大阪ガス・Hondaのエンジニアが語る「データマネジメントの勘所」──大規模データ分析基盤と組織のリアル - スライド13

花牟禮氏は紹介した2つのデータ分析基盤の再構築、開発を通じて大きく2つのことを学んだと語る。「技術はいつか廃れる」「データ分析基盤を無理に1つに統合することはない」だ。

いずれにせよ大事なことは、データマネジメントの推進が必要不可欠であり、特に進めている内容を紹介し、セッションを締めた。

イオン・大阪ガス・Hondaのエンジニアが語る「データマネジメントの勘所」──大規模データ分析基盤と組織のリアル - スライド14

【Honda】Honda SENSINGの進化を支えるデータ基盤の取り組みと成果

本田技研工業株式会社  米森 力氏
本田技研工業株式会社
電動事業開発本部 BEV開発センター
ソフトウェアデファインドモビリティ開発統括部
先進安全・知能化ソリューション開発部
先進安全プラットフォーム開発課 課長 米森 力氏

続いて登壇したのは、本田技研工業(以下、Honda)の米森力氏だ。大学時代に統計学を専攻して以降、データ分析一筋で歩んできたという米森氏。社会人のキャリアスタートはSIerであったが、外部のコンサルタント的な立場では扱うデータが限られてくる。

もっとリアルで豊富なデータを扱いたいと思い、自動車メーカーに転職。実際に「自分のビジネス拡大に資するデータが扱えるようになった」と、手応えを話した。

2021年、Hondaに入社して現在は先進安全・知能化ソリューション開発部に所属。衝突軽減ブレーキ(CMBS)など、安全運転を支援するシステム「Honda SENSING」の開発に必要なデータ基盤を担当している。

イオン・大阪ガス・Hondaのエンジニアが語る「データマネジメントの勘所」──大規模データ分析基盤と組織のリアル - スライド15

具体的に扱っているデータも示した。例えば、カメラ・ビデオデータは人間の目、センサーのような役割を果たすことで、まさに先のCMBSを実現する。

イオン・大阪ガス・Hondaのエンジニアが語る「データマネジメントの勘所」──大規模データ分析基盤と組織のリアル - スライド16

データの収集から活用までの流れも紹介された。カメラが思うようにデータを取得しないなどの弱点を分析するために、さまざまなデータを取得。クラウドにアップしてデータレイクに集約・整理する。

そこから各開発領域、メンバーが弱点を解消するロジックを開発し、車にデプロイするという流れだ。

「データの起点はやはりクルマです。また昨今はインターネットに接続するコネクテッドカーの流れがありますから、販売後のクルマの弱点も修正、機能アップデートすることができます」(米森氏)

イオン・大阪ガス・Hondaのエンジニアが語る「データマネジメントの勘所」──大規模データ分析基盤と組織のリアル - スライド17

続いて米森氏は、車両データの開発利用を促進するデータ基盤を整備する上で直面した課題と、その解決に向けた取り組みを紹介した。

1つは増え続けるデータ、つまり「大規模データ管理」である。カメラが高精細化したことにより、一台一日あたり100TBものデータが上がってくる。そのため、全部のデータを集めることはしていない。具体的な対応としては、トリガーをかけたり、圧縮化したりして集めているという。

また、どのようなデータが適しているのか、目的に合ったデータを探し出すことも非常に重要となる。例えば、AI学習に使えるデータを集めて学習データセットを構成するなどだ。

「言い方を変えると、簡単に探すことのできる手法が求められています」(米森氏)

イオン・大阪ガス・Hondaのエンジニアが語る「データマネジメントの勘所」──大規模データ分析基盤と組織のリアル - スライド18

2つ目の課題は、「全社IT部門との連携」だ。AD/ADASに関するデータ基盤を担当しているものの、「全社的に見ればあくまで一部門であり、全社IT部門が持つデータを使わせてもらっている立場になる」と、米森氏は表現する。

一方でAD/ADAS部門は専門性が高く、1日に100TBものデータを集める必要がある。そのような要望を全社IT部門に伝えても、正しく理解してもらえないなど、いわゆる組織感の壁や温度差があった。

だが、部門内のデータだけで開発を進めようと思っても、簡単にサイロ化してしまうなど、データの利活用はうまくいかないといった課題である。

イオン・大阪ガス・Hondaのエンジニアが語る「データマネジメントの勘所」──大規模データ分析基盤と組織のリアル - スライド19

3つ目は検証手法の高度化による課題だ。以前はあくまでクルマの外部、Out Carの領域のデータを活用して行っていた。しかし最近は、シャドー制御ロジックという機能により、実際にドライバーが運転している車両で検証を行えるようになった。

その結果、In Car、Out Car両方を高度に連携させる必要が生まれた。当然、両方の領域の知識が必要となってくる。

イオン・大阪ガス・Hondaのエンジニアが語る「データマネジメントの勘所」──大規模データ分析基盤と組織のリアル - スライド20

米森氏はこの3つの課題の中から、まず2つ目の組織課題に対して取り組んだ。ポイントは自部門と全社IT部門との間に、部門の知識や文化に詳しい部門内PF担当者と、専用のデータ基盤を設置したことだ。

このような取り組みにより、エンジニアが依頼をためらうことが減った。PF担当はあくまで部門のメンバーなので、データ活用で成果がより出やすいデータが集まるようになったのだ。さらにはサービス利用料が限定的となり、コストダウンにつながった。

イオン・大阪ガス・Hondaのエンジニアが語る「データマネジメントの勘所」──大規模データ分析基盤と組織のリアル - スライド21

米森氏は、いくつかの工夫も紹介した。1つは、オンプレであったデータ基盤をクラウドにしたことだ。成果を次のように語った。

「大規模データに対応できるようになり、データが探し出しやすくなりました。また、データ計測から活用まで、一気通貫で管理できるようになりました」(米森氏)

イオン・大阪ガス・Hondaのエンジニアが語る「データマネジメントの勘所」──大規模データ分析基盤と組織のリアル - スライド22

2つ目の工夫はクルマのドメイン知識がないソフトウェアエンジニアでも、効率よく仕事を進められるように組織をリデザインしたことだ。具体的には、In Car、Out Carごとに業務を分け、それぞれスクラム開発で進めるようにした。

イオン・大阪ガス・Hondaのエンジニアが語る「データマネジメントの勘所」──大規模データ分析基盤と組織のリアル - スライド23

3つ目の工夫は、データエンジニアのリソースが限られている環境下で、いかに開発を推進するかの取り組みだ。

実装フェーズでは海外のエンジニアも多いため、エンジニアがプロジェクトにスムーズに入るためにロジックツリーを明確化したり、IaCを取り入れたりするなどの対応をしている。

イオン・大阪ガス・Hondaのエンジニアが語る「データマネジメントの勘所」──大規模データ分析基盤と組織のリアル - スライド24

米森氏は最後にデータ基盤に取り組む仕事のやりがいを述べ、セッションを締めた。

「データを中心に安全安心なクルマづくりに貢献できることが、1つのやりがいになっています」(米森氏)

【Q&A】参加者からの質問に登壇者が回答

セッション後は、イベント参加者からの質問に登壇者が回答した。いくつか紹介する。

Q.データドリブン文化の啓蒙や浸透のために、組織として取り組んだことは?

山崎:まずはトップダウンでデータ基盤を構築することです。その後に価値を現場に提供する。今はまだ過渡期ですが、価値が提供できるフェーズになれば、中央集権的にデータを集めた方がよい。このような雰囲気や文化が、社内で醸成されていくと考えています。

花牟禮:成功体験を積み重ねていくことです。そのことを社内外でプロモーションしていく。現場ではそのような取り組みが大事だと考えています。

一方、イオンさんのようにトップダウンで進める手段もあると思いますので、トップダウン、ボトムアップ両方をうまく使い分けながら醸成していければと考えています。

米森:データの利活用がいかに役立つのか。ユースケースを発掘し、整備するような取り組みを、データ基盤チームとは別にデータ分析チームを立ち上げ、整備を行っています。

実際、データの活用方法に詳しくないユーザーでも、事例をいくつか示すことで、一気に活用が広まっていくと感じています。

Q.不要なデータ廃棄に対する取り組み(データクレンジング)は?

山崎:データのニーズにより異なりますが、例えば13カ月は保持しておくなどの設計方針があります。

花牟禮:クレンジングは行っています。例えば、1日のデータを月ごとにまとめるなどして、データ数があまり増えないような工夫に取り組んでいます。

米森:コールドストレージに入れて節約するといった取り組みは、当然しています。一方でクルマの場合はリコールなどが発生した際に、ロジック開発で学習に使ったデータを確認したいといったケースがあります。そのため、保存しておく必要のあるデータと、破棄するデータを分ける必要があると考えています。

Q.データ分析基盤への認証や認可はどのような仕組みを構築しているのか?

山崎:データ基盤に直接アクセスできませんが、Snowflakeなどはカラム単位で権限設定できるような取り組みや管理をしています。Snowflakeでの認証や許可の取り組みは、今後ますます注力していこうと考えています。

花牟禮:人事異動が発生し、アクセスしてもよいテーブルも変わってしまう点に注意しながら、テーブル単位、カラム単位などをそれぞれ地道に制御して対応しています。

米森:データのアクセスに関しては、まず特定ユーザーがアクセスできるミニマムで認証や許可を行う。そこから広げていくという流れを基本的な考えとしています。

株式会社primeNumber
https://primenumber.co.jp/
trocco®フリープランお申込みフォーム
https://trocco.io/lp/inquiry_free.html
trocco®お問い合わせ先
https://trocco.io/inquiry/new
primeNumber自社/共催セミナー情報を発信します。主に、データ抽出統合における各プロセス(ETL:Extract・Transform・Load)に関する事例・ノウハウや、弊社テクノロジーパートナーとのソリューションパッケージ等を紹介など。 ■SaaSデータ分析基盤総合支援サービス「trocco」は日本発分析基盤向けデータ統合自動化サービスです。エンジニアが時間をかけてきたデータ取り込み作業を、90%以上短縮します。

テクノロジーと共に成長しよう、
活躍しよう。

TECH PLAYに登録すると、
スキルアップやキャリアアップのための
情報がもっと簡単に見つけられます。

面白そうなイベントを見つけたら
積極的に参加してみましょう。
ログインはこちら

タグからイベントをさがす