MoT TechTalk 5万台のドラレコを活用!大規模データ収集・機械学習基盤の全容
イベント内容
イベント概要
Mobility Technologies (MoT)では、これから訪れる自動運転社会で求められる鮮度の高い地図データを実現するために、タクシーやトラックにつけられたドライブレコーダーから取得できる映像およびセンサーデータをもとに、AIを用いて道路情報を取得し地図との差分を見つけ、地図に反映させるプロジェクトを行っています。
今回のMoT TechTalk #16では、大量のドラレコデータを収集し、道路情報を検出、そして地図との差分を抽出する処理基盤について紹介します。
特に、ドライブレコーダーとしてのサービス運用中に、バックグラウンドで効率的にデータを収集する際の工夫や直面した問題と解決策、そして収集した大量のデータを処理する機械学習推論の分散実行の仕組みについてフォーカスして語ります。
株式会社Mobility Technologies(MoT)とは
Mobility Technologiesは「移動で人を幸せに。」をミッションに、日本のモビリティ産業をアップデートする様々なITサービスの提供を行っています。
- タクシーアプリ『GO』 https://go.mo-t.com/
- タクシーアプリ『JapanTaxi』 https://japantaxi.jp/
- 法人向けサービス『GO BUSINESS』 https://go.mo-t.com/business/
- タクシーデリバリーアプリ『GO Dine』 https://go-dine.jp/
- 交通事故削減支援サービス『DRIVE CHART』 https://drive-chart.com/
参加対象
- 大規模デバイスデータの収集に興味がある方
- 機械学習推論の分散実行に興味がある方
- ドラレコデータの活用に興味がある方
- MoTを知りたいエンジニアの方
- モビリティに興味があるエンジニアの方
当日のタイムテーブル
時間 | コンテンツ |
---|---|
19:00-19:05 | オープニング |
19:05-20:05 | ・ドラレコデータから道路情報の差分を見つけるシステムの仕組みと特徴 ・契約車両5万台超のドラレコデータを収集する現実解 ・AWS Batchを用いた画像処理の分散実行 |
20:05-20:10 | クロージング |
当初20:00終了の予定でしたが、20:10程度まで延長予定です。
アジェンダ
ドラレコデータから道路情報の差分を見つけるシステムの仕組みと特徴
MoTではタクシーアプリ『GO』や次世代AIドラレコサービス『DRIVE CHART』などを中心に、移動に関するサービスを展開しています。さらに、これらのサービスから取得されたデータを活用し、あらたなサービスを生み出すための取り組みも積極的におこなっています。今回はその取組の1つであるドラレコデータを活用した「道路情報の自動差分抽出プロジェクト」について紹介します。
このプロジェクトにおけるシステムは、ドラレコからGPS、加速度、角速度といったセンサーデータを収集し、マップマッチとよばれる技術で走行した道路を特定した上で必要な動画を取得するデータ収集パートと、標識や信号機に代表される道路情報をディープラーニングで検出し、SLAMなどのコンピュータビジョン技術を使い検出した道路情報の位置座標を推定した上で地図と比較して差分を計算する処理パートから成ります。これらはAWS上でAWS LambdaやAWS Batchなどを組み合わせて作られたパイプライン上で動作しています。ここではこのパイプラインを概観します。
契約車両5万台超のドラレコデータを収集する現実解
ドラレコからのデータ収集には様々な制約があります。 例えば、ドラレコのデータはモバイル回線を通じてアップロードされる仕組みのため、回線負荷や通信料金の面で全ての動画データを取得することはそもそも現実的ではありません。また、デバイスの保存容量に限りがあり古い走行から消えていくため、欲しいデータはロストする前に取得しなければなりません。
こうした制約がある中で、地図更新に必要な必要最低限の動画を効率的に収集する仕組みを紹介します。システムはAWS Lamda、ECS、Batchを組み合わせて実現しており、構成の詳細もご紹介します。
また、実際にデータ収集する中で発生した予期せぬ通信負荷とその解決策といった事例もお話します。
AWS Batchを用いた画像処理の分散実行
地図と道路の差分を見つけるために、ドラレコの映像から道路上の物体を検出し、検出した物体の緯度経度を推定しています。現在1か月で収集されるドラレコの映像は1200時間と大量であり、今後データ量はさらに増えるため高いスループットが求められます。そこでAWS Batchを採用し、一連の処理を分散実行しています。
ここではAWS Batchを用いてどのように分散実行基盤を構築しているのかを紹介します。また、処理の実行環境のビルド時間削減やインスタンスコストの削減など、システムを構築する際の工夫についてもお話しします。
プロフィール
松浦 慎平
データエンジニア
新卒当時から一貫して地図や地理情報システム(GIS)を扱うエンジニアとしてキャリアを歩むGISオタク。空間情報技術を扱うOSSの支援団体であるOSGeo財団日本支部での活動を中心に、FOSS4G (Free and Open Source Software for Geospatial) や交通オープンデータに関するイベントで多数登壇。大規模なモビリティに関するデータが活用される現場で地図やGISに関する知識を活かしたいと思いMobility Technologiesに入社。念願叶い、本プロジェクトでデータエンジニアとして地図に関するシステムを担当。
鳩 英嗣
データエンジニア
Webシステムのインフラ管理業務に携わったのち、データ分析基盤の開発運用に従事。現在はMobility Technologiesにてドラレコデータ収集基盤の開発を担当。
高山 将太
データエンジニア
2017年DeNA入社後、マンガアプリの開発や野球映像の解析などに携わる。現在はMobility Tetchnologiesで分散実行基盤の開発を担当。DeNA TechConやAWS Dev Dayで登壇。趣味はゲームでApex Legendsを1000時間以上プレイし上位2%を達成。
【司会】高堂 和芽(@sandgirl_14)
広報
不動産ベンチャーにて財務経理・法人営業に従事後、2018年よりモバイルオーダーサービスを手がけるShowcase Gigの広報担当に。Mobility Tetchnologiesへは2022年5月に入社し、組織/採用広報を中心にコーポレートコミュニケーション全般を担当。最近ではVoicyを活用した「声の社内報」を社内で立ち上げ&運営。
会場
オンライン(YouTube Live)で開催いたします。URLは参加登録後表示されます。
※後日アーカイブ公開を予定しています。
アーカイブ動画を公開しました。
イベント注意事項
・技術交流が目的の勉強会のため、知識の共有および参加者同士の交流を目的としない参加はお断りしております。参加目的が不適切だと判断される場合には、運営側で参加をキャンセルさせていただく場合がございます。
・参加枠が大幅に埋まらない場合には開催を延期または中止する場合がございます。
・個人情報取扱いについてプライバシーポリシーに定める利用目的に必要な範囲で利用し、当社が責任をもって厳格に管理いたします。内容をご確認の上、ご同意いただきお申込み下さい。
その他、ご不明点などございましたら、遠慮なくご連絡いただけますと幸いです。
キャンペーン注意事項
- クーポンの利用期限は2023/3/31になります。
- 対象者:イベントの最後に実施するアンケートに回答された方
- ご応募はおひとり1回までとさせていただきます
- クーポンのご利用方法や制限事項についてはQ&Aの「クーポンについて」もご参照ください
- 当選発表は、イベント参加時に抽選希望者のみにご登録いただくメールアドレス宛へのクーポンコードのご連絡をもって代えさせていただきます
- 主催者の判断により本キャンペーンを中止する場合がございます
注意事項
※ 掲載タイミングや更新頻度によっては、情報提供元ページの内容と差異が発生しますので予めご了承ください。
※ 最新情報の確認や参加申込手続き、イベントに関するお問い合わせ等は情報提供元ページにてお願いします。
新規会員登録
このイベントに申し込むには会員登録が必要です。
アカウント登録済みの方はログインしてください。
※ ソーシャルアカウントで登録するとログインが簡単に行えます。
※ 連携したソーシャルアカウントは、会員登録完了後にいつでも変更できます。