パイオニアの開発者が語る、音声ナビゲーションの最先端技術とUI/UX開発の裏側

イベント
ブックマーク
パイオニアの開発者が語る、音声ナビゲーションの最先端技術とUI/UX開発の裏側
音響・映像機器からカーナビなどの車載機器まで、数多くの製品開発・事業展開を通じて長年にわたるモビリティや映像、音声に関するデータを蓄積してきたパイオニア。近年はそれらのデータを活用しながら、高い技術力をベースとしたソリューションサービスへの取り組みを強化している。今回のイベントでは、音声認識・ロケーションベースドサービス(LBS)の最先端技術、開発の舞台裏が語られた。

アーカイブ動画

エッジとクラウドを組み合わせ、最適なモビリティサービスを提供


パイオニア株式会社 SaaSテクノロジーセンター
Piomatixコアテクノロジー統括グループ 統括部長 村田 利幸氏

最初に登壇した村田利幸氏は、モビリティデータを活用したソリューションサービス企業に変革しようと意気込むパイオニアの取り組みと強みについて、こう語っている。

「これまで培ってきたモノづくりのベースであるR&Dやデザイン部門に加え、2021年にSaaSビジネスを推進するための「SaaSテクノロジーセンター」 を設立しました。現在は、『エッジ×SaaSクラウドの取り組み』を進めています」(村田氏)

その取り組みによって生まれたのが、ドライバーに安全で快適なサービスを提供するモビリティAIプラットフォーム「Piomatix(パイオマティクス)」だ。

そして、音声案内だけでナビゲーションサービスを提供するドライブレコーダー型デバイス「NP1」である。クラウド録画によるドライブレコーダー機能やWi-Fi機能、ドライブを楽しむための新機能が搭載されている。

Piomatixは「音声インターフェース」「サービス」「コアエンジン」「データ」という4つのレイヤから構成されている。ドライバーが運転中に得たデータやクラウドに格納していたデータをもとに、3つのコアエンジンが適したサービスを推定し、それを音声で、ユーザーに提供するクルマの新体験サービスだ。


コアエンジンは「ワークロード推定」「走行推定」「インサイト推定」の3つの役割を持っている。サービスを実現するための技術や情報ソースは、以下のようにそれぞれに適した推定技術やセンサーなどが活用されている。


村田氏は最後に以下のように述べ、イントロダクションセッションを締めた。

「これまでの音声インターフェースは、聞かれたことに答えるものが一般的でした。しかしNP1では、ドライバーの特徴やこれまでの運転状況、現在のドライブ状況などのデータを多角的に判断し、ドライバーからの指示だけでなく、デバイスからも情報提供を行います。今後はさらにサービスを充実させ、一般ドライバーだけでなくプロのドライバーや二輪、OEMに向けても、さまざまな事業展開を計画しています」(村田氏)


クルマの移動体験を変える音声インターフェース開発


パイオニア株式会社 SaaSテクノロジーセンター
Piomatixソリューション統括グループ
デジタルソリューション開発部 部長 菅原 啓太郎氏

続いては、デジタルソリューション開発部の菅原啓太郎氏が登壇し、音声インターフェースについて解説した。

「パイオニアが目指しているのは、一般・プロ・二輪すべてのドライバーの体験をアップデートすることです。インターフェースを音声にすることで、画面への視線移動や操作といった手間や時間を軽減し、ストレスフリーなドライブ環境を実現します。また、新しい移動体験を提供することも目的の一つです」(菅原氏)

音声インターフェースのコンセプトは、「把握・予測」「共創」「進化」の3つからなる。


把握・予測では「安心・安全が最も重要」とし、ドライバーの運転状況を常に把握し、運転負荷の低い最適なタイミングで、そのときに必要だと考えられる情報を発信している。また、ドライバーだけでなく同乗者も楽しめる音声コンテンツも提供する。

音声コンテンツを発信したい個人や企業・団体と連携、共創しながら、さまざまな音声コンテンツを提供することで、これまでにない移動体験を提供する。進化はいわゆる個人最適化、パーソナライズ機能である。

「GUIと比べると、情報を一瞬で伝えられない特徴があります。例えば、GUIであれば画面に3つの選択肢を出すことが一瞬でできますが、音声の場合は1・2・3とそれぞれアナウンスしていくからです。一方で、それだけの長い情報の音声を聞けないシーンも少なくありません。そこで、これまでの運転状況や走行データなどをAIが学習し、ドライバーに必要だと思われる情報だけをアナウンスしていきます」(菅原氏)

プル型ではなくプッシュ型の音声インターフェースである理由

NP1は、デバイスからドライバーに情報を提供する、プッシュ型の音声インターフェースである。なぜプッシュ型を選んだのか、菅原氏は次のように説明している。

「今後ますます、搭載される機能は増えていきます。機能が増えることは望ましいですが、ユーザーの立場になり使い勝手を考えると、追加機能をすべて覚えたり、サービスの内容を理解することは難しいと考えたからです」(菅原氏)


まさに、先ほどコンセプトの箇所で触れた「進化」である。ドライバーはどこに住んでいて、どのようなルートをよく通るのか。それは何時が多いのか。運転は優しいのか、荒いのか。大通りが好きなのか、細い道が好きなのか。運転中に音楽を聞くのか、など。

データからドライバーの行動パターンを予測した上で、最適なサービスを、最適なタイミングで、デバイス側から提供していく。

「朝、出勤しようと車に乗り込みます。すると『おはよう、菅原さん。パイオニアに出勤しますか?』と話しかけてきます。『うん』と応えると、『今日はいつも通っている道が渋滞しているので、別の道の方が5分早く着けますからおすすめですよ』と、案内してくれます」(菅原氏)

プッシュ型ではあるが、常に情報を提供することはない。繰り返しになるが「最適なタイミング」を常にAIが判断しているからだ。例えば、インターチェンジから高速に入ろうとしているドライバーに、周辺のグルメ情報を紹介するのは意味がないし、迷惑でもあるからだ。

もうひとつ、音の質にもこだわった。危険な情報の場合は、ドライバーが聞くだけで瞬時に認識できる、アラームなどのサイン音を発すること。声色自体も怒ったような口調から優しい口調まで、数種類用意することで、シーンにフィットした声色を選択する。将来的には、ユーザーが好みの声色を選べる拡張性も備えているという。


ドライバーには初心者からベテラン、プロドライバーまでさまざまなタイプがいる。地域や国によっても、運転の特徴があることも多い。多様なユーザー一人ひとりに最適な情報を提供していく、アクセシビリティにも重きを置いて開発を進めてきたことを強調し、セッションを締めた。

「ドライバーの声から得られるデータの中には、個人を特定できるプライバシーに関する情報も少なくありません。そこで我々は、機密性をしっかりと保護すること。データはあくまでユーザーの利便性を高めるために利用し、データの管理はドライバー自身が行えるようにしています」(菅原氏)


音声だけのカーナビ「NP1」はどのように開発されたのか


パイオニア株式会社 SaaSテクノロジーセンター
Piomatixコアテクノロジー統括グループ
LBS開発部 部長 廣瀬 智博氏

最後に登壇したのは、LBS開発部の廣瀬智博氏。音声のみのナビゲーションという画期的な製品が生まれた背景や開発体制を紹介した。

「カーナビが登場してから30年以上が経ちましたが、画面に地図、矢印、距離が表示され、その情報をサポートする音声が流れる。このようなフローは基本的に変わっていません。一方、世の中ではAlexaなどのスマートスピーカーの利用が広がるなど、音声のみのインターフェースサービスが浸透しています」(廣瀬氏)


このようなトレンドをカーナビにも反映できないか。30年以上続いていた“当たり前”を捨て、音声のみのカーナビゲーションシステムを開発したら、市場から受け入れられるのではないか。数人の開発者のアイデアやチャレンジから、NP1プロジェクトは始動する。

「NP1に限らず、世の中の常識を覆す改革的なチャレンジに挑むエンジニアならびに、そのようなアクションを許容する文化や土壌がパイオニアにはあります。だからこそ、これまで数多くの世界初の製品やサービスを世に送り出してきたのです」(廣瀬氏)

パイオニアでカーナビ開発20年以上、約100の特許を持つ廣瀬氏の言葉に、説得力が宿る。

アジャイル開発を導入し3カ月で試作機が完成

これまでの開発手法は、ほとんどウォーターフォールだったが、今回の開発ではアジャイルの手法を取り入れた。スプリントは2週間に設定し、デプロイとフィードバックサイクルを繰り返した。実走評価は、開発担当者が通勤中に行った。繰り返すこと3カ月、試作1号機は完成。その後もブラッシュアップを続けた。


「アジャイル開発ではさまざまな機能を追加したくなったり、自分たちが何を作っているのか、どんな目的で開発しているのか、ゴールが見えなくなることがあります。そのような迷いが生じた際に立ち返ることができる、アジャイル開発の重要要素インセプションデッキも明確にしておきました」(廣瀬氏)

例えば、一般的なカーナビでは「○○交差点を左折です」といったアナウンスをよく聞く。だが慣れ親しんでいない土地を走っている場合は、交差点名をアナウンスされてもピンとこないことの方が多い。

ドライバーは知らない交差点を目で探すことに集中してしまい、安全・安心な運転に支障をきたす可能性がある。まさにインセプションデッキの内容だ。議論の結果、従来のフローは採用しないこととした。


音声だけのカーナビはどのように開発されたのか

具体的にどのようなフィードバックを重ねていったのか。まずは、「○○m先を曲がってください」のアナウンスだ。従来のモニターがあるカーナビの場合は、距離数がカウントダウンされるので分かりやすい。だが、音声のみの場合は距離感が掴みづらいことが分かった。


そこで距離のアナウンスではなく、運転中に視界に入る信号機や踏切、象徴的な建物を基準として、曲がる箇所をアナウンスすることとした。同じくどこのレーンを走ればいいかもアナウンスすることで、右折なども自然に行えるようにした。


「この先10km直進です」このようなアナウンスもよく聞く。これも同じく、モニターがあれば距離がカウントダウンされていくため不安にならないが、音声のみの場合は曲がる箇所を超えていないのか、不安になるという。

そこで、距離ではなく運転しながらも簡単に確認できる時間をアナウンスすることとした。また、途中に目立つ建物、コンビニなどがあれば「コンビニを通過しています」といったアナウンスをすることで、間違っていないことをドライバーに伝え、安心感が持てるよう配慮した。

慣れてくるとアナウンスを聞き逃す機会が増えることも分かったため、ドライバーの質問に応える機能も実装した。


幼い頃から地図が大好きで、地図を片手にバイクで各地を走りまわった経験を持つ廣瀬氏。地図に関する研究開発がしたいと、パイオニアに就職。その後、カーナビのソフトウェア開発に一貫して従事してきた。まさに、カーナビ開発のスペシャリストである。

その廣瀬氏が新たに取り組むチャレンジ。カーナビ開発が楽しくてたまらないこと、製品に対する情熱が、画面越しにも十二分に伝わってきたことから、多くの参加者から「実際に使ってみたい!」といったコメントが寄せられた。

終始笑顔であった廣瀬氏は次のように述べ、セッションを締めた。

「諸説ありますが、1988年に世界で初めて世に出たカーナビのルート案内は、音声によるものだったそうです。つまり、我々の取り組みは原点回帰でもある。今後も、開拓者として世界初の製品を開発していきたいです」(廣瀬氏)

【Q&A】視聴者からの質問に答えるセッション

視聴者からの質問に登壇者が回答するセッションも設けられた。

Q.エッジ・クラウド処理のバランスや最適化はどのように行っているか

菅原:エッジは反応速度が速いので、「ここ曲がるの?」といったドライバーからの聞き返しに瞬時に応える処理などを行っています。一方、クラウドは通常運転中の交通状況を把握し、その上で分析する処理に充てています。

廣瀬:クルマの現在位置を判断するマップマッチングという処理があります。当初は1秒に一度の頻度でクラウドにアップしていましたが、コストがかなりかさむことがわかりました。そこで現在は、周辺の地図情報を送り、リアルタイムでエッジ処理しています。ある程度処理がたまったところで、クラウドにアップしています。

村田:スピードとコスト、両面を考慮しながらさまざまなトライを行っています。

Q.機能追加や共創についての取り組みについて

村田:リリースしたら終わりではなく、随時バージョンアップしています。

廣瀬:利用者の声をフィードバックしながら、DevOpsでバージョンアップしています。例えば、出発時のガイダンスが右・左どちらに進めばよいのか分かりづらいという声をいただき、案内のアナウンスの改善を行いました。

菅原:Alexaアプリを機能追加しましたね。天気や株価を聞いたり、連携しているデバイスの操作などを音声で行えるようになりました。

Q.パーソナライズについて詳しく聞きたい

廣瀬:ドライバーによっては、大通りを走るのが好きなタイプの方もいますし、細い裏道のような路地を走るのが好きなタイプもいます。人それぞれ異なる好みをデータから判断し、好みのルートをアナウンスするようにパーソナライズしていきたいと思います。

また、現在は実装されていませんが、走っているエリアが旅先の場合、おすすめの観光スポットなどをアナウンスしたり、ルートに組み込む機能も加えていきたいと考えています。

Q.ドライバーの声色から感情を推定する機能はあるのか

菅原:実際にローンチしてみると、思ったよりも声色が安定しているドライバーが多いことが分かりました。そのため現在は、感情推定の機能はオフにしています。ただ、声色からその時の感情を推定することは可能なので、今後は改めて機能追加する可能性はあります。

Q.各サービスでのKPIは何か

菅原:音声インターフェースにおいては、ユーザーの質問に正しく応えられているかどうかを、KPIとしています。リリース後に想定外の質問が多いことが分かり、現在DevOpsで改善を進めています。

廣瀬:ナビゲーションにおいては、従来のカーナビでは品質を担保するチェックリストを作成していましたが、今回の開発では使いませんでした。まずは、プロダクトオーナーが良いと思うのを作り、ユーザーの声のフィードバックで最適化していこうと考えたからです。

Q.オンラインでアジャイル開発を行う工夫や実際に使っているツールや環境は?

菅原:チケット管理はJiraを使っています。実は、WordやExcelなどのOfficeもよく使っていて、ホワイトボードでユーザーストーリーを組むようにしています。できるだけ同時編集できるようにすること、ドキュメントのバージョン管理は行わないことを意識しています。

廣瀬:オンラインになったことで、小さな会議を開きやすくなりました。現在はアジャイル開発も増えたため、15分ほどの会議にどんどん参加できるようになりました。

Q.ウォーターフォールからアジャイルに変えたことによる苦労や工夫について

廣瀬:アジャイルは初めてだったので、ルールなども何もない状態でした。さすがに何もないのはまずいと思い、品質保証のメンバーをチームに迎え入れ、デプロイやローンチでの評価をお願いしました。とにかく走りながらいろいろな人を巻き込み、開発方法やルールをかためていったというかんじです。

パイオニア株式会社
https://jpn.pioneer/ja/
パイオニア株式会社のキャリア採用情報
https://js03.jposting.net/pioneer/u/job.phtml
パイニア公式note
https://note.jpn.pioneer/?utm_source=techplay_vol1&utm_medium=direct
フォロワー188人

テクノロジーと共に成長しよう、
活躍しよう。

TECH PLAYに登録すると、
スキルアップやキャリアアップのための
情報がもっと簡単に見つけられます。

面白そうなイベントを見つけたら
積極的に参加してみましょう。
ログインはこちら

タグからイベントをさがす