【レポート】NEDO AI ベンチャーコンテスト採択企業5社の開発責任者が語る人工知能開発の最前線

イベント
【レポート】NEDO AI ベンチャーコンテスト採択企業5社の開発責任者が語る人工知能開発の最前線

2018年2月25日(日)12時より、「【エンジニア向けイベント】人工知能の未来を語る ~ NEDO AI ベンチャーコンテスト採択企業5社の開発責任者が語る開発の最前線 ~」が開催されました。

国立研究開発法人新エネルギー・産業技術総合開発機構(以下、NEDO)は、日本政府の「人工知能技術戦略」に基づきベンチャー企業の研究開発を支援しています。本イベントはその事業の一貫として行ったAIベンチャーコンテストの採択企業が、その技術やサービスを紹介します。

イベントには最新のAI技術に興味をもったエンジニア約170名からの参加申し込みがありました。

当日の登壇者と講演の内容は下記の通りです。

「はじめに」
国立研究開発法人 新エネルギー・産業技術総合開発機構 葛馬弘史さん

「多様話者・多言語に対応可能な“End-to-End音声認識AI”の実用化」
Hmcomm株式会社 三本幸司さん

「五感AIカメラの開発」
アースアイズ株式会社 山内三郎さん

「契約書関連業務における抜本的バックオフィス改革人工知能の調査研究」
株式会社シナモン 家田佳明さん
株式会社シナモン 堀田創さん

「『人口脳SOINN』のご紹介」
SOINN株式会社 長谷川修さん

「深層学習を利用した対話型インターフェースによる非構造化データ検索の調査研究」
株式会社BEDORE 堅山耀太郎さん

それでは内容を紹介します!

はじめに

まずは、NEDOの葛馬さんによるオープニングです。

葛馬弘史(かつらうま・ひろし)/国立研究開発法人 新エネルギー・産業技術総合開発機構 ロボット・AI部 主査。

葛馬さんからNEDOが展開するAIベンチャー支援の内容について説明がありました。

「私たちNEDOは経済産業省の外郭団体で、日本国内の民間企業や大学の研究開発の支援を行っている組織です。今日はNEDOからみなさんに伝えたいことが2点あります。

まず、今日ご登壇いただく5社はすばらしい企業だということです。2017年、経済産業省・総務省・文部科学省が連携して『人工知能技術戦略会議』を開催しました。『日本政府はいかに人工知能技術と関わっていくべきか』という議論を行う場です。

そこで、『ベンチャー企業の活性化』が主要なテーマのひとつに設定されたました。私たちNEDOはその実現のためにコンテストを開催し、ベンチャー企業を採択する事業を行いました。そのコンテストは2017年の8月に開催されたのですが、全57社の応募がありました。その中で採択したのは6社です。

この採択は、NEDOではなく外部の審査員が行っています。技術だけではなく、事業化の可能性も踏まえて採択しているのです。本日はその6社のうち5社が登壇してくれます。

ふたつ目にお伝えしたいことは、この5社がみなさんを必要としているということです。私たちNEDOは資金の面からベンチャー企業を支援しています。しかし、彼らの大きな課題は人材が足りないという点です。事業が軌道にのるかどうかには、人が大切だと私たちは考えています。

どうぞ、この2点を頭に入れながら本日のお話を聞いてもらえればと思います」(葛馬さん)

多様話者・多言語に対応可能な“End-to-End音声認識AI”の実用化

本編1人目はHmcommの三本さんの登壇です。

三本幸司(みつもと・こうじ)/Hmcomm株式会社 代表取締役CEO。神奈川県出身。日本工学院卒。富士ソフトでの約25年の勤務の後、2012年にHmcommを設立。

2012年にHmcommを設立した三本さんは、2014年より音声を対象にした事業をスタート。まず、三本さんはその背景について説明します。

「現在の世の中では、データが爆発的に増加しています。実はその8割を音声、動画、画像などの非構造化データが占めているんです。私たちはこの非構造化データに価値を見出そうと考えました。

例えば、画像認識を活用した自動車の自動運転技術はかなり進展していますよね。しかし、音声の領域はまだまだこれからです。確かにスマートスピーカーのように短い検索用途の単語は実用的なのですが、私たちは業務シーンでの音声を扱い、課題解決したいと思っているんです。

私たちはつくば産総研発のベンチャーとして社会実装を目指しています。R&Dセンターもあり、産総研の研究者も兼業しているんです。研究が行えるのはHmcommで働くメリットのひとつだと思います」(三本さん)

続いて三本さんはHmcommの事業について紹介します。

「音を『民主化』し、音に価値を見出すために、まず私たちは『Speech to Text』、つまり音声をテキスト化し、さらに自然言語解析することで仕事に活かすという領域に取り組んでいます。

この領域では大きく2つのサービスを提供しています。

まずは、『The Voice JP』という音声AIプラットフォームそのものを使ってもらうライセンスモデルです。ただ、そのプラットフォームを利用した自社での開発や投資ができなかったりする企業も多いので、そのプラットフォーム上にソリューションも提供しています」(三本さん)

三本さんは下記の事例を列挙します。

・無人宿泊受付
HISが展開する「変なホテル」の無人フロントで採用。ノイズが多いホテルのフロントで、お客様の音声から「宿泊者カード」の出力を行う。

・テレビや動画のリアルタイムテロップ表示
現在は人力で対応することが多い生中継などのテロップを自動化。スポーツ中継などでは、使用されるキーワードが限られているので不適切な単語を除外することが可能。将来的ににはフリーワードの会話も人間の手を介さずに自動化を目指す。

・「高ノイズ現場」で雑音除去
耳にイヤホンのような形の骨伝導マイクを入れることで、骨伝導で自分の声を音声認識が可能。体外の騒音に影響されないのが特徴で、工場などの騒音環境での利用が想定されている。物流センターでの実験も実施。

・コールセンター
オペレーターをアシストするソリューション。FAQの回答スピードをあげるだけではなく、会話の内容をテキストでサマライズし、自動的にCRMのデータへ入れるように連携。

・テレビ通販コールセンター
「注文商品」「住所」「支払い方法」などを電話から自動で会話で帳票に出力し、発注システムにエキスポートまで行う。

最後に三本さんはNEDOに採択された「End-to-Endoの音声認識AI」について解説します。

「新しい言葉の認識精度が低い点が従来の音声認識の弱点だといえるでしょう。

従来までの音声認識システムの生成モデルでは、まず入力音声から特徴量を抽出します。そして、音響モデル、言語モデル、辞書から認識結果のテキストを確率論で返すわけです。この言語モデルそのものはテキストの集まりですが、音響モデルのと紐付けるには非常にコストがかかります。特徴量の抽出にも、音声入力の環境によっては人間によるチューニング必要となります。

そのため、業務に活かすには様々なチューニングが必要なのが実情です。ただし、そこまで投資できる企業は多くありません。だからこそ、私たちは音声を『民主化』したいのです。このチューニングの問題を解決するためには新しいテクノロジーが必要です。

そこで私たちは『End-toEnd音声認識AI』の実用化に取り組んでいます。これはディープラーニングの主要な手法である『Convolutional Neural Network』を活用した方式で、言語モデルや辞書作成が不要なのです。そのため、方言なども含めた多言語・多様環境への適応が簡単に実現できるという特徴があります」(三本さん)

各講演にはゲストのSOMOPOホールディングス中林さんよりコメントが寄せられます。

中林紀彦(なかばやし・のりひこ)/SOMPOホールディングス株式会社 チーフ・データサイエンティスト。データサイエンティスト協会理事。日本アイ・ビー・エム、オプトホールディング データサイエンスラボなどの勤務を経て、2016年にSOMPOホールディングス入社。

中林 実は三本さんとは一緒に仕事をしているので、よく知っているのですが、音声を理解してEnd-to-Endoで自然言語処理をするのはかなりむずかしいんです。でも、三本さんたちは、様々なチャレンジをしているので、技術的評価は高いですね。

差別化のためにはデータが重要だと思っています。いかにデータを集めて学習させるのかがポイントです。Google、Amazon、Microsoft、LINEなどが言葉を集めています。ただそれは汎用的なもので、ビジネスドメインに特化しているもではありません。業務シーンなどクローズな場所で実用化するためのポイントは?

三本 おっしゃる通り、データが重要だと考えています。学習するための私たちのターゲットはまず大きなコールセンターで実際に使われている音声データです。

次にテレビ局のデータです。テレビ局には良質な音声データと、台本などの良質な書き起こしデータが揃っています。それらが適確に一致していなくても、ディープラーニングでどんどん学習できるような取り組みを始めているところなんです。

五感AIカメラの開発

続いて2人目はアースアイズ山内さんの登壇です。

山内三郎(やまうちさぶろう)/アースアイズ株式会社 代表取締役。1965年生まれ。早稲田大学卒。富士通や広告代理店などでの勤務の後、ベンチャー企業的な活動をスタート。2015年、アースアイズ設立。

まず、山内さんはアースアイズが開発する「五感AI開発カメラ」のコンセプトを説明します。

「防犯カメラによる事件の解決は、録画された映像を再生して確認することから実現します。カメラの市場は世界で年率20%成長を続けていますが、その99%はモニタリングしたり、録画を再生したりすることを必要とするものです。

私たちのカメラのコンセプトは『予防・防止』です。もし、人間が再生を確認するのではなく、カメラが『この人は不審だ』と自動的に判断できるとします。そうすれば、例えば万引きの予防・抑止につながりますよね」(山内さん)

それではどのように不審者を発見していくのでしょうか?

「まず、人間はどのようにあらゆる判断をしているのか考えてみましょう。最終的には脳で考えるわけですが、その前には『見た情報』『聞こえた情報』『香った情報』などが必要ですよね。五感が補完し合って判断につながるわけです。

ですから、私たちはカメラにも五感があれば なにか危機が起こっていることを検知して、通知を飛ばすことができると考えました。これが『五感AIカメラ』です。

現在、もちろんまだ五感の全ては実装できていませんが、まずは『目』から取り組みを始めています」(山内さん)

山内さんはこのカメラがどのように機能するのか、実際に万引きを検知したシーンを動画で紹介します。

「開発には大きくふたつのポイントがありました。まずは、どのように不審者を発見するのかという点です。

小売店での万引きは約350人に1人だと言われています。小売店の店舗に立つ『万引きGメン』と呼ばれる人たちも、基本的には不審な行動を見ることで万引きを発見しますよね。それは、『うろうろ』や『キョロキョロ』などの反応を見ているのです。このカメラでも、そういった心理学的な要件をAIで判別する技術を活用しています。

不審者を検知するとリアルタイムでスマホへ画像を送ります。その通知を受け取った警備員や従業員が声掛けをすることで、万引きの防止につなげるという形ですね」(山内さん)

山内さんはもうひとつの開発のポイントについて続けます。

「もうひとつは、立体空間をいかに二次元の色情報だけで扱うのかという問題です。2次元の映像だけで画像解析すると誤検知になりやすいのです。

そこで、私たちは自身でカメラも開発して、奥行きの距離データも補完できるようにしています。具体的にはカメラとセンサーを10mくらいの間隔で設置し、20cmくらいの枠を検知できるようにするのです。

背景をマトリックス化するイメージなのですが、そこから距離を取得できるので、前の人と後ろの人が重なっていても問題なく検知・追跡が行えます。ビーコンも不要ですね。この技術は特許も取得しています。

また、垂直の座標軸もわかるので、人がどこに触ったかも取得できます。これは、万引きはもちろんのこと、マーケティングにも活用できるデータとなります」(山内さん)

最後に山内さんは実績を紹介します。

「20台のカメラを設置した営業時間が16時間くらいの店舗の例では、1日に20回くらいの不審者への反応があります。通知を受け取った従業員も忙しいので、その半分くらいに声掛けをして対処している状況です。

数字としては、半期で前年対比約300万円万引きによるロスを下げている店舗があります。『ロスがさがらなかったら費用いらないくらい』というくらい、どこでも成果が出ています。

よく費用対効果について聞かれるんです。でも、他にこのようなカメラは存在しません。ある店舗では年間に2600万円を使って警備員に万引きの監視をさせていました。しかし、捕捉できたのは116万円分の商品しかなかったのです。私たちのカメラであれば、月額2350円から利用が可能です。既に1300台もの導入実績もあるのです」(山内さん)

講演終了後は、中林さんからのコメントです。

中林 学習データを作る際のアノテーションが大変だと思います。350人に1人というなかなか発生しない異常値を検知する学習データを作るのは難しいのではないでしょうか?

山内 防犯は突発性の事故を扱うわけですが、事故のデータは基本的にはありません。ですから、ご指摘の通り学習するのは大変は難しいんです。

この会社は設立から3年目なのですが、実は私たちは15年万引きに関する事業を行っています。万引きに関する映像データは、私たちが日本一持っていると思います。

映像データが蓄積することで、非日常のシーンだけ取り込んでディープラーニングを適用することができるようになってきました。

中林 「五感AI」というテーマですが、目以外は?

山内 今日は時間の関係でお話出来ませんでしたが、「助けてー!」など音源から危険なシーンを判別するソリューションも既に販売しています。

次のページ :
契約書関連業務における抜本的バックオフィス改革人工知能の調査研究

1 2

関連するイベント

おすすめのイベント

2021
01/23(土)
10:0017:00
event image

東京都千代田区神田三崎町3-3-20 スキルアップAI 水道橋オフィス/VORT水道橋 Ⅱ 5階
クリップ
1人
定員10人

タグからイベントをさがす

おすすめのコラム

【2020年12月02日(水):ウェビナー】人工知能やデータ分析テクノロジーを戦略的にビジネスに取り込むには? Vol.9

イベント

【2020年12月02日(水):ウェビナー】人工知能やデータ分析テクノロジーを戦略的にビジネスに取り込むには? Vol....

【2020年12月02日(水):ウェビナー】人工知能やデータ分析テクノロジーを戦略的にビジネスに取り込むには? Vol.9

富士通がAIテクノロジーを活用し、新たなAIビジネスを創造するワークショップを開催!

イベント

富士通は、30年以上にわたりAIの実用化に向けた研究開発に継続的に取り組んでいる。その中で生まれてきたのが、AI関連...

富士通がAIテクノロジーを活用し、新たなAIビジネスを創造するワークショップを開催!