【レポート】NEDO AI ベンチャーコンテスト採択企業5社の開発責任者が語る人工知能開発の最前線
契約書関連業務における抜本的バックオフィス改革人工知能の調査研究
3社目はシナモンの家田さん、堀田さんです。
家田佳明(いえだ・よしあき)/株式会社シナモン COO。愛知県出身。名古屋大学卒。電通、リクルート、P&Gなどでの勤務を経て、シナモンへ参画。
まず前半はCOOの家田さんからシナモンについて企業の概要が紹介されます。
「私たちは人工知能のプロダクト提供、さらにコンサルティング・開発を事業としています。
掲げているのは『人と人工知能の未来を築き、創造性あふれる世界を創る』というビジョンです。ホワイトカラーのみなさんは、めんどうで時間のかかる仕事を多く抱えていますよね。手間のかかる業務をどんどんAIに任せて、働き方改革・業務効率改善を実施しようという考えです。
経営陣はCEOの平野、CAIOの堀田、そして私の3名です。私以外の2名はエンジニアでありまして、学生時代に2人とも『IPA未踏エンジニア』に2回採択されています。
シナモンの創業は2012年ですが、人工知能事業は2016年からスタートしています。現在は、ベトナムに約40名の人工知能技術者がいます」(家田さん)
次に家田さんはシナモンの3つの事業のうち「FLAX SCANNER」について説明します。
「『FLAX SCANNER』人間のように書類を読み取り情報を抽出する文書読み取りエンジンです」という家田さん。その特徴として次の3つがあげられます。
- メールや契約書などフォーマットが定まっていない帳票が読み取れる
- 書類はPDF、Word、手書き、印字、FAXなんでも読み取れる
- 手書きの読み取りも実データで95〜98%の精度がある
「様々なビジネス文書は、中身が同じでフォーマットだけ異なったりしていますよね。
現在はオートメーションがとても注目されています。しかし、それらを導入する前には人間が書類を読んで入力しなければいけなかったりしますよね。それは大きな課題です。
私たちは『人間がコンピュータに合わせる』のではなく、『コンピュータが人間に合わせる』ことでこの課題を解決したいと考えています。
現在のお客様は銀行や証券会社、保険会社などですね。融資事務業務の効率化や口座振替業務の代替、保険金申請業務の効率化などに活用されています」(家田さん)
後半はCAIOの堀田さんより「FLAX SCANNER」について技術の観点から解説されます。
堀田創(ほった・はじめ)/株式会社シナモン CAIO。慶應義塾大学大学院理工学研究科後期博士課程修了。学生時代にネイキッドテクノロジーを共同創業し、その後売却。2012年にシナモンを共同創業。
「『FLAX SCANNER』では、契約書のレビュー業務において、要点を抽出してカテゴライズしようと試みています。金融機関や大手企業では、300ページを越えるような契約書を業務で扱います。その契約書を弁護士とひとつずつ確認しながら、300点の要点をまとめたサマリー表を作ったりするのです。
この業務をAIで効率化できるのではないかと考えました。契約書の要点を抽出する際『ここから、ここまで』と範囲を指定する作業があるのですが、この作業を自動化できると助かるというインサイトが得られたんです」(堀田さん)
堀田さんは「ここからここまで」の範囲指定を実現するために実施したタグクラスフィケーションについて紹介します。
「Bi-Directional LSTM」
- リカレントニューラルネットワークの一種LSTM
- LSTMは時系列を扱う
- 「ここから、ここまで」を指定するために、まず「forward」で「ここまで」を決める
- 次に「backward」で「ここから」を特定する
さらに堀田さんは「Bi-Directional LSTM」を活用するまでの失敗を共有します。
- 当初、「人間が定義した辞書だと効率がいいのでは?」と考え、様々なチューニングを行ったが、最終的には自動のアルゴリズムのほうが精度がよかった
- どのモデルがうまくいくのかわからないため、複数モデルを積みお互いの結果をValidateするアーキテクチャとした
- アルゴリズムの実装が重要だと考えていたが、ソフトウェアの開発に論点がうつった
「実際には数多くのモジュールが中では使われています。大切なのは、アルゴリズムの開発そのものよりも、どのようなアーキテクチャのフレームワークに流すとアジャイルで素早く開発が回せるかという点です。システム全体でどのように使うのかアルゴリズムをオーケストレーションしていくことが必要なのです」(堀田さん)
最後に堀田さんは、日本サイドでは「ビジネスを理解して営業とコミュニケーションを取れる人」、ベトナムでは「トップ大学から採用したAIエンジニアを将来的に500名体制にしたい」と人材戦略を語り、講演を終了しました。
中林さんからコメントです。
中林 私もアルゴリズムの付加価値はどんどん落ちると思っています。新しいものをいかに取り入れるかがポイントになるでしょうから、すごくいいアーキテクチャの考え方だと思います。
契約書以外の領域でも同じフレームワークは活用できると思いますか?
堀田 ニーズごとにモジュールの組み合わせ方が異なると考え方を持っています。クラウドにあるひとつの大きなソフトウェアを様々な人に向けるのではなく、そもそもオンプレミスの需要が多いですね。
『人口脳SOINN』のご紹介
4社目の登壇は、SOINNの長谷川さんです。
長谷川修(はせがわ・おさむ)/SOINN株式会社 代表取締役CEO。東京工業大学・工学院システム制御系・准教授。東京大学大学院電子工学専攻博士課程修了。2014年、SOINNを設立。
まず長谷川さんは「SOINN」の概要を次の通り説明します。
■「SOINN」とは?
- 「学習型で汎用な人工知能」
- データを入れると自分で細胞分裂して、ネットワーク自体が構築され、機能や性能があがる
- 汎用性が高く技術的には入れられないデータはない
- 名前は「Self-Organizing Incremental Neural Network」の略
- 全基本特許と商標をSOINN社で所有
- 公開情報は論文のみ
「『SOINN』はニューラルネットワークの一種で、私たちは『人口脳』と呼んでいます。
製品としてはまず、お客様にどのようなデータを投入するかを聞ききます。そして、そのデータを読み込んで成長するように設定するし、PCなどに入れて納品するんです。このPCは市販されている一般的なスペックなもので問題ありません。
納品後、お客様が社内の独自データノやウハウを入れると『SOINN』は成長して、機能のレベルがあがっていきます。成長しきったら置き換えることも可能ですが、お客様はどのようなデータを入れたのかを私たちに開示する必要はありません。
もちろん、育った『SOINN』自体はお客様の手元に残ります。金融機関、医療機関などノウハウを外に出せない方にもとても喜んでもらっています」(長谷川さん)
続いて長谷川さんは「SOINN」の特徴を下記の通り列挙します。
- 事前に想定して組み込むモデルが不要
- 画像、テキスト、気象データ、売上などあらゆるデータを入力可能で、組み合わせも実用化している
- 処理言語を問わない
- PC、スマホ、ロボット、家電、車などハードウェアを問わない
- ネットから情報を自動収集し学習する
「『SOINN』は情報をエサとして増殖する人工細胞群なんです。クラスの数やニューロンの数、ネットワーク構造はすべて入ってきたデータに応じて『SOINN』自身が決めています。
通常のディープラーニングと比較すると、マルチモーダルで異なる種類の情報を混ぜ合わせて学習することが実用レベルに達しているのは大きな優位点だと思いますね。学習データからノイズを自動で消去したりできたり、学習に必要なデータのラベル付けが少量で済むことも特徴のひとつです」(長谷川さん)
さらに「現場のベテランの方が、新人をトレーニングするように『SOINN』に教えることができるんです」と語る長谷川さんは、事例を次々に紹介します。
事例1
川崎重工での大規模プラントの自動制御の事例。ゴミ収集者が回収するゴミは雨が降っていると燃えにくかったり、季節によっても質が異なったりする。また、発電のニーズも変動し、必要なときに必要な火力を出すにはベテラン職員の調整が必要。
『SOINN』には炉の中の温度、ガスの濃度などのベテランがチェックする項目を同じように学習させ、安定した火力を自動的に出せるように制御できるようになった。
事例2
地中のレーダ画像を取得する路面化空洞調査での事例。陥没する恐れのある危険箇所を見つけるために、職員が自動車を運転して点検するのが従来のやり方。見逃しがあるといけないのでベテラン職員でも1日当たり10kmが限界である。この状況を自動化によって改善はしたいものの、日頃の業務が忙しく学習のために何万枚もマーキングしてもうことは難しい状況。
「SOINN」では、まず120枚のデータだけマーキングしてもらい、出てきた結果を再びチェックするという新人トレーニングのようなフローを実施。最終的には400枚程度のチェックだけで実運用ができる精度になった。
事例3
ドローンを「SOINN」だけで制御する事例。センサー情報やカメラ、姿勢信号からホバリングの姿勢がくずれたら戻す方法を覚えさせたところ、15分ほどで学習が完了。荷物をつるした状態でも制御が可能で、目的地データなどと組み合わせたドローン宅配への応用を目指している。
事例4
セブン銀行ATMでのトライアル事例。約2万2000台設置してあるATMの5年分のデータを、一般的店舗で購入可能なPCで学習。わずか2時間で学習は完了し、それぞれのATMの90日分の予測処理も10分で行える。
地図、天候、人口分布などのデータを組みわせることで、「どのような天気のときに、どのエリアの店舗で、何曜日に何時に、どのくらい動く」などを自分で覚えてわかるようになる。
最後に長谷川さんは「『SOINN』をスマホでも動かし、自分専用のパーソナルコンシェルジュAIが自分のスマホの中に育つように取り組んでいる」とNEDOに採択された研究について話し、講演を終了しました。
中林さんからのコメントは次の通りです。
中林 これまでの発表と異なり、汎用型のAIは難易度が高いジャンルになります。現在はデータセットのある程度の前処理での加工や、アウトプットの一定のデザインが必要だったりすると思いますが、完全汎用化までのロードマップはすでに見えているのですか?
長谷川 頭の中では完全汎用化までの道筋見えています。スマホのプロジェクトでもそこに向けた取り組みを行っていきます。
深層学習を利用した対話型インターフェースによる非構造化データ検索の調査研究
最後の登壇はBEDOREの堅山さんです。
堅山耀太郎(かたやま・ようたろう)/株式会社BEDORE 取締役。東京大学大学院工学系研究科博士課程在学中。平成2年生まれ。総務省SCOPE異能vationプログラム、ゴールドマン・サックス証券、PKSHA Technologyでの経験を経て、BEDOREの取締役に就任。
堅山さんはまずBEDORE社の概要を説明します。
「私たちは昨年マザーズへ上場したPKSHA Technologyの言語領域の事業をスピンオフして設立されました。LINEやウェブ上での自動応答エンジンを中心に、言語処理と深層学習を掛け合わせたプロダクトを提供しています。
メインのプロダクトは社名と同じ「BEDORE」です。自然文で寄せられた問い合わせを解析して、最適なナレッジのデータをAIでとって対応する自動応答エンジンですね。
365日24時間対応ができ、一問一答だけではなく、対話形式で質問を絞り込んでいくことも可能です。LINE、クレディセゾン、KDDIファイナンシャルサービスなどに導入されており、導入企業のサービス上で「BEDORE」をご利用いただいているユーザー数はのべ5500万にものぼります」(堅山さん)
次に堅山さんは、NEDOに採択された「ニューラル検索」事業の前提として、「コンピュータが言葉を理解する」とはどのようなことなのかを考えます。
「『言葉を理解する』というのは、判断する人の主観が入るので定義することはむずかしいと考えています。ただ、人間の言語機能を『翻訳』『対話』などと分解し、そのタスクをコンピュータが行えるかどうかを判定することはできますよね。
画像認識や音声認識の領域では、人間を越える精度を残す研究が多くありますが、実は言語では人間のパフォーマンスを越えられるタスクはほぼありません。
しかし、いくつかのタスクは解ける兆しが見えてきています。そのひとつが『短文読解』です。このタスクにおいては、人間を越える精度が出た研究が2018年に出てきたのです。ただし、似た文を加えるだけで騙されてしまうという課題もあり、まだまだ不完全なのが実情です」(堅山さん)
「NEDOに採択され『ニューラル検索』という私たちの研究は、この短文読解を日本語で実現しようとするものです」と堅山さん。どのような場面での実用化を目指しているのでしょうか?
「知的労働者層は、様々な情報検索に週平均8.8時間もの時間を使っていると言われています。これは勤務時間の22%に値する数字です。
特に非効率なのが社内情報検索です。Googleでのウェブ検索と異なり、社内システムの検索はキーワードを知らないと調べられなかったり、回答候補が大量にあったり、ドキュメントのどこを見ればいいのかわからないといった問題あります。
『BEDORE』のような対話エンジンを使ったFAQシステムに注目が集まっていますが、きちんとナレッジを作って構造化し、すべての社内検索を置き換えるのは現実的にはかなりのコストがかかります。
そこで私たちが提案するのが『ニューラル検索』なのです。
例えば、クレジットカードのコールセンターで働く職員が『不正利用調査を受け付けられるのはいつまでの利用分が対象なのか』を調べたかったとします。従来は『不正利用 受付 期間』のように社内システムを検索しても、まず膨大な数のドキュメントがヒットし、そのドキュメントを開いても答えがどこにあるのかを探すのにさらに時間が掛かっていました。
これを検索と文書解析に深層学習を利用することで、検索の後すぐに『カードの利用日から120日以内です』と回答できるようにしたいのです。実際にいまこの研究に取り組んでいまして、デモでも精度があがってきました」(堅山さん)
最後に堅山さんは今後のソフトウェアの世界の展望を語り、講演を終了しました。
「従来までのソフトウェアは、プログラマーが演繹的に記述することが主流でした。しかし、今後は機械学習のアルゴリズムが帰納的に記述する世界観に移っていくことでしょう。
その動きはすでに始まっていますよね。『Google翻訳』は統計的な処理からニューラルネットワークに置き換わっているのです。
『ソフトウェア2.0』という言葉がよく使われるようになってきました。今後もニューラルネットワークの重みで書かれる世界がどんどん広まっていくのだと考えています。この世界でこれからソフトウェアを作るには、アルゴリズム、インフラ、ハードウェアなど広い呂域の人材が必要になっていくと私は思います」(堅山さん)
最後に中林さんからのコメントです。
中林 最後に今後求められる人材を挙げていましたが、かなり幅広いですよね。特に求められるスキルセットはどの領域になると思いますか?
堅山 「直近で足りていない」という観点ですと、ソフトウェアエンジニアがまだ不足していますね。入ってくるデータが良質で、いかにみなさんに使ってもらうかが大切なフェーズですので、まだ改善できると思っています。ディープラーニングに特化するというよりも、パッケージ化して提供できるスキルセットが求められているのではないでしょうか。
休憩を挟みながら2時間半実施された講演も以上で終了です。
5社の登壇者には多くの参加者が名刺交換を求めて長蛇の列を作っていたようです。
またの開催を楽しみにお待ちしています!
取材/文:栗原 悠司