TECH PLAY

Laboro.AI

Laboro.AI の技術ブログ

146

線路は続く、未来へと。鉄道業界のAI活用 2021.9.5 概 要 一見、IT技術やデジタル技術との関わりが薄いと思われがちな鉄道業界ですが、実は、人々の行動履歴をはじめとしたデータの宝庫であることが言われてます。近年、鉄道利用者の安全性・利便性の向上やマーケティング利用、抜本的なコスト削減など、膨大なビッグデータをベースとしたAI活用がさまざまな形で進められています。今回のコラムでは、鉄道業界におけるAI活用方法や事例をご紹介していきます。 目 次 ・ 鉄道業界はデータ&AI活用のパラダイス ・ AIは鉄道業界の課題をどう解決するか  ・ 運用最適化によるコスト削減  ・ 快適性・乗車体験の向上 ・ 鉄道業界でのAI活用方法  ・ 故障予知・予兆検知  ・ 指令業務オペレーション支援  ・ ホーム転落事故防止  ・ 駅構内でのチャットボット活用  ・ 強化学習AIによる制振制御 ・ 鉄道AIのイノベーションは、生活者の未来へと続く 鉄道業界はデータ&AI活用のパラダイス 一般乗客の目に見える形で実現している鉄道×AIの技術というとまだ思いつくものは少ないかもしれませんが、鉄道にはAIの活用に欠かせないビッグデータが多く存在しています。鉄道ダイヤや時刻表、運行・運転パターン、人流、混雑状況、駅チカ・駅ナカでのショッピング情報、SUICA(JR東日本)といった鉄道系ICカードの利用情報などなど、もちろんそれらをいかにして取得・解析していくかという壁が大きいものではありますが、こうした多種多様なデータが“鉄道”あるいは“駅”という一つの空間に集約されており、こうした「データパラダイス」は決して多いものではありません。 次の項目から詳しく解説しますが、AIは鉄道業界にあるさまざまな課題を解決できると期待されており、すでに大きな成果を見せている事例もあります。また、AIを活用することでこれまでなかったような輸送サービスを開発することも期待されるほか、AI技術が発達することで近い将来、鉄道の風景が大きく変わることもあるかもしれません。 出典: NISSENデジタルハブ「AI化した鉄道は、より安全に、より速くなる」 AIは鉄道業界の課題をどう解決するか AIは、鉄道業界のどのような課題を、どのように解決していくのでしょうか。 運用最適化によるコスト削減 インバウンド需要などにより、鉄道業界の市場規模は2011年以降、増加傾向にあると言われています。一方で、新型コロナウイルス(COVID-19)の感染拡大の影響や国内の人口減少を背景に、輸送するそもそもの人数が減ることによる市場規模の縮小が懸念されており、結果として、現在稼働している運行・車両に関わるコストが鉄道経営を圧迫することも予想されます。 JR九州で模索されているのが、AIや量子コンピュータなどの先進技術を用いて各種運用の最適化を推進し、最低限の維持コストで鉄道を運行しようという取り組みです。従来、ダイヤの作成や車両編成などの業務は、車両組み換えのタイミング、清掃やメンテナンスの手間、路線や車両ごとに異なる場所の条件などを踏まえ、ベテランの経験と勘によって行われていました。この作業をAIなどの技術で代替することにより、車両の保有台数を減らす、あるいは将来の設備投資を抑えるなど、抜本的なコスト削減が目指されています。 出典: 業界動向SEARCH.COM「鉄道業界」 出典: LIGARE「JR九州、量子コンピュータ・AI活用で鉄道車両の運用最適化を検証」 快適性・乗車体験の向上 これまでも車両内の快適性を追求するため、多くの新車両の開発が行われてきましたが、通勤時間の混雑具合や夏の蒸し暑さなど、快適に過ごせるとは言えない状況が完全には無くなったとは言えません。 JR東海が2021年より順次従来車両から置き換えていくと発表している新型通勤型電車315系は、「優しく安心感のある快適な移動空間」をコンセプトに、高い天井などによる開放感のあるインテリア、全編成に導入される車椅子対応トイレ、1両ごとに5台ずつ設置された防犯カメラなど、さまざまな革新が図られた新型車両です。さらに、AIを活用した画期的機能が、自動学習・制御最適化による冷房システムです。315系では、サーバー上にあるAIとの通信を行い、車両内の状況に合わせた冷房制御をAIに任せることで、現行車両の1つである211系と比べると、3倍以上の冷房性能アップにつながるとしています。 出典: レスポンス「電車の冷房はAIが制御…JR東海の新通勤型315系 優しさと安心感のインテリア」 鉄道業界でのAI活用方法 ここからは、鉄道業界での具体的なAI活用方法を事例を交えて見ていきます。 故障予知・予兆検知 「故障予知」「故障予測」「予兆検知」など、さまざまな言われ方がされますが、事前に故障を予測し、その予兆を検知することを目的としたAI活用は、人命を預かる鉄道業界では最も期待が集まるところです。 例えば鉄道では、車両や信号設備の故障が重大な事故につながるため、事故が起きた際の検知ではなく、その予兆を検知することが重要になります。NECが考える「故障予兆検知ソリューション」は、AIを用いて故障の予兆を検知するシステムであり、鉄道業界向けに実用化が目指されています。一般的に、AIの学習に必要なデータを収集しようとする際、事故や故障が発生することは稀で、教師データを収集することに難しさ伴うことが少なくありません。NECの研究報告では、正常運転の状態をAIに学習させ、それ以外のパターンを異常として検知する「インバリアント分析」を活用したシステム開発が想定されています。 出典: NEC Value Chain Innovation特集「AI・IoTを活用した鉄道業務変革(鉄道DX)」 指令業務オペレーション支援 鉄道の指令業務でもAIの活用が進められています。上と同じくNECが構想しているものが、輸送障害が発生した際に行われるダイヤの引き直し等のオペレーションを、AIに行わせるようにするシステムです。 輸送障害時のオペレーションはさまざまな要因を考慮してベテランが指示するため、同じ運用がされることは基本的になく、機械学習を主としたAIに学習させることは難しいとされていました。NECではシミュレータを使って輸送障害のさまざまなケースを擬似データとして作成し、これらを学習データとして用いることでAIに最適なダイヤ提案ができるよう研究開発を進めています。 出典: NEC Value Chain Innovation特集「AI・IoTを活用した鉄道業務変革(鉄道DX)」 ホーム転落事故防止 JR九州で実運用されているのが、AIによるホーム転落事故防止システムです。JR九州では駅員によるホームの監視ができない無人駅にカメラを設置し、画像系AIシステムによりホームに落ちそうになった人の動きが検知されるとアラームを駅構内に鳴らし警告する仕組みを導入しています。 このシステムでは、例えばホームに向かってフラフラと歩くといった転落者に特有の動きのみを学習することで、単にホームの端へ近づこうとしただけの人との違いも区別できるとのことです。 出典: NISSENデジタルハブ「AI化した鉄道は、より安全に、より速くなる」 駅構内でのチャットボット活用 AIによる簡単な受け答えや質問への回答ができるチャットボットはWebサイトでの導入が活発ですが、鉄道業界では駅構内に導入している事例が多く見られるようになっておきました。 一部の主要駅に導入されているAIを搭載したデジタルサイネージでは、駅員の代わりに利用客からの質問を受け、切符の買い方や乗換案内、駅構内の案内などを利用客に伝えるといったことが可能になっています。こうしたAIチャットボットシステムの活用により、質問対応に追われる駅員の負担軽減になる他、必要に応じて画像なども用いた視覚的な案内ができる、さらには、学習に用いるコーパス(言語データセット)に限界はあるものの、多国語にも対応できるというメリットも考えられます。 出典: COGNIGY「鉄道×AI – 駅構内の案内や鉄道でのAIチャットボット活用」 強化学習AIによる制振制御 こちらは当社が大林組様と行ったプロジェクト事例です。建物を地震から守るシステムにはさまざまなタイプがありますが、その一つとして建物の揺れを抑えるための機構であるマスダンパーの動きをコンピュータ制御する「AMD(アクティブ制振)」という手法があります。Laboro.AIでは、揺れの発生・抑制を計るためのシミュレータを構築した上、強化学習というAIの学習手法を用いて、このAMDの動きをより賢く動くよう制御することに成功しました。 このプロジェクトは基本的には建設物を想定し進められたものですが、この技術を鉄道にも応用することで、列車走行時の揺れをAIが制御し、快適性を向上するといった発展も考えられます。 こちらの事例について詳しくは、以下のページをご覧ください。 Laboro.AI プロジェクト事例: 建設物の制振制御 鉄道AIのイノベーションは、生活者の未来へと続く 今回はご紹介していませんが、上記以外にもRFIDセンサーを活用した列車内の密度や混雑状況の感知、画像技術を用いた駅構内の人流の解析、鉄道系ICカードに記録された移動履歴の分析など、私たちのさまざまな行動データを活かす取り組みが鉄道業界では模索されています。 日々の通勤・通学など移動時間を支える鉄道は、私たちの生活にとって非常に密接な存在です。まだ生活を大きく変えるような爆発的なイノベーションは登場していないかもしれませんが、AIを軸とした多種多様なデータ活用に基づく先進的な研究開発が数多く進められており、「鉄道」あるいは「駅」、さらには「移動」という概念そのものが大きく変わる未来も遠くはないのかもしれません。
アバター
POSからの脱却。小売AIの進化と可能性 2021.8.31 概 要 人間にはできないような処理が可能とされるAI。さまざまな業界で、AIを活用したイノベーション創出に取り組んでいますが、近年、急速に活用が進められている業界の一つが小売業界です。今回のコラムでは、小売業界でAI導入を検討している方に向け、小売業界でのAI活用の現状や事例についてご紹介していきます。 目 次 ・ 急速に進む小売業界でのAI活用 ・ 小売業界がAI活用に期待できること  ・ 需要予測・売上予測の精度向上  ・ 発注業務の効率化  ・ 顧客の店舗内行動の把握・分析 ・ 小売業界でのAI活用事例  ・ セミオート発注システム  ・ 顧客行動を分析するAIカメラ  ・ 棚割り画像認識 ・ AIだけでなく、様々な可能性を吟味する 急速に進む小売業界でのAI活用 利益率を上げるための無理な経費削減や、ベテランの経験に頼った属人化した発注業務など、小売業界には旧態依然とした状況やさまざまな課題があると言われています。このような課題の解決手段として期待されているのが、AIです。 少し古いデータですが、2017年にアメリカのMarketsand Marketsが発表した調査レポート『小売業向け人工知能(AI)の世界市場:ソリューション別、用途別2022年予測』によると、2017年に9億9,360万米ドルであった小売業界向けのAI市場は、2022年までに50億3,400万米ドルまで成長すると予想されています。国内でも小売業界にAIを導入しようという試みは活発で、さまざまな事例が登場しています。 AIの定義はしっかりと定まったものはありませんが、人間の知能を模した機能を有したコンピュータのことを指し、近年、AIと言えば主に機械学習技術を活用したシステムを指します。機械学習は、一定のルールを与えることでAI自身にタスクに対する学習をさせ、そこにある規則性やパターンなどを学び取らせることで、認識や予測・推論といった処理を実現するための技術です。 AIは、人間では扱いきれないような膨大なデータを処理することに長け、ビックデータの解析を通して、これまでは発見できなかったような特徴を導き出すことが期待されています。例えば、次の項目でも触れますが、需要予測の正確性を向上させるといった活用はその一つです。 小売業界がAI活用に期待できること AIを活用することで、小売業界にはどのような効果がもたらされるのでしょうか。 需要予測・売上予測の精度向上 AIは膨大なデータを学習することで、複雑に絡み合っている情報の中から一定のパターンを見つけ出すことを得意とします。無限にある説明変数を全て勘案することは不可能なため完全な予測は難しいとしても、従来よりも精度の高い需要予測・売上予測の実現にAIの活路が見出されます。 小売業界では、1980年頃からPOSやID-POSが用いられるようになり、膨大なデータが蓄積され、各種の分析に用いられてきました。しかし、これらデータはあくまで購入者の情報を示すものであり、購入していない人も含んだ需要を表すデータとは言い切れません。また、需要を予測するためには、天候や競合店舗の価格や販促施策、周囲の催事情報など、定量・定性情報を含む、多くの変数を勘案する必要があります。 AIを用いることで、購買履歴や顧客情報だけでなく、地域住民の特性、経済の状況、天候、カメラを用いた顧客の行動データなど、多数の変数から需要の増減を予測できる確度が高まっていきます。適切なタイミングでの適切な量の発注を可能にし、機会ロスの削減につながることが期待されます。 出典: BUSINESS INSIDER『AIは小売業に何をもたらすのか。マイクロソフトの事例から見えてきたもの』 発注業務の効率化 発注業務が属人化しているケースの場合、とくに発注のタイミングや量の決定を勘に頼らざるを得ず、正確性にバラツキが出るだけでなく、その成否の検証も難しくなっていきます。次の活用事例でもご紹介しますが、発注業務をAIに任せることによりワンボタンで発注できるシステムも存在するほか、陳列状況を画像情報からリアルタイム監視することで欠品状態を常時把握できるようにするシステムなど、一部業務を自動化させ、業務効率化に寄与する効果も期待されます。 顧客の店舗内行動の把握・分析 2010年代以降、AI技術の中でもとくに進歩が著しい技術領域が、画像認識の分野です。画像認識技術は、来店客の店舗内行動の把握のためにも用いられており、動線分析や店内ホットスポット・デッドスポットの検出、滞在時間の抽出、万引き犯などの不審者検出のほか、無人店舗でも用いられる顔認証決済などにも画像認識AIが用いられるようになっています。 とくに動線分析は、これまでは調査員を店内に立たせることによって把握することが主だったため、調査期間中の一時点でしか把握できない課題がありました。AI技術の活用はもちろんのこと、RFIDタグなどの各種センサー技術も用いることで、リアルタイムに常時店内の顧客行動を把握・分析できる環境が整えば、さまざな販売施策に活用できるデータを店舗側で取得できるようになっていくはずです。 小売業界でのAI活用事例 ここからは、代表的な小売業界でのAI活用事例をご紹介していきます。 セミオート発注システム 大手コンビニチェーンのローソンでは、大手コンビニチェーンの中では先駆けて、AIを活用した「セミオート発注システム」を2015年から導入しています。 ローソンのセミオート発注システムは、過去の販売状況やポイントカードから得られる会員データ、他店舗の販売状況、天候、気温など100にも上る指標を用い、AIが発注の推奨数を提案するという仕組みになっています。対象となるのはデザートやおにぎりなど消費期限の短い商品が中心であり、発注業務にかかる時間の削減に成功しています。 ローソンではセミオート発注システムの他、主に日持ちする商品を対象とした計画発注も行っており、商品に合わせて発注方法を使い分けています。売上アップのほか、無駄な廃棄物を抑制する取り組みとしても、このセミオート発注システムが活用されています。 出典: ローソン「廃棄物削減」 出典: ニュースイッチ「コンビニの収益を左右するAI発注、先行するのはどこだ!?」 顧客行動を分析するAIカメラ Amazonを始めとしたECサイトが急速に普及し、今やインターネットでショッピングをすることが当たり前の光景になりましたが、売上比率としてはまだまだ実店舗のほうが大きな割合を占めています。一方、急速な成長に合わせてアクセス解析などのデータ取得・分析手法が比較的進化したECサイトと異なり、実店舗で取得されるデータと言えば、未だPOSデータが主となっているのが現状です。 実店舗での新たな顧客データの取得に向け、積極的なAI技術の活用を推し進めているのが、福岡県を中心にスーパーマーケットを展開しているTRIAL(トライアル)です。TRIALが積極的に導入を進めているのが、実店舗内の顧客の行動分析をAIで行おうという「リテールAIカメラ」で、このAIカメラを活用した一連のシステムでは、店内に複数設置されたリテールAIカメラで棚にある商品在庫や顧客の行動分析を行った上、「スマートショッピングカート」に設置されたデジタルサイネージに表示される商品提案CMを連動させ、より顧客に適したレコメンドを実現する取り組みが進められています。 出典: MONOist「『ECの世界をリアルで再現する』トライアルが関東初のスマートストアを開店」 棚割り画像認識 画像認識技術を用いて陳列棚の棚割りやディスプレイの状態を検知するAIシステムも数多く見られるようになってきました。その一つとして、サイバーリンクスが提供しているのが、NTTドコモのAI技術を活用した「棚SCAN-AI」です。 棚SCAN-AIはスマホ等のカメラで陳列写真を撮影することで陳列状況をデータ化できるシステムで、年間2~3万の新商品の画像をデータ化している膨大なデータベースとディープラーニング技術を活用し、さまざまな陳列状態での商品認識を実現しています。商品は真正面を向いた状態で陳列されているばかりではなく、傾いていたり、横を向いていたりということもあります。棚SCAN-AIでは、複数の角度からの商品写真を格納しているデータベースと写真を照合し、スマホ等で撮影するだけで陳列状態をデータ化できるとされています。 小売業者にとっては、店舗・商品ごとの欠品状態を確認して機会損失を防ぐ、あるいは本部からの陳列指示がどれだけ実行できているかを確認するなどの活用方法が期待され、また、メーカーや卸売業者にとっては、自社商品と他社商品の陳列シェアを正確に把握できる、さらには陳列計画を小売店に提案するための根拠として使用できるなどの活用が見込まれます。 出典: サイバーリンクス「棚SCAN-AI」 AIだけでなく、様々な可能性を吟味する 小売業界、とくに実店舗においては、その物理的な特性から顧客データの取得が難しく、POSデータ・ID-POSデータの登場以来、大きなブレークスルーは起きていなかったと言えるかもしれません。ですが、AI技術の登場と進化によって、画像認識AIを活用した顧客行動の取得、あるいは、今回はご紹介していませんが、音声認識AIによる店頭の声の収拾、需給を勘案したダイナミックプライシング(動的価格表示)の導入、運搬トラックの配送ルートの最適化など、様々なイノベーティブなAI活用法が見出されつつあります。 とはいえ、それらの多くはまだ実験段階にあるものが多く、十分に成果を出すまでに機能しているとは言えない状況です。小売業界という物理的な現場を伴う特殊な業界でAIの導入を検討するためには、まず自社・自店舗の課題を正確に把握し、その課題の解決のためにAIを活用することが本当に適しているのか、現状の技術で実現可能な部分はないか、センサーシステムなどその他の技術との組み合わせは必要ないかなど、様々な可能性を吟味することが重要になってきます。 当社Laboro.AIでは、AIでビジネス課題を解決するための方法として、個社ごとにオーダーメイドさせていただく「カスタムAI」の開発を事業としています。汎用的なパッケージAIやAIプロダクトの導入では十分な課題解決に至らなかった場合などには、あらゆる可能性を検討する段階に入っていると思われます。こうした際には、ぜひ当社メンバーとのディスカッションにお声掛けください。
アバター
つなげ。保険、AI、インシュアテック 2021.8.29 概 要 保険業界にAI活用の大きな波が訪れています。例えば、ビッグデータ解析を基にした細かな保険商品の開発や、ユーザーの満足度向上の取り組み、また、保険業務に関わるバックオフィス業務をAIで自動化するなどの活用も広がっています。今回のコラムでは、保険とテクノロジーを組み合わせた「インシュアテック」、とりわけAIの活用についてご紹介します。 目 次 ・ 話題の「インシュアテック」とは ・ 保険になぜAIが使われるのか ・ インシュアテックによって保険業界はどう変わるのか  ・ 1人ひとりにパーソナライズ  ・ 保険契約がより簡単に  ・ より創造的な仕事に集中 ・ 保険AIが抱えるリスク  ・ パーソナライズされすぎて比較しにくくなる  ・ プロセスのブラックボックス化 ・ 「保険×AI」の活用事例  ・ オンデマンド損保  ・ 最適な保険の提案  ・ 画像アプローチからの手書き文字の読み取り ・ AIとビジネスをつなげ、インシュアテック 話題の「インシュアテック」とは インシュアテックとは、Insurance(保険)とTechnology(技術)をかけ合わせて作られた用語であり、さまざまな最新テクノロジーを駆使し、従来の保険の様式にとらわれず、新しい価値を提供していくことが目指されています。同様の用語としては、金融とテクノロジーを組み合わせた「フィンテック」がよく知られていますが、フィンテックでは、インシュアテックが話題になる前の早い段階からAIなどのテクノロジーの活用が進められてきました。 インシュアテックについては、保健事業へ参入するための規制の強さや、リスクを常に抱えるという不安要素があることによる資金調達の難しさなども手伝って導入が遅れ、テクノロジーの活用が難しい領域であるという認識を持つ方も少なくないはずです。ですが、近年はフィンテックで培われた革新的技術を活用しようという動きも追い風になり、インシュアテック領域でも活況さが見られるようにになってきました。 保険になぜAIが使われるのか インシュアテックで活用される幅広いITテクノロジーですが、中でも高い期待を寄せられているのがAI技術です。機械学習やその一種であるディープラーニング技術が発達したことにより、AIは、一定の機能に関しては、人間を超える処理能力を発揮するまでになってきています。 例えば、これまではなかったような新しい保険商品・サービスの開発、チャットボットの導入などによる従来サービスの改善、バックオフィス業務の自動化など、あらゆる面での活用が期待されています。 インシュアテックによって保険業界はどう変わるのか 動き出しを見せる保険業界のインシュアテックですが、今後活用が進むことで業界をどのように変化させていくのでしょうか。 1人ひとりにパーソナライズ これまでの保険商品は、極端に言えば、保険会社が作っている決められたプランからユーザーが希望に一番近いものを選ぶという形でした。これが、例えば、AIによってリスクを正確に予測できるようになる、あるいはユーザーの健康状態のデータを有効に活用できるようになれば、一人ひとりにパーソナライズされた保険商品開発の道が拓かれます。ユーザーの健康状態などによって保険料を変動させるといった展開も期待でき、より自分に合った保険に対して適正価格で加入したいと考えるユーザーにとっては、選択肢が増えることへとつながっていきます。 保険契約がより簡単に 従来の保険契約といえば、窓口に出向くなどでして検討し、担当者と話しながら保険内容を決めるといった流れが一般的でした。近年はネット保険が増えてより気軽に保険に加入できるようになってきています。契約内容の見直しをLINEで行えるような保険も登場しており、契約内容に関する手続きがより簡単に行えるようになってきています。 より創造的な仕事に集中 インシュアテックは、企業のバックオフィス業務の改善にも活用されており、さまざまな業務の効率化や自動化に用いられています。これまで多くの人員を割いていたバックオフィス業務にAIを活用し効率化・自動化が図られれば、人が本当に注力すべき創造的な仕事に取り組めるようになります。 保険業界のバックオフィス業務には、例えば保険料の査定や顧客情報の変更などの保全がありますが、保険料査定にAIを活用して人的要員は削減する、あるいは保全の業務にRPA(ロボディクス・プロセス・オートメーション)などの技術を用いて業務の一部を自動化するなどが考えられます。 保険AIが抱えるリスク AIを中心としたインシュアテックは、保険業界を良い方向に変える可能性を多く秘めていますが、一方でリスクも抱えています。導入を検討する際は、以下のようなリスクを念頭に置くことも必要です。 パーソナライズされすぎて比較しにくくなる 保険会社に蓄積された個人データや健康に関するデータなどを用いることで、パーソナライズされた保険商品を提供できる可能性がある一方、ユーザーにとってはどうパーソナライズされているのか分かりにくくなる可能性もあります。かえって複数の保険商品との比較が難しくなることも想像され、ユーザーにとって不利益になるリスクも懸念されます。 また、保険商品をパーソナライズするために用いるデータ情報の扱いに関しては、プライバシー保護や情報セキュリティの観点から、より慎重になる必要があることは言うまでもありません。 プロセスのブラックボックス化 AI、とくにディープラーニング技術の利用に際してよく言われることですが、保険料の査定などの意思決定を担わせた場合、その複雑な計算処理からプロセスがブラックボックス化し、「なぜその結果が導き出されたのか」が分からないというリスクが指摘されます。ディープラーニングは大量のデータを学習することを通して、人間でも発見が難しい規則性を抽出するなどのポテンシャルを持っていますが、文字通り何層にも渡る深い計算処理を伴うことから、なぜその結果を出力していたのかを完全には説明できないというデメリットがあります。 極端なケースではありますが、例えば、AIがデータを処理した結果、不当に高い保険料を請求してしまうケースが起こり得ることも否定できません。近年「説明可能なAI(XAI:Explainable AI)」も注目を集めていますが、導入したAIシステムの保守・チューニング・再学習などのメンテナンスを万全に行うことに加えて、その透明性を確保することが今後の課題として挙げられます。 「保険×AI」の活用事例 最後に保険業界でのAI活用の事例を3つご紹介します。 オンデマンド損保 AI技術の発達によって登場したのが、即座に、かつ短期で保険に加入できるオンデマンド損害保険です。オンデマンド損保を提供するサービスとしては、ITベンチャーのWarranteeが手掛ける「Warrantee Now」があります。Warrantee Nowは、あらかじめ所有している家電などの動産を登録しておき、必要なときにスマホから選択して1日単位で損害保険に加入できるというサービスです。例えば、旅行中に使用するデジタルカメラに旅行期間中だけ保険をかけるといった使い方が可能です。 基本的な仕組みはこれまでの動産保険と大きく変わりませんが、Warrantee Nowでは保証書をスマホで撮影することで文字を読み取り、データベース化する技術を導入しており、面倒な手続きや処理なしでリスクの計算および保険料の査定を行うことが可能になっています。 出典: 日経クロステック「AIとIoTで保険も進化」 最適な保険の提案 アメリカの保険会社の事例ですが、ユーザーに最適な保険をAIが提案する「Gabi」をご紹介します。 Gabiは、ユーザーが保険を見直したいと思ったときに、オンライン上で相談ができるサービスです。Gabiではビッグデータを用いて学習したAIがユーザーの質問に答え、現在入っている保険と主要な保険会社の保険商品を比較検討し、現時点で最も最適と考えられる商品を提案します。保険の見直し時に、資料を取り寄せたり保険知識を身につけたりする必要性もなくなり、ユーザーとしては気軽に見直しができるようになります。 出典: AIre VOICE「保険業界を変える注目のInsurTech(インシュアテック)スタートアップ6選」 画像アプローチからの手書き文字の読み取り こちらは当社Laboro.AIのプロジェクト事例です。ある大手生命保険会社では、生命保険の保険料請求の際に行う内容の精査、保険金額の算定、支払い可否の判断に膨大な人員と工数を要していました。これは保険金請求が基本的に紙ベースで行われるという文化が背景にあり、同社では、OCRによって文字をテキスト化しようと試みましたが、十分な結果は得られていませんでした。 そこで、手書き文字をテキスト化するのではなく、画像として認識し、その内容を社内の統一コードに変換するというカスタムAIを開発しました。これにより、必要なデータを高い精度で抽出できるようになり、作業員の工数の削減を実現しています。 この事例について詳しくは、以下のページに掲載しています。 Laboro.AI プロジェクト事例: 「画像アプローチからの手書き文字の読み取り」 AIとビジネスをつなげ、インシュアテック ご紹介してきたように、インシュアテックを活用した保険商品・サービス、導入事例は多数登場しており、スタートアップから中堅企業、大企業まで、さらには国内外で多種多様な取り組みが進められています。 とはいえ、制度や規制にまつわるテクノロジー利用の難しも背景に、そのリスクと導入ハードルは決して低いものではありません。インシュアテック、とくにAIの活用には専門技術をもったAIベンダーと共に進めていくことが主流ですが、単に技術知見を保有しているだけでなく、ことこの保険業界に関しては、業界知見も保有したベンダーと共に取り組んでいくことが重要です。 保険業界でAI活用に課題をお持ちの方は、「テクノロジーとビジネスを、つなぐ。」をミッションに掲げ、AI知見に加えてビジネス知見の蓄積にも強みを持つ当社に、ぜひご相談ください。
アバター
AIはトレンドか。アパレル業界のAI活用 2021.8.11 概 要 昨今の新型コロナウイルス感染拡大の煽りも受け、業界の主要な企業の多くが赤字になるなど、苦戦を強いられているアパレル業界。アパレル業界ではファッションアイテムのトレンドをつかめなくなってきているといった指摘もあり、打開策を見つけることは簡単ではなさそうです。そこで期待されているのが、AIをはじめとした最新テクノロジーの活用です。今回のコラムでは、アパレル業界における課題やAI活用事例をご紹介します。 目 次 ・ アパレル業界の課題  ・ 廃棄問題  ・ 人件費問題  ・ トレンド予想の難しさ ・ アパレル業界でのAI活用事例  ・ トレンド予測  ・ アパレルECサイトでのチャットボット導入  ・ AI骨格診断サービス  ・ 未来購買パターン予測にもとづく商品レコメンド ・ アパレルAIに「ソリューションデザイン」を アパレル業界の課題 アパレル業界が抱えているとされている課題について、改めて振り返っていきましょう。 廃棄問題 近年、国内のアパレル業界で大きな問題とされているのが、少子高齢化やライフスタイルの多様化、若年層の購買力低下などを背景とした、需要と供給が釣り合わないことによる廃棄問題です。大量に抱えることになった在庫商品をセール品として売り切るという手段も考えられますが、ブランド価値を大きく毀損する可能性もあるほか、持続性がある方法とは言えません。 そこで、アパレル業界で注目されているのがAIを活用した在庫管理システムの導入です。若年層向けのカジュアルファッションブランドを展開するストライプインターナショナルでは、2019年度の事業計画の柱として AIによるデータ分析の強化による仕入れ高の大幅削減(350億円削減)を掲げ、在庫最適化の検証を実施したところ、セールを含む値引き率が大幅に改善されたことが報告されています。このように今後、各社でAIによる発注の適正化、値引きの適正化など、仕入れ高の削減に向けた取り組みが進んでいくことが予想されます。 出典: テレ東プラス 「15億着の”売れ残り服” 多くが廃棄される現実…その衝撃の現場を取材!:ガイアの夜明け」 人件費問題 ファッションアイテムが売れない状態が続いた場合、経営を圧迫するのが人件費です。アパレル業界ではバブル崩壊後、多くの企業が生産拠点を海外に移し商品単価を下げる努力を行ってきた歴史があります。しかし、その一方で輸送費や販売費などがかさみ、その代償として人件費が犠牲にされてきた経緯もあり、現在でも人件費が大きな課題となっている企業が多いと言われています。 商品を売るためには当然ながら人材が必要ですが、人件費が低いと十分にスタッフを確保することもままなりません。アパレル業界の人件費にまつわる問題には、歴史的な背景も含めた多くの課題が複雑に絡み合っており、一筋縄では行かないのが現状です。 トレンド予想の難しさ アパレル業界特有の難しさとされるのが、プロダクトライフサイクルの短さであり、これは裏を返すと流行の移り変わりの速さと、トレンドをつかむことが年々難しくなっているということです。ある報告では、現代の若者が特定のブランドやショップにこだわらなくなってきたことがその背景にあり、どのブランドの服を着るかではなく、気に入った服をどうコーディネートするかという点を重視している傾向があるためだとも言われています。 出典: NISSEN DIGITAL HUB 「アパレル界でAIはどう活用できるのか【利益率が上がる理由とは】」 アパレル業界でのAI活用事例 アパレル業界の課題を解決する手段の1つとして期待されているのが、AIをはじめとした最新テクノロジーの活用です。とくにAIは人間では判断が難しいような直感的な意思決定や大幅な効率化に貢献するものとして、その活用が進められています。 トレンド予測 トレンドの予測で活用が期待されるのが、AIによる時系列データ分析です。トレンドとはすなわち、流行と次の流行が時間軸に沿ってに並んでいるもののため、それぞれの事象に関わるデータを数値的に把握することができれば、一定の規則性が抽出でき、将来予測ができることも期待できます。 また、画像認識・解析にAIを活用することで、次に売れる商品をAIに予測させるような取り組みも進んでいます。実際には学習データの収集や学習精度に難しさがあることも想像されますが、例えば、過去に売れたファッションアイテムの特徴や逆に売れなかったアイテムの特徴を学習し、次に売れるであろう商品のデザインを予測するといった活用方法が考えられます。 株式会社ニューロープが開発した「#CBK forcast(カブキフォーキャスト)」は、SNSやECサイト、各種メディアなどに掲載されているファッションスナップから、カテゴリー・色・柄・シルエット・素材など約600種類のタグと顔認識による性別・年齢などの推定情報をかけ合わせ、1,000万点以上のアイテムを分類・蓄積したデータからなるファッション特化型の画像認識AIです。 出典: NISSEN DIGITAL HUB 「アパレル界でAIはどう活用できるのか【利益率が上がる理由とは】」 出典: TECHABLE「ファッションアイテムのトレンド情報を時系列で分析する「#CBK forecast」」 アパレルECサイトでのチャットボット導入 多くの業界で導入が活発になっているのが、ECサイトへのチャットボットの導入です。規則的なパターンがある範囲に限られますが、自動応答を可能にするチャットボットは、電話などの問い合わせを面倒に思う若年層との顧客接点を作れることや、24時間対応ができるなどの利点があります。 アパレル業界で、ECサイトにチャットボットを導入して売上増加につながった事例としては、若者に人気のアパレル大手WEGO(ウィゴー)が、Microsoftが開発した女子高生チャットボット“りんな”を採用し、“女子高生りんながウィゴーでアルバイトしてみた”という設定でEC上に登場させ、顧客との会話の中で学習し成長していくAIチャットボットを導入しました。 出典: Microsoft「『女子高生AI りんな』をウィゴーがアルバイト採用、E コマースサイトでファッションアドバイスを提供」 AI骨格診断サービス 20代後半~30代前半の働く女性をターゲットとしているファッションブランド「Andemiu(アンデミュウ)」が2021年3月にリリースしたのが、生まれ持った体のラインの特徴や質感から自分に似合うファッションを見つける「AI骨格診断サービス」です。体のパーツ写真からその人の体型に合わせてAIが3つのタイプに分類し、その骨格タイプに似合う服を選ぶことで自分にぴったりのファッションを見つけられるというサービスとのことです。 出典: Andemiu「AI診断キャンペーン」 未来購買パターン予測にもとづく商品レコメンド こちらは当社の開発事例です。アパレル企業のECサイトでは、顧客が閲覧した商品履歴に基づいて商品レコメンドを表示する機能が一般的ですが、その機能を十分に活用できていないケースも多々あります。Laboro.AIでは、十分な量のデータを保有しながらも、それを活用しきれていないという大手ショッピングサイト様に対し、LSTMという自然言語処理で多く用いられる時系列を加味することを得意とするアルゴリズムを用いたレコメンドシステムを提案しました。 Laboro.AIが開発したこのカスタムAIでは、顧客がどの商品を見たかだけではなく、どの順番で見たか、先月は何を見て今月は何を見ているのかなどの情報も加味し、時系列で商品レコメンドを出すというもので、変化しやすいアパレルのトレンドに即したレコメンドを可能にしたものです。 この事例について詳しくは、以下の事例ページをご覧ください。 参考: 未来購買パターン予測にもとづく商品レコメンド アパレルAIに「ソリューションデザイン」を 上記のような従来からある課題に加えて、冒頭にも触れましたが、近年は新型コロナウイルスによる消費スタイルや買い物スタイルの変化も、アパレル業界に大きな打撃を与えています。また、「メルカリ」や「ラクマ」といった個人間で商品の売買が完結するCtoC市場の台頭が、従来のBtoC型のアパレルビジネスに与えている影響も少なくありません。 AIはあくまでツールとしての技術に過ぎず、根本的にはビジネスモデルや店舗運用の見直しを前提として考える必要があります。私たちLaboro.AIでは、AI技術開発に加え、ビジネスデザインまでを含めた概念を「ソリューションデザイン」と呼んでいますが、外部環境が大きく変化し、半ば強制的に転換期を迎えることとなったアパレル業界とっては、AIという技術そのものを単に導入するだけではなく、このソリューションデザインの視点がとくに重要になっていると考えられます。
アバター
その課題はやはり過大。見えてきた、介護AIの可能性 2021.5.13 概 要 高齢者をはじめ、私たち国民を支える重要な役割をもつ介護業界は、少子高齢化やそれにともなう社会保障費の負担の増加、介護難民の増加など、さまざまな問題を抱えています。こうした課題を解決するために、AIというテクノロジーはどのように力を発揮することができるのでしょうか。今回のコラムでは、介護業界が直面する課題、そしてAI活用の動き、また実際のAI導入事例をご紹介していきます。 目 次 ・ 介護業界が抱える課題  ・ 介護難民の増加  ・ 2025年問題  ・ 平均寿命の上昇 ・ 介護業界でのAI活用の動き  ・ 施設入居者の観察  ・ 情報のデータ共有  ・ データに基づいた介護 ・ 介護業界でのAI導入5事例  ・ 介護送迎サービス支援  ・ 行動モニタリング  ・ ケアプラン作成支援  ・ 介護リフォームの設計支援  ・ AI搭載の自立走行ロボットの活用 ・ 介護現場ごとのAI導入設計 介護業界が抱える課題 介護業界に直接的に関係する社会課題として、大きく3つが挙げられます。 介護難民の増加 介護を必要としている要介護状態であるにも関わらず、十分な介護を受けることができていない「介護難民」は、年々増加し続けていると言われています。とくに、75歳以上の後期高齢者の急増が見込まれる東京、神奈川、埼玉、千葉の4都県を含む東京圏での増加が深刻で、これは高度経済成長期に職を求めて地方から東京圏に集まった多くの方々の高齢化が背景として考えられています。 一方、地方地域については余力のある介護施設が多く存在しているとも言われており、今後、介護難民の数はとくに東京圏で大きな課題となっていくことが想定されます。 2025年問題 介護にまつわる問題として指摘されるのが、多くの人口が含まれる団塊の世代が75歳以上を迎える2025年問題です。日本経済の成長を支えてきた団塊の世代が75歳以上となる2025年以降、社会保障関連費用の負担増加や介護人材の不足が一気に加速すると言われています。 実際、65歳以上の高齢者の人口割合は、2015年に26.6%だったものが2025年には30.0%に、75歳以上の人口割合は12.8%から17.8%にまで増加すると予想されています。その一方で、少子化を背景にして、高齢者を支える生産人口は減少していくことから、その役割を担う介護業界の存在がますます重要になっていくものと考えられています。 平均寿命の上昇 長寿大国の日本では、医療の発達や栄養・衛生環境の改善などを背景に、平均寿命は年々上昇しています。喜ばしい反面、単に年齢の長さを指す「寿命」と健康な状態を保った上での「健康寿命」とには大きな違いがあります。健康かつ長寿であることを目指すためには、医療はもちろんのこと介護業界に求められる役割が今後増していくことが考えられます。 出典: みんなの介護『【超高齢社会】介護業界が抱える問題に迫る(人手不足・介護難民・虐待)』 出典: 内閣府『人口急減・超高齢化の問題点』 介護業界でのAI活用の動き 今後大きな課題に直面することが見込まれる介護業界ですが、そうした課題をAIを活用することによって解決しようとする動きが見られます。AIは、従来のIT技術では対応が難しかった大量のデータを処理できるほか、それらのデータの中から共通する特徴を抽出することなどを得意とすることなどから、様々な活用の可能性が期待されています。 施設入居者の観察 介護施設では、施設入居者の状態を常時把握できていることが望ましいものの、介護スタッフのリソースには限界があります。そこで、センサーと連携したAIシステムを用いることで、入居者の体温や心拍数、位置情報などを常に把握するような取り組みが行われています。 入居施設のさまざまな箇所にIoTのセンサーを設置することで、施設入居者の起床やトイレのタイミング、食事の量、転倒など、こうした情報を24時間に渡って把握していくような活用が期待されます。 情報のデータ共有 厳密にはAIの領域ではありませんが、AIを導入する前提として各種の情報をデータとして整備・管理することが伴って必要になります。施設入居者の体調、食事の摂取量、行動情報など、こうした情報は通常、少人数の介護スタッフによる観察のみで把握することには限界がありますが、一定のルールに基づいたシステムとして蓄積していくことで、施設入居者に関わるあらゆる情報をスタッフ間で共有し、客観的に把握できるようになることが期待できます。 データに基づいた介護 施設入居者に関する情報をもとにした介護プランの予測・設計も、AIの活用が期待される分野です。最適な介護プランを提案することがAIによって実現できれば、介護スタッフは介護業務そのものに集中できるようになります。介護スタッフの負担軽減はもちろんのこと、介護の質が向上することで、入居者や家族の満足度向上にもつながることが期待されます。 介護業界でのAI導入5事例 ここからは、実際に介護の現場に導入され、高い効果を生み出すことが期待されているAI導入事例を5つご紹介します。 介護送迎サービス支援 まずは、パナソニックカーエレクトロニクスが開発した業務用車両管理システム「DRIVEBOSS」を介護送迎サービスに応用した事例です。このケースでは、施設利用者の情報を考慮し、効率の良い送迎ルートを作成することを実現しています。介護施設の送迎では、利用者の車椅子利用の有無、直前連絡の要不要、車の乗降に要する時間、座席の配置、施設からの距離などさまざまなことを考慮して送迎計画を立てる必要があります。このような複雑な情報を元にしたルート予測をAIが代行することで、送迎にかかるスタッフの負担軽減につながることも目指されています。 また、DRIVEBOSSには事故抑制の機能もあり、急加速や急停止、速度超過に対してアラートを出すといった機能も備わっています。運転の良し悪しはログによって評価されるため、ドライバーの安全意識の向上につなげることも期待されます。 出典: Panasonic『DRIVEBOSS送迎支援サービス』 行動モニタリング 介護総合支援事業を展開しているインフィックと、IT技術を用いて介護事業者・入居者・家族の3者間のコミュニケーションを円滑化する事業も行う凸版印刷により開発されたのが、この事業のコアシステムとして使用される「LASHIC+(ラシクプラス)」です。 LASHIC+は、入居者のプライバシーを侵害しない程度の簡易センサーにより温度や人感等を取得し、AIにより取得した情報を解析する機能を備えています。これにより入居者の行動をモニタリングしたり、普段と違った行動があった場合にアラートを出すなどの活用が行われています。 出典: PR TIMES『凸版印刷とインフィック、センシング×AIで介護業務を支援』 ケアプラン作成支援 シーディーアイによるAIケアマネジメントサービス「SOIN(そわん)」は、ケアマネージャーのケアプラン作成を支援するシステムです。ケアマネージャーが必要な情報をSOINに入力すると、SOINは多くのケアマネージャーによる膨大な実績から介護対象者の状態が改善する可能性の高いケアプランを提案する仕組みになっています。この提案結果にケアマネージャー自身が築いてきた経験を重ねれば、より介護対象者や家族に対してより説得力のあるケアプランを提示できるようになることも見込まれます。 出典: @Press『在宅ケアマネジメント基本システム(AI)をリリース  AIケアプラン実装による適切なプラン作成の支援と 業務効率化をサポート』 介護リフォームの設計支援 介護リフォーム工事を手がけるユニバーサルスペースでは、介護用にリフォームしたい現場写真をもとに設計支援を行うAIアプリシステムのテスト運用を行なっています。専用のタブレット端末でリフォーム対象の箇所を撮影することで自動採寸ができ、その情報を元に適切な部材の選択を支援するなどの仕組みが備わっています。このアプリシステムにより、これまで1カ月以上かかっていた工事期間を約2週間に短縮でき、大幅な効率化を実現したとのことです。 出典: @Press「業界初!介護リフォームの見積作成AIアプリを開発  創業10年を迎え事業の加速と年内にFC加盟100店舗を目指す」 AI搭載の自立走行ロボットの活用 Aeolus Robotics Corporationが開発した「アイオロス・ロボット」は、周囲の環境を認識、学習できるAIビジョンセンサを搭載し、2本のアームで物を掴むことも可能な自立走行ロボットです。機械学習技術により周囲の環境を学習すると同時に、学習内容をクラウド上で複数のロボットが共有してフィードバックを繰り返すことで、日々変化する環境にも適応できるといいます。介護現場におけるアイオロス・ロボットの具体的な役割としては、人物を特定してあいさつする見守り、高齢者の転倒などを知らせる緊急対応、日用品や食事、洗濯物等の運搬などが想定されています。 AI搭載ロボットの導入はまだ課題が多いのが現状ですが、介護スタッフの身体的な負担を軽減することはもちろん、高齢者との会話や心のケアといった業務に割く時間の増加にも期待が寄せられます。 出典: PRTIMES「介護現場でのAI搭載型ロボットの実用化に向けオリックス・リビングとAeolus Roboticsがコンサルティング契約を締結」 介護現場ごとのAI導入設計 これまでITなどのデジタル技術が入り込み難かった介護現場ですが、介護対象者の体調や状態など、データとして蓄積できる情報も多く存在しています。こうした物理現場での情報取得や解析はAIの活用が期待される分野だと言えます。 ただし、介護サービスや施設によって方針や必要な解決策が異なるため、一律にAIソリューションを導入できるものでもなく、ビジネス課題の見極めを行った上で、自社に適したAIの設計を行うことが重要になってくるはずです。また施設や企業側だけでなく、利用者やご家族からもAI技術利用に対する理解を得ることも必要になることが想定されます。様々なステークホルダーとの関係を考慮し、運用も含めた上で、導入設計を考えていくことが、介護業界でのAI導入にはとくに大切なポイントになってくると考えられます。
アバター
守れ、農業。AIが描く第一次産業の進化像 2021.4.27 概 要 日本の第一の産業、その一つが農業です。農業を始めとするレガシー産業は、AIとの相性が良いと言われていますが、農業には従事者の高齢化や新規就農者の不足などの慢性的な課題があることも事実です。 様々な分野での活用が進み、新たな市場価値を生み出すテクノロジーとして期待されるAIは、これらの課題を解決できるのでしょうか。今回のコラムでは農業における課題を見た上で、今まさに進化するAIの農業分野への活用事例を見ていきます。 目 次 ・ 農業が抱える課題  ・ 農業従事者の平均年齢  ・ 新規就農者の不足と低定着率 ・ AI・IoTが見せる、農業テクノロジーの進化7事例  ・ ドローンを用いた圃場の監視や新人育成  ・ AIライブラリを用いたキュウリの自動選果  ・ AIを活用した水やり技術の習得  ・ トマトの画像物体検出【Laboro.AI事例】  ・ AI搭載 自動収穫ロボット  ・ AI病虫害画像診断システム  ・ 稲作でのAI活用 ・ 人とAIの挑戦は、まだまだ続く 農業が抱える課題 日本の農業では、現在、主に以下のような課題があると言われています。根本的な解決には難しもある状況ではありますが、AIを活用することにより少しでも改善に近づけるような努力が進められています。 農業従事者の平均年齢 自営で農業に従事している方の数を表す「農業就業人口」。このうちとくに農業に従事する割合が多い農業者を「基幹的農業従事者」と呼びます。まさに日本の農業を支える基幹的農業従事者ですが、その数は2015年の約175万人から2020年には約136万人という非常に早いペースで減少していることが報告されています。また、高齢化も言われており、基幹的農業従事者のうち、65歳以上が占める割合は2015年の64.9%から2020年には69.8%に増加しています。 従事者の数が減少しているだけでなく、さらに平均年齢も上がるということは、より若い従事者の減少ペースが深刻であることが見えてきます。 出典: 農林水産省『2020年農林業センサス結果の概要(概数値)』 新規就農者の不足と低定着率 農業の若さに直結する新規就農者の数は、2007年には約73,460人がいた一方、2018年は約55,810人に減少したことが報告されています。もちろん年によって増減はありますが、傾向としては減少の方向を向いている状況です。 一方で、法人運営による農業経営体の数は増加傾向にあります。しかし、個人・法人問わず、やはり農業従事者の数は足りておらず、新たな担い手の確保が業界全体の課題となっていることは間違いありません。 さらに課題となっているのが、新規就農者の定着率の低さです。ある報告では、新規就農者の10%前後が5年以内に離農しているとも言われています。若い農業従事者を確保することだけでなく、それらの方々が安心して農業を営み、充実した生活を送っていけるよう、国や地方自治体、農協を始めとした様々な団体が各種のサポート体制や経済的施策の整備を進めています。 出典: 農林水産省『新規就農者調査』確報 – PDF – 平成30年 、 やまがたアグリネット『農業の担い手の現状と課題』 AI・IoTが見せる、農業テクノロジーの進化7事例 残念ながら、産業全体の人口が減るといったこうした大きな課題には、どれだけ新しく優れたテクノロジーであっても、それを導入するだけで根本的な解決につながることはありません。しかしながら、AIやIoT技術を保有する様々なプレイヤーが国の一次産業である農業を支援するために一役買おうと、多くのソリューションの開発を進めています。 ドローンを用いた圃場の監視や新人育成 ベンチャー企業と米農家とが組んで進められたスマート米栽培の取組みでは、人間の目の代わりとしてドローンを活用する試みが進められています。ドローンが圃場上空を飛び、農作物の状態を監視することで、これまで人の経験や勘に頼らざるを得なかった作業を機械に代替させるプロジェクトです。 とくにこの取り組みで今後の成果が期待されているのが、農薬散布の場所やタイミングに関わる領域です。米の栽培には害虫駆除のための農薬散布が欠かせませんが、田んぼが広くなればなるほど、人の目で害虫の発生を監視することが難しくなります。一斉に農薬散布を行えば作業的には簡単ではあるものの、環境保全や衛生面の観点から懸念があります。そこでドローンを活用し、圃場を俯瞰的に監視、害虫が発生した際に素早く発見して農薬を散布するべき場所を特定することが可能になります。人の目による監視の手間が大きく省けるだけでなく、農薬の散布量も最小限で済み、害虫の被害も抑える効果が期待されています。 ドローンの活用は、新規就農者の育成にもその効果が期待されています。ベテランの農業従事者であれば豊富な経験により効率良く農作業を進めることができますが、それを新規就農者にノウハウとして伝えるには難しい面があります。一方、客観的なデータに基づいて動作するドローンであれば、新規就農者にも理由が分かりやすく、視覚的・客観的にそのノウハウを伝授することが可能になってきます。 出典: SMART AGRI『「スマート米栽培」を初めて実施した農家に聞くAI×ドローンのメリット』 ※画像はイメージであり、実際の写真ではありません。 AIライブラリを用いたキュウリの自動選果 農業のあらゆる作業の中でも、多くの時間を要しベテランの知見が必要となるのが収穫や選果です。その難易度は農作物にもよりますが、収穫・選果は、高齢の農業従事者にとっては負担が大きく、また新規就農者にとっては難しく、技術伝承や人材確保を妨げる要因の1つだとも考えられます。 選果の難しい農作物の一つがキュウリです。キュウリは品質や傷の具合などで9つの等級に選別する必要があり、この作業をAIで行おうという試みが進められています。この農家では、ご自身が元システムエンジニアであるスキルを活かし、Googleが公開しているAIライブラリ「Tensor Flow」を用いて選別機を開発しています。等級ごとのキュウリの画像を計1万枚、ディープラーニングで学習させ、機械によるキュウリの選別をベテランの域にまで引き上げることが目指されています。 出典: SMART AGRI『農家がグーグルのAIエンジン「Tensor Flow」でキュウリの自動選果を実現』 ※画像はイメージであり、実際の写真ではありません。 AIを活用した水やり技術の習得 トマトは、水やりが難しい農作物の1つです。水を少なくして過酷な環境に置くことで甘く美味しくなる一方、少なすぎると枯れてしまうため、給液(水やり)の量とタイミングはまさにベテランの技と言えます。 AIとIoTを組み合わせたシステムで給液のタイミングを学習しようというこの取組みでは、トマト農家のベテラン農業者が葉のしおれ具合を見て給液のタイミングを判断しているところに目をつけ、葉の状態を撮影し、ディープラーニング技術を活用してしおれ具合を特定するための技術を開発しています。 出典: 科学技術振興機構『多様な環境に自律順応できる水分ストレス高精度予測基盤技術の確立』 トマトの画像物体検出【Laboro.AI事例】 Laboro.AIも微力ながら、AIを用いた農業分野での取り組みを支援させていただくべく、トマトの画像検出用データセット「Laboro Tomato」を作成・公開しています。 Laboro Tomatoは、トマトそのものの検出に加え、成熟度判定に利用できる画像データセットです。インスタンスセグメンテーションと呼ばれる高度なAI物体検出技術での利用を想定しており、成熟度を元にした収穫予測、自動収穫、劣化したトマトの間引き、特定の成熟期のトマト群への農薬散布、成熟具合に応じた温度調整、収穫したトマトの品質管理などのシステムへの利用を見込んでいます。 参考: トマト画像物体検出データセット『Laboro Tomato』を公開 AI搭載 自動収穫ロボット 移動・探索・収穫という一連の収穫作業を自動で行うことができるロボット「ihano」は、画像認識技術を用いて作物の選定を自動で行い、医療用ロボットアームをカスタマイズした手を用いて収穫作業を行います。1回2時間の充電で最大10時間連続駆動ができ、アプリによる遠隔操作も可能なため、収穫作業の負担を大きく減少させることが期待されています。 出典: ロボスタ『自動野菜収穫ロボットが日本の農業の課題を解決!inahoが3種の実証事業・補助金プロジェクトに採択』 AI病虫害画像診断システム 農作物の病気や害虫の予防は、農作業の中でも重要な対策ポイントですが、高齢化による熟練者の減少や高度な専門性を必要とする側面があり、知識や技術の継承が難しいとされていました。 農研機構・法政大学・ノーザンシステムサービスが共同して開発した「AI病虫害画像判別WAGRI-API」は、農業関係のデータが蓄積されたプラットフォーム「WAGRI」を基盤としており、ユーザーが送った現場の病害画像を、大量の病害画像を学習させた画像AIが自動診断するというシステムです。 経験の浅い新規就農者の育成はもちろん、これまで病害が発生していなかった地域でありながら、温暖化などの環境変化によって初めて病害虫が発生した際の対策を迅速にできるようにすることが期待されています。 出典: SMART AGRI『高精度のAI病虫害画像診断システムが「WAGRI」で提供開始』 ※画像はイメージであり、実際の写真ではありません。 稲作でのAI活用 稲作でもAIの活用が進んでおり、効率化や品質向上、人員不足対策に貢献しています。田植え作業の機械化はすでに実現していますが、従来の耕作機は人が押して歩いたり、機械に乗って操作する必要がありました。「無人田植え機GO安曇野」は、衛星利用測位システム(GPS)を使用しており、水田の位置や広さを登録するとAIが苗の間隔や量などを自動計算し、田植えを行います。 そのほか、スマートフォンなどのカメラで撮影した田んぼの画像をAIが自動で判断し、肥料を与える適切な時期を提案「水稲AI生育診断ソリューション」なども登場しています。 出典: 中日新聞『AIが自動計算、無人田植え機GO 安曇野、若手農家ら実演』 、 株式会社NTTデータCSS『ソリューション&プロダクト 水稲AI画像解析ソリューション』 人とAIの挑戦は、まだまだ続く 前述のような産業全体の課題を、わずか一つのテクノロジーが解決するようなことは現実的ではありません。AIが効果をもたらす領域は部分的であり、その市場もまだまだ小さく、現段階で広く農業者に使ってもらえるようなパッケージ商品も出回っていないのが現状です。 ですが、部分的ではあるものの、AIを搭載した様々なソリューションやサービスが確かに開発され、少しずつ人を補うようなケースが生まれてきています。農業従事者の目線に立ち、いかにAIというテクノロジーを用い、農業という産業を守っていくか、人とAIの挑戦はこれからも続いていきます。
アバター
変わる建設、変えるAI。建設DXの今とこれから 2021.4.14 概 要 機械学習やディープラーニングの技術進化により、第3次AIブームが到来していると言われています。一方で、AIとの親和性があり高いレベルで導入が進んでいる業種もあれば、現場レベルではまだほとんど浸透していない業種もあるのが実際です。建設業界では現在、大手ゼネコンなど一部企業によるAI投資が進められている段階であり、今後、AIによる業務改善や品質向上など、建設現場へのプラスの効果が期待されています。 今回のコラムでは、建設業界ならではの課題や今後の動向、実際の活用事例についてご紹介していきます。 目 次 ・ 建設業界の現状課題  ・ 人手不足  ・ 安全優先の現場、作業の非効率化 ・ 建設業界のAI活用の現状と今後の動向 ・ 国土交通省「i-Construction」 ・ 建設業界でのAI活用4事例  ・ 建設物の制振制御【Laboro.AI】  ・ インフラ設備の劣化箇所検出【Laboro.AI】  ・ 品質や安全に関する作業リスクをAIで管理  ・ 建設現場での意思決定支援 ・ 変わる建設、変えるAI 建設業界の現状課題 大手企業によるAI導入が促進される建設業界ですが、その背景として建設業界ならではの次のような課題があると言われています。 人手不足 少子高齢化が進む中、あらゆる業種で人手不足が叫ばれていますが、建築業界も例外ではありません。建築業界における従事者の数は減少傾向にあり、ピークだった1997年に比べると2019年の従事者の数は約27%も減少していることがわかっています。 建築業界は、時代によってインフラ整備の需要が大きく左右される業種のため、従事者が減っていることがすぐさま問題にはなりません。ですが、東京オリンピックや東日本大震災の復興という大きな需要がある中でも増加していないことをも考えると、この課題は深刻です。 さらに、従事者の高齢化も問題になっています。20代の従事者が約33.1万人である一方、65歳以上の従事者は40万人を上回っており、若者の定着に課題があることも建設業界の特徴だと言えます。 こうした人手に関わる課題の解決策として期待されているのが、AIを含む先端テクノロジーの活用です。効率化を妨げる単純作業をAIが肩代わりする、あるいは整備箇所の判断をAIに行わせることでベテランと新人の差を埋めるといった対策としてその効果が期待されています。 (出典: 国土交通省『建設業界の現状とこれまでの取組』 、 建設会計ラボ『建設業界の現状~今後の鍵はICT化~』 ) 安全優先の現場、作業の非効率化 危険と隣り合わせの状況が少なくない建設現場では、当然ながら安全が最優先されるため、そのためには効率を犠牲にせざるを得ない側面もあり、作業の効率化がなかなか進められにくいことも特徴として挙げられます。 そこで期待されているのがAI技術を搭載したロボットの導入です。建築業界では建設用ロボットの導入が積極的に行われていますが、危険な作業のロボットによる肩代わりや、人の作業工程の短縮による全体の効率化などが期待されています。 建設業界のAI活用の現状と今後の動向 建築業界では、大手ゼネコンをはじめとする大手企業によるAI技術の開発・導入が中心に進められています。現時点では研究開発段階のものも多く、実用レベルで現場活用されているAIシステムはまだまだ少ないのが現状ですが、今後はAIによる業務効率化や品質向上に大きな期待がかけられています。 AIが得意とするタスクには、膨大なデータの処理や単純作業の高速化の他、大量のデータを学習することによる予測とより良い結果を導き出すための推論が挙げられます。こうしたAIの得意領域は、経験則に裏付けされたベテランの知見が重要になる業種との親和性が高いと言われています。建設業界も深いノウハウと多様な経験を持ったベテランの判断が多く求められる業種であり、AIによる効果が発揮されやすい分野だと考えられます。 国土交通省「i-Construction」 国土交通省は2017年、「第4期国土交通省技術基本計画」を発表し、人を主役としてIoT、AI、ビッグデータを活用していくことを打ち出しています。これら3つのテクノロジーは、互いに連携することで大きな効果を発揮するものであり、国のバックアップをベースにしたこれら技術の活用に注目が集まっています。 さらに、国土交通省では「i-Construction」と称し、建設現場の生産性を2025年までに20%増加させることを目標として掲げています。これは、測量・設計・施工・検査・維持管理といった建設におけるすべての業務フローにおいてICT技術を導入し工程全体の生産性向上を目指すものですが、ここで言及されているICT技術には、IoT・AI・ビッグデータの活用が含まれているものと捉えることができます。 建設業界でのAI活用4事例 最後に当社事例も含めて、建設業界でのAI活用事例を4つご紹介します。 建設物の制振制御【Laboro.AI】 Laboro.AIでは、大林組との研究開発プロジェクトとして、建設物の制振制御を行うカスタムAIを開発しました。 制振技術とは、建物を揺れから保護するための手法の1つで、建物内に設置したマスダンパーなどの機構を建物が受けた振動状態に合わせて動かすことにより、揺れを相殺する技術です。制振技術の中でも、振動を電子的に検知し、マスダンパーをコンピューター制御によって能動的に動かすAMD(アクティブ制振)という技術にAIを活用したのが今回の事例です。 このカスタムAIには、コンピュータがより良い制御則を試行錯誤を通して探索していく強化学習という手法が用いられ、従来手法よりも効果的に揺れを抑えることに成功しています。このAIによる制振制御は、建設物の揺れの制御だけでなく、自動車や公共交通機関の揺れの軽減、精密機械の製造時の揺れの軽減などにも応用されることを当社では見込んでいます。 (参考: プロジェクト事例『 建設物の制振制御』 ) インフラ設備の劣化箇所検出【Laboro.AI】 AIの画像認識技術を用いた劣化・損傷箇所の検出は、今ではそれほど珍しくなくなってはきましたが、当社でも取り組みを行なっています。 ある大手インフラ企業では、それまでインフラ設備の劣化箇所の検出を目視で行い、保守へつなげるかどうかの判断も人手によって行われていました。そこで、ディープラーニングによる画像認識技術を用い、画像内から劣化箇所とその内容の判定をコンピュータが行えるようなカスタムAIの開発を実施しています。 (参考: プロジェクト事例『インフラ設備の劣化箇所検出』 ) 品質や安全に関する作業リスクをAIで管理 AIの開発などをうオートデスクでは、建設現場における品質や安全を管理できるAIシステム「Construction IQ」を提供しています。Construction IQは、建設現場の担当者が作業内容を入力することで、遅延が発生しやすい作業や事故・ミスの起きやすい作業、安全性や品質を確保するための項目をAIが表示するというシステムです。これにより事故の発生や手戻りなどを防ぐだけでなく、作業後の報告によりAIがさらに学習を重ねていくという仕組みになっています。 (出典: 日経クロステック『「違反常習者」を見逃すな!施工ミスや作業遅れをAIで防ぐ』 ) 建設現場での意思決定支援 竹中工務店では、単純作業を高速化し、浮いた工数を創造的な業務に当ててワークライフバランスをも改善するための3つのAIとして、「リサーチAI」「構造計画AI」「部材設計AI」を開発しています。 このうちリサーチAIは、過去の膨大な設計データを整理し、必要なときに必要なデータを取り出せるようにしたAIです。現在進行中の建設現場で参考にできる事例や設計データなどを簡単に引き出すことができるため、経験の少ない設計者でも有用な情報にすぐさまアクセスできるように構成されています。また、残り2つのAIも人と協働し、人の仕事をより高めるためのシステムとして開発されており、これまでは実現できなかった構造設計フローの実現が目指されています。 (出典: 日経クロステック『あの超⾼層を⼿掛けた構造設計のエースが開発中、⽵中⼯務店の「使えるAI」』 ) 変わる建設、変えるAI 建設業界では、大手建設会社や建築メーカーを中心にAIの研究・開発・運用が次々と進められ、建設DX時代に突入しています。今後、単純作業の高速化や安全性の確保、複雑な構造設計における意思決定支援など、より多くの現場タスクに対するAIの活用が進むにつれ、人材不足をはじめとする業界特有の課題解決に寄与することが期待されます。 Laboro.AIでは、上記事例をはじめ、これまで多くの建設系企業とのプロジェクトを推進しています。AI導入、ビジネス課題解決をご検討の際は、ぜひご相談ください。
アバター
プロボノ活動『Laboro ProBono』支援先募集について 2021.4.1 概 要 株式会社Laboro.AIは、 当社が保有するAI導入やAI開発に関する専門知識・スキルを、社会貢献を目指す各種活動に活用いただくことを目的に、そのノウハウを無償で提供させていただくプロボノ(ボランティア)活動を実施し、その支援先として1事業者を募集いたします。 当社ではミッションの一つとして、“すべての産業の新たな姿をつくる”を掲げています。今般のプロボノ活動は、著しい技術進化を背景にその社会応用が期待されるAI技術や導入ノウハウを、より豊かな社会の姿をつくるため奔走する方々に無償で提供し、それら方々の社会課題の解決に向けた活動を支援するために実施するものです。 支援内容としては、AI導入や開発に関するコンサルティング、AIモデル開発に関するアドバイス、PoC(概念実証)の実施などを想定しています。また支援先は、応募内容をもとに社会的意義や実現可能性などの観点から選考し決定いたします。 (応募締切:2021年4月30日(金) ※受付は終了いたしました。) 目 次 ・ プロボノ活動の実施について ・ 募集要項  ・ 支援対象  ・ 支援内容  ・ 募集・実施スケジュール  ・ 応募方法  ・ 採択基準について  ・ その他、留意点・注意点  ・ プロボノ活動に関するお問い合わせ先 プロボノ活動の実施について AI技術は2010年代のディープラーニング技術の開花を契機に、多くの産業での活用が見られるようになりました。しかし、その活用は特定の企業や一部のシーンに限られているのが現状です。新型コロナウイルス(COVID-19)の感染拡大等により私たちの生活に大きな変化が迫っていることも背景として、AIという未来につながる可能性を持った技術を社会課題の解決や社会貢献のために用い、より豊かな社会の創造に向け取り組んでいくことが必要になっています。 当社では、“すべての産業の新たな姿をつくる”をミッションの一つとして掲げ、オーダーメイド型AIソリューション『カスタムAI』の開発・導入およびコンサルティング事業を展開し、AI技術に関する高い専門性を強みに、これまで多くのリーディングカンパニーのAI開発・導入プロジェクトを支援してまいりました。そこで、上記の課題感に対して当社ができる社会貢献活動の一つの形として、国内の事業者を対象としたプロボノ活動を実施することを決定いたしました。 「プロボノ(pro bono)」とは、ラテン語で「公共善のために」を意味するpro bono publicoの略で、各分野の専門家が保有する知識・スキルを公共のために無報酬で提供するボランティア事業を言います。当社が実施するプロボノ活動では、当社が保有するAI技術に関する知識、スキルおよび専門人材といった当社資源を、公益のために活動する団体や事業者に無償で提供させていただき、より豊かな社会の創造に貢献することを目的とするものです。 そして今般、AIの活用によって解決し得る課題をお持ちの法人・自治体・事業所・NPO等を対象に、支援先となっていただける団体を募集いたします。本活動の支援内容としては、AI導入や開発に関するコンサルティング、AIモデル開発に関するアドバイス、PoC(概念実証)の実施などを想定しており、腰を据えた支援をさせていただくために1事業者限定で実施いたします。なお、支援先の選定にあたっては、応募フォームもしくはメールにて必要事項を記入・送付いただいた上、社会的意義や実現可能性などの観点から当社にて内容を選定し、1事業者を採択することといたします。 募集要項 今般のプロボノ活動の募集内容、応募方法、実施スケジュール等は、以下の通りです。 (※受付は終了いたしました。) 支援対象 国内に拠点を置く企業、事業所、自治体、NPO等 (1事業者限定) ※以下の場合については支援先として対象外とさせていただきます。 ・個人および個人名義による応募 ・同一氏名による複数応募(いずれの応募も対象外とさせていただきます。) ・事業内容および応募内容が公序良俗に反すると当社が判断したもの ・その他理由により、当社が支援先として相応しくないと判断したもの 支援内容 AI導入やAI開発に関する各種支援 ※後述のプロジェクト実施時期の範囲内で完了できる内容を限度として支援を実施させていただきます。 支援内容の例 ・企業や自治体におけるAI活用に関するコンサルティング ・開発中のAIモデルに対する技術的アドバイス ・AI導入のためのPoC(概念実証)の実施 等 募集・実施スケジュール ・募集・応募期間      :2021年 4月1日(木)〜4月30日(金) ・支援先の決定・通知    :2021年 5月下旬 ・支援プロジェクト実施時期 :2021年 6月以降 ※プロジェクト実施時期・期間は、支援内容によって変動・短縮・延長する場合がございます。 ※支援先としての採択・不採択の結果は、メールもしくはお電話にてお知らせいたします。 応募方法 以下の応募フォームもしくは応募用紙に必要事項を記入の上、期日までに当社宛にご送付ください。 応募フォームの場合 ※受付は終了いたしました。 メール送付の場合 ※受付は終了いたしました。 応募〆切 2021年 4月30日(金)応募フォームもしくはメール必着 採択基準について 腰を据えた支援を実施させていただくため、支援先は1事業者限定とさせていただきます。支援先は、応募いただい内容をもとに以下の基準に基づいて当社にて選定し、支援先を決定させていただきます。 社会的意義 ・社会に対する貢献やメリットが期待できる内容であること ・社会における課題解決が期待できる内容であること 健全性 ・他の事業者のビジネスや事業内容を著しく脅かす可能性がないこと ・各種法令や公序良俗に反しないこと ・社会および当活動の関係者が被害を被る可能性がある事項を含まないこと 実現可能性 ・当社が保有する技術、スキル、ノウハウで実施可能な内容であること ・通例を超えた多大な費用がかかる内容ではないこと その他 ・当プロジェクトに関する情報発信にご協力いただけること ・上記以外について、当社にとって不適切と判断される事項がないこと その他、留意点・注意点 ・募集期間を通じて応募数や応募内容が要件に満たない場合、本活動を取り止める場合がございます。 ・当プロボノ活動中に実施する内容について費用は一切発生致しません。但し、活動期間を越えてプロジェクト継続をご希望される場合、費用等について別途協議の上、継続を決定させていただきます。 ・当社による採択結果に関するお問い合わせにはお応え致しかねます。 ・応募に際して頂戴した情報は本活動以外で用いることはございません。但し、ご承諾いただけた場合に限って、当社からの各種お知らせやイベント案内等のご連絡をさせていただくことがございます。 プロボノ活動に関するお問い合わせ先 株式会社Laboro.AI プロボノ事務局  press@laboro.ai
アバター
AIは善にも悪にもなる。サイバー攻撃とセキュリティ 2021.3.16 概 要 インターネットの普及に始まり、テクノロジーが進化するに連れてサイバー攻撃のリスクも増加する一方です。一人ひとりがサイバーセキュリティに関心を高めていくことはもちろん、企業においては適切なセキュリティ対策を施すことの重要性が増してきています。 サイバーセキュリティもAI技術の活用が大いに期待される分野の一つです。このコラムでは、現在のサイバーセキュリティにある課題を確認し、AIの善悪の側面もみた上で、サイバー攻撃に対してAIができることを考えていきます。 目 次 ・ 高まるサイバーセキュリティ需要 ・ 攻めと守り、AIがもたらした双方の進化  ・ サイバー攻撃の進化  ・ セキュリティ対策の進化 ・ 現在のサイバーセキュリティの課題  ・ 従来のセキュリティソフトでは十分に検知できない  ・ 手動による対処では間に合わない  ・ 悪意を持った不正ユーザーへの対処が難しい ・ AIを活用したセキュリティ強化  ・ 機械学習による検知率の強化  ・ AIにこそ必要なセキュリティ対策 ・ 善と悪、両方の最新動向を掴む 高まるサイバーセキュリティ需要 テクノロジーが進化し普及していくに連れ、不正に利益を得ようとするサイバー攻撃も合わせて増えていく“いたちごっこ”な状況が続いています。さらに近年のサイバー攻撃の手法はますます巧妙化してきています。一方で、企業のサイバーセキュリティへの関心も高まってきており、IT関連調査会社であるIDCによれば、2019年の世界のサイバーセキュリティへの支出額は前年比10.7%増、今後もサイバーセキュリティ対策への企業投資の増加が見込まれています。 出典: IDC『セキュリティ製品およびサービスの堅調な成長を予測』 攻めと守り、AIがもたらした双方の進化 AIの技術分野の一つである機械学習は、膨大なデータを読み込ませることによってコンピュータがパターンや法則を学習し、未知のデータに対する予測・推論を可能にする技術です。機械学習によって適切に学習したコンピュータは、人間をも上回るパフォーマンスでタスクを実行することも可能であり、サイバーセキュリティでも高い効果を発揮することが期待されています。しかしながら、AI技術の進化は、守る側だけでなく、攻める側の技術進化をももたらしていることは否定できない事実です。 サイバー攻撃の進化 サイバー攻撃の一種に、標的のサーバーに大きな負荷をかけてダウンさせる「DDoS攻撃」があります。通常のDDoS攻撃であれば従来のセキュリティソフトでも対処が可能ですが、悪意をもってAIが用いられることにより、DDoS攻撃はさらに巧妙化してきています。具体的には、標的のサーバーへ攻撃を仕掛ける大量のbotを統括するAIを用意し、トラフィックのパターンや標的のシステムの振る舞いを分析、AIが各botへ指示を送り、セキュリティの隙間を突いた攻撃を行うといったものです。 セキュリティ対策の進化 悪用されたAIにより高度化した攻撃は、従来のセキュリティでは遮断することができません。そこで、守る側でもAIを用いたセキュリティ対策の技術開発が行われています。AIを用いたサイバーセキュリティでは、機械学習技術を用いて「正常な状態」と「異常な状態」のパターンを学習、従来には存在しなかった未知の攻撃パターンに対しても高い精度でアラートを発するような進化を遂げています。DDoS攻撃に対しても、セキュリティ担当者の目視による監視がない場合でも、高い精度で異常を検出することが可能になってきています。 現在のサイバーセキュリティの課題 現在のサイバーセキュリティにはどのような課題があるのでしょうか。その課題点を3つにまとめています。 従来のセキュリティソフトでは十分に検知できない 1つ目の課題として、従来のセキュリティソフトではテクノロジーによって強化されたサイバー攻撃を十分に検知できなくなってきているという点が挙げられます。主流となるセキュリティソフトでは、主にパターンマッチングという手法でサイバー攻撃に対応してきました。これは過去にあった攻撃のパターンを登録しておき、次に同じ攻撃があった場合に検知できるという仕組みです。当然ながら、未知の攻撃に対しては検知率が下がるという弱点があります。 手動による対処では間に合わない 2つ目の課題は、対策スピードに関わる点です。現状のセキュリティでは専門家による手動の対処が前提になることが少なくありません。セキュリティの専門担当者は、大量のログを精査しながらインシデントの内容をまとめ、次に対処するためのパターンを作成しますが、その作業には高度なスキルと膨大な工数が必要となります。専門家と言えども作業が必要となると、やはり攻撃に対する対策が間に合わない可能性が否定できません。 悪意を持った不正ユーザーへの対処が難しい 3つ目の課題として、悪意を持ったユーザーへの対処が難しいという点が挙げられます。マルウェアだけでなく、悪意を持った不正ユーザーもサイバーリスクの一つです。自動転売を行うシステムを使用するユーザー、コミュニティのルールに違反し企業や他のユーザーを妨害するユーザーなど、こういった人それ自体のリスクに対しては、やはり人による監視が欠かせないのが実情です。 AIを活用したセキュリティ強化 このようなサイバーセキュリティ上の課題を解決するため、AIの活用に期待が寄せられています。 機械学習による検知率の強化 AI、具体的には機械学習の技術を活用した代表的なサイバーセキュリティ対策としては、迷惑メールのフィルタリングが一般的にも知られています。コンピュータが迷惑メールのパターンを学習し、その特徴を把握していくことで、新しいタイプの迷惑メールが来ても「安全なメールではない」という判断ができるような仕組みです。 同じように、さまざまなマルウェアやファイルレス攻撃への対処にも、機械学習によるパターン学習が役立てられています。膨大なデータから「システムが正常に動作している状態」を学習し、未知の攻撃によってシステムが正常な動作とは違う動作をした際に、高い確率で異常を検出するものです。 また、サーバーやPC、ネットワークに対する攻撃ではなく、人間を騙すことで不正に利益を得ようとする「ソーシャルエンジニアリング」に対しても、機械学習による検知技術が応用されています。音声や画像、テキストはAIによる生成技術が高度に発達してきており、こういったソーシャルエンジニアリングに悪用されるケースもありますが、パターンを学習したAIを用いてその真偽を見抜く技術も生まれつつあります。 出典: ITmedia NEWS『AIの攻撃をAIで防御、サイバーセキュリティの“いたちごっこ”最新事情』 AIにこそ必要なセキュリティ対策 AIはサイバーセキュリティに活用される技術である一方、AIそれ自体も攻撃の対象となる可能性があります。マルウェアやファイルレス攻撃によるサイバー上の攻撃はもちろん考える必要がありますが、例えば、自動運転車に搭載された画像認識AIを考えた場合、標識などの認識対象にステッカーを貼って意図的に間違った認識をさせるなどの人為的な攻撃も考えられます。セキュリティに関わらず、AIを活用する際には、考え得るリスクを事前に洗い出しておくことが重要です。 善と悪、両方の最新動向を掴む テクノロジーの進化に合わせてサイバー攻撃も進化する、これはもはや宿命のようなものかもしれません。AIを用いたセキュリティ対策は、現時点では“最先端”ではありますが、月日を追うごとにその技術も劣化していくことは間違いのない事実です。 さらに、サイバー攻撃と言っても、やはりその後ろには悪意ある人物の存在があります。テクノロジーは、それをどう使うかによって善にも悪にもなり得るものであることを、改めて認識する必要があります。「AIだから安全」「最新テクノロジーだから安心」ということはなく、常に善・悪の両方の最新の動向をキャッチしておき、常時最良の対策を備えておくことがやはりセキュリティの要です。
アバター
薬局DX。AIは薬剤師業務を変革できるか 2021.3.15 概 要 AI技術を活用したシステムやサービスはさまざまな業界で導入が進められており、業務の効率化や品質向上だけでなく、新たなビジネスモデルの創出にも役立てられています。一方で、サービス内容や業務形態の違いにより、業界によってAIの導入レベルには差があるのが実際です。 調剤薬局、具体的には薬剤師業務は、AIの導入によって大きな変革が期待される分野の一つであり、現段階でも薬剤師の業務支援を目的としたAIが開発・導入され、広がりの兆しを見せています。このコラムでは、調剤薬局における薬剤師業務を、AIがどう支援していけるか考えていきます。 目 次 ・ 調剤薬局の現在と今後 ・ 薬剤師業務の内容  ・ 調剤  ・ 服薬指導  ・ 薬の販売 ・ 薬剤師業務へのAI導入  ・ AIで支援できる業務と、できない業務  ・ 調剤へのAI導入  ・ 服薬指導へのAI導入 ・ 薬局でのAI導入事例  ・ 調剤業務の大幅な自動化  ・ 服薬指導をAIが支援 ・ AIによる薬局トランスフォーメーション 調剤薬局の現在と今後 人の知能を模した機能をコンピュータに搭載し、より精度の高い処理を行うAI。一見何でもできるかのように思えるAIですが、実は、親和性の高い職種・業界とそうでない分野があります。 例えば、コンピュータが処理しやすい定型的な業務の多いバックオフィスはAIとの親和性が高い一方、薬剤師のような専門的な知識を要する業務は、効率化を目的にするとAIの活用が難しい一面があります。そのため、患者一人ひとりに合わせた対応をしなければならない業種の性質に起因して、AIを始めとしたテクノロジーによる支援はまだ十分に浸透しているとは言えません。 ですが、AIによる業務支援が不可能ということではありません。実際、調剤薬局の業務を支援し、業務効率化やお客様の満足度向上につながるアイデアがすでに登場しており、現場導入される例も生まれてきています。その状況を確かめるため、まずは導入先となる薬剤師の代表的な業務をおさらいしていきます。 薬剤師業務 の内容 言うまでもありませんが、薬剤師は大学の薬学部で6年間のカリキュラムを履修し、国家試験に合格することで就くことができる職業です。 就業先としては薬局・医療施設・医薬品関係企業が主で、 その業務内容は専門的な上、広範囲に渡ります。 調剤 医師が出した処方箋の内容に従って薬剤の調剤を行う、これが薬剤師の代表的な業務です。しかし、処方箋のとおりに調剤することを基本としつつも、薬の飲み合わせや患者の様子などから、処方箋の薬で本当に問題がないかの確認や別の提案を担当医師に伝える「疑義照会」も、薬剤師の重要な役割です。 飲み合わせなどの確認を薬剤師が行うのは「医薬分業」の考え方に基づくもので、医師とは切り離された立場から薬剤師がチェックを行い、セカンドオピニオン的な観点をもって処方のミスを防ぐための重要な役割を担っています。 服薬指導 調剤した薬を患者に渡す際に服薬指導を行うことも薬剤師の重要な業務の一つです。薬を飲むタイミングや適切な飲み方、副作用などの注意点、分量などについて指導を行うことで薬を安全に服用してもらい、確実な効果が出るようにサポートします。 なお、窓口で薬を渡しながら服薬指導をするのは調剤を行った薬剤師とは別の薬剤師が担当します。医薬分業だけでなく、調剤薬局の中でも役割を分けることでミスの防止やサービス品質の向上につなげられています。 薬歴管理 患者へ薬を提供するためには、薬剤服用歴管理簿(薬歴)が欠かせません。薬剤師は服薬指導を通して患者の服薬状況や既往歴、副作用歴を聞き取り、薬歴として管理を行います。薬歴は記入するだけでなく、自分以外の薬剤師が見たときにもわかりやすい内容になっていることが大切です。「薬剤服用歴管理指導料」の算定要件でもあるため、薬歴の管理・活用は薬剤師の重要な業務のひとつです。 薬の販売 薬の販売を行うことも薬剤師の業務の一つです。ドラッグストアには薬剤師がいなくても購入できる薬が多く並んでいますが、これらは第2類医薬品、第3類医薬品と呼ばれる薬剤師だけでなく登録販売者も取り扱える薬です。一方、要指導医薬品、第1類医薬品は、薬剤師による書面での情報提供の上でのみ販売が可能とされています。なお、調剤薬局事務員がいない場合は、薬剤師が処方箋の取り扱いから会計まですべてを担当することもあります。 薬剤師業務へのAI導入 上記のような薬剤師業務・薬局業務に対して、AIは全てを代替することができるのでしょうか。 AIで支援できる業務と、できない業務 AIの導入事例が様々なビジネスシーンで見られるようになってきているものの、いまだ「AIによって人間の仕事が奪われるのではないか」というイメージは根強く残っているようです。 たしかにAIによって代替され得る業務・職種は存在し、実際、ごく一部の業務やタスクはAIを始めとした技術によって代替されていることも事実です。ですが、AIはゼロイチで何でも可能にするような技術ではなく、できることはかなり限定的です。あくまで業務支援を行うサポートツールとしてAIを捉え、AIを「どう使うか」という視点に立つことが重要です。 薬剤師業務へのAI導入を考える際も、AIで支援できる業務と、AIでは支援できないを業務を見分けることが重要です。機械に任せられることは機械に任せ、人にしかできない業務は薬剤師の仕事として生かし、それに専念できるような環境構築を目指すことが大切です。 (※画像はイメージです) 調剤へのAI導入 調剤業務のある程度の部分は定型的な作業となるため、オートメーション化に向いていると考えられます。一方で、処方箋は患者の体調や体重、薬の飲み合わせなどを見て薬の分量などが調整されており、一人ひとりに合わせた対応が必要となります。近年では、こうした微妙な量の調整も入力されたデータに基づいて自動で行い、調剤業務をオートメーション化するようなソリューションも登場しています。 具体的にAIは、チェック部分での活用が期待されています。例えば、分包した薬が種類・数ともにきちんと合っているかの判定を画像認識技術を用いたAIで行うなどが考えられます。 (※画像はイメージです) 服薬指導へのAI導入 服薬指導は、患者一人ひとりに合わせた対応が必要なため、機械ではなく薬剤師が行うべき業務ではありますが、その業務支援のためにAIを用いることも一つの方法です。 例えば、経験を積んだベテランの薬剤師は、患者が他に服用している薬や服用歴、その日の体調、医師の処方箋内容などから総合的に判断し、その人に合わせた的確な服薬指導を行うことができますが、一方、薬剤師の資格を取ったばかりの新人は机上で勉強したとおりの指導に留まってしまうこともあり、このノウハウの差は大きな課題だと言えます。 こうしたベテランと新人の差は、AI技術を活用することで埋められる可能性があります。後の事例パートでご紹介しますが、ノウハウを蓄積したシステムからその患者に合わせたデータを素早く参照することで、経験の少ない薬剤師でも患者に合わせた服薬指導が行えるようなシステムも登場しています。 (※画像はイメージです) 薬局でのAI導入事例 最後に、実際に進んでいる薬局へのAI導入事例を2つ見ていきましょう。 調剤業務の大幅な自動化 調剤併設ドラッグストア『トモズ』は、一部の店舗で大規模なオートメーション設備を導入し、散剤(粉薬)の調剤、水剤の定量分注、錠剤の分包など以下のバックヤード業務の自動化に成功しています。 ・ピッキング → 軟膏や張り薬を除く9割の薬のピッキングを機械が行う ・散剤の調剤 → 処方データを流すだけで散薬調剤ロボットが調剤 ・水剤の調剤 → 投薬ボトルをセットし、スタートボタンを押すと水剤定量分注機が調剤 ・錠剤一包化 → 全自動錠剤分包機が行う ・錠剤一包化の監査 → カメラ付きの錠剤一包化鑑査装置が撮影しながら行う このケースでは、AI技術は錠剤一包化の監査装置に取り入れられています。毎日複数種類の薬を飲む患者にとっては、複数の錠剤を1つの袋にまとめる錠剤一包化は非常に嬉しいものですが、一方で、薬剤師による人手作業と目視によるチェックが必要で、その負担は決して小さいものではありません。 この一連のオートメーション化の例では、一包化の作業を自動化しつつ、内包チェックを画像認識AIを用いて実施しています。具体的には、一包化した袋を撮影し、そこにどんな薬が入っているのかをAIが判定、指示どおりの薬が入っていなかったり、撮影時に重なり合っていて判定が難しかったりするとアラートを出し薬剤師が確認できるようにすることで、一包化のチェックを大幅に効率化することに成功しています。 出典: MD NEXT『トモズ、調剤オペレーション自動化の実証実験を開始』 服薬指導をAIが支援 『さくら薬局』では、膨大な調剤データや患者のデータを活用し、AIが服薬指導を支援できるシステムを導入しています。 服薬指導は、上でも書いた通り、薬剤師ごとの経験の差が課題になります。さくら薬局では、薬に関する知識や服薬指導に関する知見などを全国の店舗から集めてデータベース化し、薬剤師が服薬指導をする際、AIによる提案(レコメンド)を閲覧できるシステムを構築しています。 さらに、ベテランの薬剤師にとっては過剰な情報は逆にノイズとなることから、薬剤師のスキルに合わせてレコメンドする情報の内容量を変えられるといった工夫もなされています。 窓口業務の平準化を図れるだけでなく、膨大なデータを処理するAIだからこそ気付ける患者の「いつもとは違う変化」にも対応できるようになるなど、サポート品質の向上にもつながっています。 出典: IBM THINK『“調剤業務”から“対人業務”へ——AIで実現するさくら薬局のデジタル変革』 一包化監査支援 システム 富士フイルムは、写真・医療分野で培ってきた光学設計技術・画像処理技術を活かし、薬剤を一錠ずつ瞬時に判定し、処方箋と自動照合するシステムを実現しました。具体的には、錠剤やカプセル剤を高画質撮影し、独自の画像認識技術で一つ一つの錠剤の刻印や文字、カプセル剤の色や形などを高速・高精度に読み取るというものです。 一包化監査支援システムの導入により、薬剤師の一包化監査業務の時間を短縮するだけでなく、正確性の向上にも寄与しています。 出典: 富士フィルム『一包化監査支援システム PROOFIT 1D』 AIによる薬局トランスフォーメーション 薬剤師は高度に専門的な知識を要する職業でありながら、精査してみるとAIが自動化できる業務も含まれています。定型的な業務をAIに代替させ、患者ごとの服薬指導などパーソナライズな対応が必要な対人業務に薬剤師のリソースを割り当てることで、薬剤師の価値をより一層高めていくことができるはずです。 薬剤業務におけるAI活用はまだ始まってばかりで、今後、新たな先進的な導入事例の誕生が見込まれます。Laboro.AIでは、薬局・薬剤・製薬業界はもちろん、すべての産業でイノベーションを志す方々をお客様としてお迎えし、カスタムAIの開発を行なっています。AIの活用・導入・開発について課題をお抱えの方は、ぜひご相談ください。
アバター
5Gの普及は、AIに何をもたらすのか 2020.12.28 概 要 5Gを使った通信サービスが日本でもスタートし、これまで実現できなかったさまざまな技術やサービスへの活用が期待されています。実はこの5G、企業でのAI活用を考える際にも無視できない存在になりつつあります。このコラムでは、5Gの特徴やAIとの関係などについてご紹介していきます。 目 次 ・ 5Gの特徴  ・ 超高速・大容量  ・ 超低遅延  ・ 多数同時接続 ・ 5GがもたらすAIへの影響  ・ 膨大なデータ処理を可能にする技術要因 ・ 5G環境におけるAI活用事例  ・ 交通状況の把握や自動運転技術  ・ 診断の高精度化や遠隔医療 ・ 5Gの普及に向けた課題  ・ 環境整備に必要なコスト  ・ 増加するIoT機器へのサイバー攻撃 ・ 5Gの動向をつかむ 5Gの特徴 そもそも5Gとは「第5世代移動通信システム」を指す言葉で、現在主に使用されている4Gよりも遥かに高性能な移動通信システムとして期待されています。日本では2020年が5G元年となりましたが、アメリカでは2018年に大手キャリアがサービスを開始、韓国・中国でも2019年から広く使われるようになるなど、世界各国で導入が進められています。 4Gが世界中で普及したことにより、通信の大容量化が進み、多くのユーザーのニーズはすでに満たされたとも思われますが、5Gの普及によりさらに大容量で高速な通信インフラの構築が目前のものになりつつあります。 超高速・大容量 5Gの特徴の1つとして挙げられるのが、従来を大きく上回る高速・大容量通信です。現在主流になっている4Gの通信速度は最大で1Gbpsほどと言われますが、5Gは最大20Gbpsと4Gの約20倍の高速通信を実現する技術と言われています。 4Kや8Kなどの高品質な動画コンテンツの配信、ウェアラブルデバイスの普及、セキュリティ技術や医療の進化など、多方面で通信デバイスが要求するトラフィック量が増加しています。2010年代に比べ、そのトラフィック量は、2020年代に1,000倍にまで増加するという試算もあり、5Gにはこうした大容量のトラフィックをさばき、快適な通信環境として整備されていくことが求められています。 なお、5Gを運用するにあたって新たに使用される電波周波数帯域のうち、ミリ波と呼ばれるとくに高速かつ大容量通信に長けた帯域は、2020年12月時点ではまだ使用されておらず、最大20Gbpsの通信速度は、今後実現されていく話ではあります。 超低遅延 通信の低遅延性も5Gの大きな特徴です。数十ミリ秒ほどとされる4Gの遅延に対し、5Gではその10分の1にまで短縮され、数ミリ秒ほどの遅延で通信できると言われています。 無線通信においては1ミリ秒以下の低遅延も求められるケースも少なくなく、これが実現すれば車と車の通信による事故の回避などが可能になるほか、医療現場やロボットの遠隔操作、ウェアラブルデバイスの接触通信などに5Gの低遅延性が貢献することが期待されています。 多数同時接続 複数のデバイスと同時接続できることも、移動通信システムに求められる重要なポイントです。4Gでは1k㎡あたり約10万台のデバイスに接続できるとされていますが、5Gでは約10倍に増え、1k㎡あたり約100万台のデバイスに接続できるようになると言われます。ただ一方で、同時接続の需要がさらに増加するにつれて、4Gの100倍にもなる多数同時接続が今後求められるだろうという試算もなされています。 これまでは人と人の通信や、スマートフォンなどのデバイスを経由した人とモノの通信が主流でしたが、今後は、モノ同士がインターネットを介してつながる「IoT(モノのインターネット)」の増加が見込まれます。 一般家庭では電気メーターやガスメーター、白物家電など、また、ビジネスでは農業・畜産などでのセンサーへの活用が進んでいますが、将来的には自動車・電車など公共交通機関や移動サービスでもIoTの活用が進んでいくことが考えられます。 5GがもたらすAIへの影響 5Gの構築と整備が進み、高速・大容量通信が利用できるようになってくると、AIにも多大な恩恵がもたらされます。 AIで現在主流になっている技術が、コンピュータ自身が学習することで特定のタスクを高い精度で処理することを目指した「機械学習」です。中でも「ディープラーニング(深層学習)」は人間の作業をより少なく、より高精度に処理できる技術として期待される分野ですが、その精度を実現するためには、AIに学習させるための膨大なデータが必要となります。こうしたビッグデータを収集する際に大きな鍵になるのが、先ほどもご紹介したIoTです。 IoTはモノが直接インターネットにつながっていることから、センサーから得た情報を常にクラウドに送信し、データを蓄積していく技術とも言えます。スマートフォンが送信するデータや、農業用センサーから取得される天候データ、カメラから把握される人の動きのデータなどはその例です。 5Gが普及すれば、IoTデバイスの受発信に基づく膨大なデータ通信にも耐えられるようになります。伴って、AI開発に必要なビッグデータを効率良く収集できるようになっていき、その結果、開発されるAIモデルの精度向上に貢献することが期待できます。 膨大なデータ処理を可能にする技術 要因 5Gは4Gよりも高速・大容量、低遅延、多数同時接続が魅力の移動通信システムですが、このシステムは高周波数帯の帯域を新たに使用することで実現しています。 4Gに使用されているのは主に数百MHz~2GHzの帯域でしたが、4Gを含めさまざまな通信でこの帯域を使用しているため、5Gでは「サブシックス」と呼ばれる6GHz以下の帯域、およびミリ波と呼ばれる28GHzの帯域を使用します。さらに将来的には、100GHzまで使用することが検討されています。これにより、4Gとは比べ物にならないほどの帯域幅を確保できることになります。 こういった高周波数帯を使用することで高品質な通信が可能となりますが可能が、高周波数帯は減退が大きく、電波の直進性も強いため、基地局の近くにいて遮蔽物がなければ使えないという弱点があります。そのため、5Gの実現にあたっては、ビームフォーミングという技術を改良し、超多素子アンテナを使用するなどして弱点克服が目指されています。 5G環境におけるAI活用事例 5Gの開始と普及に合わせて、すでにAIを用いたさまざまな新しいサービスが模索されています。 交通状況の把握や自動運転技術 5G環境が構築されることにより、多数のカメラを用いた交通状況のリアルタイム把握が可能になると言われています。これにより外出前の混雑状況や最適経路のチェックが、今以上に便利になることが期待されます。 また、車同士が通信できるようになることで、自動運転技術の発達も加速すると言われています。車同士の距離、歩行者との距離、車や歩行者の動きなどがリアルタイムに観察・計算されることにより、安全性や走行の安定性が増し、より実用的な自動運転技術が登場してくると期待されています。 AI技術を活用した未然の事故防止や、渋滞の緩和などの試みはすでに一部で取り組まれていますが、超高速・超低遅延・多数同時接続を可能にする5Gが自動車などのモビリティーや交通インフラへ浸透することによって、これらの精度がより高まっていくと考えられます。 診断の高精度化や遠隔医療 医療分野でも、5GとAIの活用が大きく広がっていくと言われています。例えば、ベテランの医師でも診断を誤るような難しい症例について、AIを用いて画像分析することで誤診断数を低下させるといった例が登場しています。5Gにより高精細な画像が高速通信できるようになれば、さまざまな医療現場で医師がAIを活用し、より高精度な医療を提供できるようになっていくかもしれません。 また、高度な医療を受けるためには、多くの場合で主要都市圏に行かなくてはならない現状がありますが、5Gの特徴である超低遅延を活かしたAR技術によって、遠隔でも医師から直接診断を受けられるホログラムの実証研究も進んでおり、距離に関わらず、全ての人により高度な医療を提供するための努力が重ねられています。 5Gの普及に向けた課題 私たちのビジネスや生活が大きく変化することも予期させる5Gですが、いくつかの課題もあると言われています。 環境整備に必要なコスト 改良されたビームフォーミング技術を用いるなどの対策を行っても、5Gの普及には多数の基地局が必要であるなど、インフラの整備に膨大な費用が必要です。2020年12月現在の日本の5Gサービス内容も限定的なのが実際で、超低遅延性などの特性も、性能としては限られたものなってしまうことが懸念されています。 増加するIoT機器へのサイバー攻撃 5Gが普及するにつれ、インターネットにつながるIoT機器は当然ながら増加していきます。現在のPCやスマートフォンだけでなく、これまではインターネットにつながっていなかった時計やエアコン、洗濯機、メガネ、自動車などさまざまなものが接続されていくことが見込まれる一方で、サイバー攻撃を受ける危険性もその分高まっていくことになります。 5Gの動向をつかむ AIだけでなく、私たちの生活にも大きな変化と影響をもたらすことが期待される5Gですが、その普及は段階的なもので、すぐさま私たちの生活に大きな変化が起こるものではないと予想されます。今後、間違いなく次々と登場してくる5G関連の情報を早い段階つかみ、その普及と進化の動向を把握しておくこと、またAIと掛け合わせることでどのような発展系が見据えられるかを想像し、ビジネスでどう活用していくかの絵を描いていくことが重要です。 その他のおすすめコンテンツ ・ AIとIoT、その密接な関係を知る ・ 機械学習とディープラーニング(深層学習)の違いとは ・ 事例から知る。機械学習の基礎と活用5ジャンル ・ AI開発の基礎。概要から開発の流れ、必要なものを解説 ・ 文系ビジネスマンのための機械学習。「教師あり」「教師なし」をおさらい
アバター
AIとIoT、その密接な関係を知る 2020.12.22 概 要 「AI」「IoT」といった言葉もよく聞かれるようになりました。すでにAIやIoTを用いたさまざまなサービスが登場していますが、改めてAIとIoTにはどのような関係があるのでしょうか。このコラムでは、AIやIoTの概要やその関係性、実際の活用事例についてご紹介します。 目 次 ・ AIとは  ・ AIの定義  ・ 機械学習 ・ IoTとは  ・ IoTの経済効果  ・ IoTでできること ・ AIとIoTとの関係  ・ 5Gによるさらなる進化 ・ AI・IoTの活用事例  ・ スマート農業  ・ 交通機関のロケーションシステム  ・ 医療・介護のベッドセンサーシステム  ・ スマートシティ ・ 今後も発展が期待されるIoT AIとは 今さらのことではありますが、AI(Artificial Intelligence)は、日本語では「人工知能」と訳されます。AIと聞いて人間のような知能を持つSF的なロボットを思い描いてしまう方はさすがに少なくなってきた印象がありますが、現段階でのAIは一定の機能に優れた「特化型AI」であり、特定のタスクを高い精度やスピードで完了させることを得意とします。 AIの定義 AIという言葉は、一般的には産業ロボットのような存在を指して用いられることもありますし、AIの一分野であるディープラーニング技術に対して用いられたりと、さまざまなシーンで登場します。 AIの定義は、研究者によって様々なされており、共通した定義はないのが現状です。比較的多く用いられるものとしては、一般社団法人 人工知能学会設立趣意書にある「大量の知識データに対して、高度な推論を的確に行うことを目指したもの」がありますが、ここでは人間が行う知能的な活動の一部を模してコンピュータに計算を行わせる技術だと理解するのが良いかと思います。 機械学習 AIという技術体系の中にはさまざまな技術が含まれていますが、近年注目を集めているのが「機械学習(マシーンラーニング)」と呼ばれる技術分野です。機械学習は大量のデータを学習することにより、コンピュータがその法則性や共通点などを見つけ出すことを得意とする技術です。 機械学習の中でも、とくに活用が盛んになっているのが画像認識です。例えば、AIで手書きの数字を認識することを目指す場合には、0~9までの手書きの数字を大量に用意しデータとして学習させることで、コンピュータに手書きの数字の特徴を覚えさせ、だんだんと認識できるよう訓練していきます。こうして学習の精度を上げていき、学習させていない新たな手書きの数字を読み込ませても、これまで学習したパターンと照らし合わせることで、その数字を正確に識別できるようになっていきます。 IoTとは IoT(Internet of Things)は、一般的には「モノのインターネット」と訳されることが多いようです。これは、インターネットが人間が使うものだった従来と対比し、人間の操作を介さず、モノそのものがインターネットとつながっている状態にあることを表すため、そのように言われるのだと考えられます。 IoT技術が進化した世界では、これまでインターネットとの接続とは無縁だったテレビやエアコンのような家電が相互に通信したり、遠隔操作で認識・計測・制御するといったことが可能となります。このように、人の操作を必要とせず、モノ自らがインターネットにアクセスすることがIoTの特徴と言えます。 IoT の経済効果 総務省が発表した「情報通信白書(平成29年版)」によれば、IoTによって社会改革が進展するケース(経済成長シナリオ)と、IoTをもってしても改革の効果がないケース(ベースシナリオ)とを比較した場合、2030年時点での経済成長のインパクトとして、市場規模にして271兆円もの差が出ると試算されています。このことからも、IoTが経済に与える影響の大きさをうかがい知ることができます。 IoTでできること IoT機器のわかりやすい一つして、スマートフォンが挙げられますが、スマートフォンは絶えず何らかのデータを収集し、インターネットを介してデータを送信しています。例えばGPSによる位置情報は持ち主の行動データとして蓄積され、人々の行動のパターン分析などに役立てられています。 こうしてみると、IoTはセンサーとインターネット接続がセットになった機器だと表現することもできるかもしれません。センサーにより人間がどれだけ移動したか、どのような動きをしたのか、ドアは何回開けられたのか、温度はどう変化したのかなどのデータを収集し、インターネットに接続することでそれらのデータをリアルタイムに送信することがIoTによる大きな進歩だと言えます。 つまり、IoT機器はセンサーから情報を収集し、インターネットを介してそれを送信することで、ビッグデータを蓄積することに貢献する機能を持っているということです。 AIとIoTとの関係 ビッグデータは、AI、とりわけ機械学習において重要な要素になります。機械学習では大量のデータを学習しますが、ただデータがあればいいわけではなく、質も十分に担保された「ビッグデータ」が必要となります。十分な量と質のビッグデータがなければ、機械学習の技術は活かしきれず、その精度を上げることも難しくなってしまいます。ビッグデータを集めるために有効な技術がIoTであり、この点からAIとIoTとの密接な関係が見えてきます。 ちなみに、現在世界で数百億台のIoT端末が存在していると言われており、それらのすべてが新たなデータを生み出し続けているそうです。企業がIoT技術によって生み出されるデータを取得・解析することによって、さらにモノに新たな価値を付与し続けるという循環システムを構築することが期待されます。 5Gによるさらなる進化 また、AIとIoTの活用は5Gの普及によってさらに加速すると考えられています。「第5世代移動通信システム」を意味する5Gは、現行の移動通信システムである4G LTEを大きく凌ぐ性能を持つとされています。具体的には、最高伝送速度は約100倍、遅延は10分の1、機器の同時接続可能台数は約100倍という性能で、IoT機器による情報の送信も大幅に高速化されます。5Gが普及するにつれ、IoT機器の普及やAIの活用も拡大していくとみられています。 AI・IoTの活用事例 次に、AIとIoTを活用した事例をご紹介していきましょう。 スマート農業 AIとIoTの活用分野として注目を集めているのが農業です。農業は作業面積が広い上、人手によるチェックや作業に負うシーンが多く存在します。IoTは農業における人の目や勘を代替するのに適した技術であり、AIやIoTを活用した農業は「スマート農業」と呼ばれます。 例えば、ワイン用のブドウで地域振興を目指す長野県の「信州ワインバレー構想」では、一定の品質のブドウを安定的に供給するためにAIやIoTを活用しています。具体的には、さまざまなセンサーを搭載した機器を農園に設置し、気温や湿度、日射量、風の強さなどを計測。機器はインターネットに接続しているため、これらのデータは常に送信され、スマートフォンやタブレットから確認できます。そしてこれらのデータを分析することで、例えば栽培している樹木や果実の病気の予測を行うといった活用が見込まれます。 出典:長野県公式観光サイト Go NAGANO「 もっと知りたい、きちんと知りたい長野県産ワイン「NAGANO WINE」 」 交通機関のロケーションシステム 国土交通省は、岡山県玉野市でバスロケーションシステムの実証実験を2017年12月15日より実施しています。 バスやタクシーの高精度な位置情報を一元的に収集することで、利用者は乗りたいバスがどこにいるのかをリアルタイムで知ることができます。到着時間を推測しにくい交通機関が、IoT技術により乗り継ぎなどの不安が解消され、より利用しやすくなることが目指されています。 出典:国土交通省「 日本版GPS「みちびき」を活用した高精度バスロケーションシステムの実証実験を開始します 」 医療・介護のベッドセンサーシステム 高年齢化が進み、介護現場の負担の問題が顕在化している中、その問題を解決へと導く一つのソリューションとしてベッドセンサーシステムの導入が進んでいます。例えば、リコーが提供する「リコー みまもりベッドセンサーシステム」はそのひとつです。 ベッドセンサーシステムには、非常に精度の高いセンサーがベッドに取り付けられており、「どの位置にどんな体勢で寝転んでいるのか」「眠っている/起きている」「呼吸などのバイタルデータ」「体重」などのさまざまな情報を取得し発信することができます。 出典:株式会社リコー「 リコー みまもりベッドセンサーシステム 」 スマートシティ AIとIoTを活用することで、街全体で人々の生活を改善していこうという構想をスマートシティと呼びます。スマートシティでは、家の中の家電だけでなく、街の中にあるあらゆるモノがインターネットに接続し、モノ同士が連携することにより、例えば、交通渋滞を予測して最適なルートを検出したり、犯罪を未然に防いだり、市民サービスを向上させたりといったことが可能になると期待されています。 わかりやすいスマートシティはまだ実現していませんが、千葉県柏市にある「柏の葉スマートシティ」や、トヨタ自動車が構想する「ウーブン・シティ」など、すでに実験的なプロジェクトが複数登場しています。 出典: 柏の葉スマートシティ 今後も発展が期待されるIoT これまで見てきたようにAIとIoTは、ビッグデータの取集・送信・分析といった観点から密接な関係があります。さらに今後は5Gの普及により、さらなる進化と活用が期待されます。 その他のおすすめコンテンツ ・ 5Gの普及は、AIに何をもたらすのか ・ 機械学習とディープラーニング(深層学習)の違いとは ・ 事例から知る。機械学習の基礎と活用5ジャンル ・ AI開発の基礎。概要から開発の流れ、必要なものを解説
アバター
オリジナル日本語版BERTモデルをさらに軽量・高速化 『 Laboro DistilBERT 』を公開 2020.12.18 株式会社Laboro.AI 代表取締役CTO 藤原 弘将 機械学習エンジニア 趙 心怡 概 要 Laboro.AIは、本年4月公開の自然言語処理アルゴリズムBERTを用いて開発した当社オリジナル日本語版BERTモデルに蒸留を施し、より一層の軽量・高速化を図った言語モデル『Laboro DistilBERT』を開発し、非商用途にオープンソースとして公開いたしました。 こちらでは、その開発背景やモデルの詳細についてご紹介します。なお、さらに詳しい情報やモデルのダウンロードをご希望の方は、こちらの GitHub をご確認ください。 また、本年4月公開の『Laboro BERT』について詳細は、 こちらのコラム からご確認いただけます。 目 次 ・ 背景 – BERTの課題 ・ 開発内容 – Laboro DistilBERTについて ・ 今後の展開 – Laboro DistilBERTの活用可能性 ・ Laboro DistilBERTのご利用について  ・ ライセンス  ・ ご利用にあたっての注意事項  ・ ダウンロード 背景 – BERTの課題 2018年10月にGoogleが発表した自然言語処理モデルBERT(Bidirectional Encoder Representations from Transformers)は、自然言語処理に大きなブレイクスルーをもたらしたと言われるアルゴリズムですが、一方で、そのベースモデルには1億1千万にも及ぶパラメーターが含まれるなど、その実装のためには大規模な情報処理環境が必要となります。 そこで、大規模なモデルを教師モデルとして学習させパラメーター数を圧縮する蒸留(distillation)という手法を施したDistilBERTが、2019年10月に公開されています。元論文では、DistilBERTはBERTの精度を97%の精度で保ちながらも60%の高速化を実現したことが報告されています。 ※DistilBERTについては詳しくは、元論文 ” DistilBERT, a distilled version of BERT: smaller, faster, cheaper and lighter ” でご確認いただけます。 開発内容 – Laboro DistilBERTについて 当社では、主に英文への対応が中心であったBERTを国内でも活用いただきやすくすることを目指し、日本語文章に対応した独自のBERT事前学習モデル『 Laboro BERT 』を、本年4月にオープンソースとして公開しています。そして今般、このLaboro BERTに蒸留を行った『Laboro DistilBERT』を開発し、同じく非商用途に公開することといたしました。Laboro DistilBERTは、新たに取得した13GBの日本語コーパスによって事前学習させたLaboro BERTを教師モデルにした蒸留モデルです。 Laboro DistilBERTの性能評価のため、文章分類と質問回答の2つのタスクで評価を実施しました。この際、比較対象として教師モデルであるLaboro BERTに加え、日本語の蒸留BERTモデルとして知られる株式会社バンダイナムコ研究所が公開するモデル(以下、 Bandai Namco DistilBERT )の計3モデルで比較を行っています。その結果、まず文章分類タスクにおいては、Laboro DistilBERTがLaboro BERTの精度(正解率:accuracy)の98%を保ちつつ速度(推論時間:inference time)を58%削減したことを確認いたしました。また質問回答タスクでは、90%の精度維持と47%の速度削減を確認いたしました。さらにBandai Namco DistilBERTに対しては、いずれのタスクにおいても精度・速度ともに上回る結果を確認いたしました。 Laboro DistilBERTの性能評価実験の結果 今後の展開 – Laboro DistilBERTの活用可能性 Laboro DistilBERTは、高い精度と早いレスポンスの双方が求められる、以下のようなシーンでの活用が期待されます。 ・スマートフォンをはじめとするエッジ端末上での自然言語処理 ・スピーディーな反応が求められる双方向コミュニケーション ・低コスト条件とリアルタイム性が重視される言語モデルへの活用 Laboro DistilBERTのご利用について ライセンス Laboro DistilBERTは、国際的な著作権ライセンスであるクリエイティブコモンズの CC BY-NC 4.0 (Attribution-NonCommercial 4.0 International)の下、 非商用目的に限り無料で公開 しています。下記のリンクよりダウンロードいただけます。 商用目的での利用をご希望の方は、こちらの お問い合わせフォーム よりご連絡ください。 ご利用にあたっての注意事項 当モデルは、機械学習技術を用いている性質上、事実とは無関係な単語列を出力したり、公序良俗の観点で不適切な単語列を出力する場合があります。モデルの学習は統計的機械学習を用いて行われており、その出力は株式会社Laboro.AIの意思決定・判断を示すものではありません。当モデルの使用に伴って生じた損失や損害等、いかなる場合においても弊社では一切責任を負いません。以上の点について十分ご理解・ご注意の上、自己責任の下でご利用をお願いいたします。 ダウンロード こちらの GitHub よりダウンロードいただけます。 公開・更新情報 2020年12月18日 Laboro DistilBERTを 公開 しました。 2020年12月18日 プレスリリースいたしました。
アバター
「教師あり学習」「教師なし学習」とは。 文系ビジネスマンのための機械学習 2020.12.17 概 要 総務省の情報通信白書 令和2年版によると、国内企業のAI導入率は14%を超え、ビジネスでのAI活用は、DXブームの波も受けながら、ますます重要な取り組み事項になってきています。 企業におけるAI導入シーンでは、AI開発を得意とするAIベンダーと協力してプロジェクトを推進することが主流になっており、AIに関する知識が最低限でもあればベンダーとのスムーズなやり取りが可能になります。 とはいえ数字、統計をベースとするこの領域で、専門的な技術に理解を深めることはそう簡単ではありません。そこで今回は、かなり初歩的な内容かもしれませんが、文系ビジネスマンの方にも理解していただきやすいよう、わかりやすさを重視しながら、機械学習の中でもよく耳にする教師あり学習、教師なし学習などの概要について改めて振り返っていきたいと思います。 出典: 総務省|令和2年版 情報通信白書|令和2年 情報通信白書のポイント 目 次 ・ 機械学習の分類 ・ 教師あり学習とは  ・ 教師あり学習のプロセス ・ 教師なし学習とは  ・ 教師なし学習のアルゴリズム ・ 半教師あり学習  ・ 半教師あり学習の代表的な活用法 ・ 強化学習 ・ まずは機械学習のイメージを持つことも大切 機械学習の分類 そもそも「AI」は定義も曖昧な、非常に広い概念です。近年のAIの劇的な進歩をもたらしたのは、よく耳にする「ディープラーニング」を含む「機械学習」という技術領域の進化が背景にあると言われます。 機械学習とは、例えば、社内に長年蓄積された文書データや数値データなど、こうした大量のデータをコンピュータに学習させ、その中から特定のパターンや分類ルールなどを導き出す技術の一つです。 とはいえデータが多ければいいという訳ではなく、機械学習で用いるデータは、質も重要です。例えば、営業担当者ごとに好き勝手&属人的に書かれた営業日報の文書データが大量にあったとしても、そこに何の規則性や一定性もなければ、営業状況の傾向が見出せないのはなんとなく想像がつきやすいかと思います。 いくらAIだとは言っても、何のルールにも基づかずに作成されたデータを学習させても、やはり傾向や特徴を掴むことはなかなか簡単ではありません。一定の基準に従った正確かつ意味のあるデータを用いることが、分類や予測などの精度を高めるためには非常に重要なポイントになります。 そして、機械学習という技術は、文書の分類をしたいのか、社内システムの制御をしたいのかなどの目的に応じて、コンピュータに対するデータの学習のさせ方が変わってきます。その整理するためによく聞かれるのが、「教師あり学習」「教師なし学習」「半教師あり学習」「強化学習」の4つの分類です。 教師あり学習とは 教師あり学習は、機械学習のうち、データに正解のラベルを付与した上でコンピュータに学習させる手法を指します。コンピュータは大量の正解データを学習することでパターンやルールを見つけ出し、次に入力されたデータを学習したパターンやルールに則って分類できるようになっていきます。 例えば、ある農家で果物の分類を画像から行いたいと思った場合には、リンゴの画像には「リンゴ」のラベルを、ブドウの画像には「ブドウ」のラベルを……というように正解のラベルを付けていきます。そして、リンゴの特徴は何か、ブドウの特徴はどのポイントかというように学習させていきます。教師が生徒を指導する際に必ず正解を教える様子に似ていることから、教師あり学習と呼ばれているそうです。 教師あり学習のプロセス 正解のラベルの付いた大量のデータを学習させる教師あり学習では、大きく次の2つのプロセスでタスクを行います。 プロセス1:学習 まずは大量かつ良質なデータを用意し、コンピュータに学習させます。教師あり学習ではデータに正解のラベルうぃ付けることが前提となるので、データの数が増えるにつれ、そのルールやパターンをコンピュータ自身が学習しやくなります。例えば、リンゴの画像を色から判定する場合、「赤色」には幅がありますが、「赤身○%から○%までのものを赤リンゴとする」といったパターンをコンピュータに学習させることになります。 プロセス2:予測 次に、大量のデータを学習してパフォーマンスを上げたコンピュータに、正解のないデータを入力、これまで学習したパターンやルールと照らし合わせてデータを認識し、結果を予測します。上の例と同様にリンゴ画像の識別であれば、その色を読み取り、これまでのパターンと照らし合わせ、赤リンゴに該当するのか青リンゴに該当するのかを判断するといった具合です。 教師なし学習とは 教師あり学習に対し、与えるデータに正解ラベルを付与せずに学習させる手法を教師なし学習と言います。教師なし学習と教師あり学習は、学習の難易度や出力される精度が違うというわけではなく、達成したいタスクによって使い分けることになります。 教師なし学習は正解が与えられていない一方で、大量のデータに含まれる特定のパターンや類似性を学習し、それらの分類やルールの抽出を得意とします。例えば、顧客データの分類に用いるといった利用シーンが想定されます。正解ラベルのない顧客データを学習させることで、商品がどの層に売れているのか、どの時間帯に売れているのかといった分類をさせるような活用も見られます。 教師なし学習のアルゴリズム 教師なし学習の代表的なアルゴリズムとしては、「クラスタリング」と「アソシエーション分析」「GAN(敵対的生成ネットワーク)」「主成分分析」があります。 クラスタリング クラスタリングは、その名の通り、データを分析し、そこにあるパターンを見つけ出し、グループ分けのルールを導き出す手法です。 クラスタリングでは、データ同士の類似度を見ます。そのデータ同士が近い数値を持っていれば、同じグループということでクラスタリングされます。クラスタリングされた1つひとつのグループを、クラスタと呼びます。顧客管理などに使われることが多く、顧客をさまざまなグループでクラスタリングすることで販売予測などに活かしていきます。 クラスタリングと混同されやすいのが「分類」です。機械学習においては、クラスタリングは教師なし学習、分類は教師あり学習で用いられます。分類は教師あり学習のため、データには正解が付与されており、コンピュータは正解の分かる学習データを分類した上でその特徴を学習していきます。一方のクラスタリングでは、データに正解がないため、コンピュータは近い特徴のデータを見つけて分類していきます。 代表的な応用例には、上記にもご紹介した顧客データの分類が挙げられますが、性年代など従来のデモグラフィック情報での市場のセグメンテーションから、より一歩進んだ市場分析に用いるといったことが期待できます。 アソシエーション分析 アソシエーション分析は、大量のデータを分析した上で、データ間の関連性を見つけ出す手法です。商品Aを購入する人は商品Bも一緒に購入する傾向があるといった関連性を見つけ出すためにも用いられるため、クロスセル戦略の立案のために活用されることもあります。 アソシエーション分析は、まさに店舗のPOSデータを分析するために開発された手法だとされており、POSデータからさまざまな関連性を抽出するためなどに用いられます。アソシエーション分析では、指示度・確信度・リフトと呼ばれる3つの指標を用いて、関連性の強さを分析します。学習させるデータ量が大きくなれば何百、何千という数の関連性が発見されることもあります。 GAN(敵対的生成ネットワーク) 少し毛色は異なりますが、昨今話題となったアルゴリズムとしてGAN(敵対的生成ネットワーク)をご紹介します。GANとは、2つのネットワークを戦わせるような仕組みを作ることで新たなデータを生成できる機械学習のアルゴリズムです。教師なし学習に分類され、かつ学習したデータから新たなデータを生成する「生成モデル」に分類されます。 GANでは、データの生成を行うGeneratorとそれの真偽を判別すDiscriminatorの2つのネットワークが使用されます。例えばGeneratorは、画家のデータを学習することでその画家の絵の特徴を学び、そこから画家のテイストに似せた贋作を作ります。そのデータを受けて、Discriminatorが真偽を判断します。 最初はあっさりと偽物だと判断されますが、Generatorは本物と判断されるように改善を重ねます。Discriminatorが本物だと判断すると、それは本物に限りなく近い偽物ということになります。GANは画像生成や音声の生成、動画の生成などに用いられており、白黒画像をカラーにする、テキストから画像を生成するといった活用が行われています。 主成分分析 主成分分析とは、複数ある変数から新しい変数を導き出し、変数を減らすことでデータを確認しやすくするアルゴリズムです。イメージとしては、身長と体重からボディマス指数(BMI)が導ける関係に近いと言えます。身長と体重という2つの変数があった場合、そこから肥満の人を導き出すのは大変ですが、BMIという1つの指標にまとめてあればひと目で分かるようになります。 主成分分析は複数の変数から新しい変数を作り、数を減らすため、分かりやすい代わりにある程度データを間引く特徴があります。上記の例で言えば、主成分分析を行ってBMIだけを示したデータを見ても、そこから身長や体重を個別に求めることはできません。 「教師なし学習」を使った事例 一部の事例となりますが、教師なし学習の活用方法としては、以下のような事例が挙げられます。 画像認識 画像認識では正解ラベルを与えた教師あり学習が一般的ですが、教師なし学習での事例もあります。当時話題となったのが、2012年にGoogleが発表した、猫の画像を認識したプロジェクトです。このプロジェクトでは、YouTube上にある動画を学習することで猫の特徴を学習し、未知のデータに対しても猫かそうでないかを判断できるようになったという成果が得られています。 AIによる画像認識の概要については、以下のコラムでもご紹介しています。 Laboroコラム「画像認識AIの世界。その仕組みと活用事例」 出典: ITmedia「文系でも分かる「機械学習」のススメ 教師あり/なし、強化学習を解説」 半教師あり学習 半教師あり学習は、教師あり学習と教師なし学習の中間に位置する手法です。手元にあるデータ全てにラベルを付与できない場合に用いられ、一部のデータはラベル付き、残りはラベルなしのデータをコンピュータに学習させるというものです。 と言うのも、データにラベルを付けるには、アノテーション(ラベル付け)の専門業者に協力をお願いすることも多く、大量のデータを用意するのが困難なケースも少なくありません。そういった場合には一部のみラベルを付与し、パターンや類似性を学習させた上で、残りはラベルなしのデータで学習を進めてくという手法が取られます。 半教師あり学習の代表的な活用法 一部のみラベルありのデータを用い、残りをラベルなしのデータで学習させる半教師あり学習は、私たち人がトレーニングを行う様子と似ているとも言われます。スポーツのトレーニングでは、最初にコーチから適切な動作を習いますが、その後は自身で反復練習を行うなどして精度を上げていくことができます。半教師あり学習も同じように、指標となる一部のラベルを元にラベルなしのデータを学習していきます。 半教師あり学習の代表的な活用として、「ブートストラップ法」と「グラフベースアルゴリズム」があります。 ブートストラップ法は、ラベルありデータをまず分類し、その分類規則に基づいてラベルなしデータを「これはこのラベルだろう」と予測して分類していく方法です。 一方のグラフベースアルゴリズムは、データ分布をもとにしてグループ分けを行います。一部のラベルありデータをもとに、「これと近い数値は同じラベルだろう」という予測をしながら近い数値のデータごとにグループ分けを行っていく手法です。 強化学習 強化学習は、教師あり、教師なし、半教師ありの3つと並べて語られる多い学習手法ですが、かなり気質が異なる学習手法です。強化学習は、誤解を恐れず簡単にお伝えすると、コンピュータ自らが試行錯誤をしながら、最適な答えを探す学習手法だと言えます。 具体的な技術の説明は別の機会にしたいと思いますが、イメージとしてお伝えすると、強化学習では「報酬」という考え方が用いられます。例えばエアコンの自動制御を考えた場合、AIが室内の環境を認識し、現在の状態からどれくらい温度を上げ・下げすればよいかを考え、温度操作の方策を取り、適温と評価された場合に報酬が与えられます。適温を維持すればするほど報酬が与えられ続けることになり、AIはより高い報酬を目指して自らの行動を強化させていきます。このように報酬を使って、コンピュータのプロセスを改善・強化させるような学習手法が強化学習です。 かなり有能に見える手法ですが、試行錯誤に少なくとも数千〜数万回ものシミュレーションが必要になることもあって、実際のビジネスシーンで応用を考えた場合には、教師あり学習、教師なし学習、半教師あり学習と比べても、導入の難易度が高い手法だと言われています。 強化学習の事例としてよく知られているのが、2015年にGoogleの関連会社「DeepMind」が開発したAI「AlphaGO」です。AlphaGOは囲碁をプレイするAIで、対局の勝利という報酬へ向けて学習を行うことで、人類最強だと言われていた囲碁棋士にも対局で勝利し、世間を驚かせました。 出典: WIRED「「AlphaGo」の誕生から囲碁「引退」までを振り返る:その進化の歴史から見えた、グーグルの壮大な野望」 まずは機械学習のイメージを持つことも大切 今回はかなり初歩的な内容でしたが、文系ビジネスマンの方にもイメージを持っていたきやすいように、できるだけわかりやすさを優先してお伝えしてきました。 「機械学習エンジニア」という職種が成り立つだけあって、この分野はかなり奥が深く、専門的な知識が必要になる領域です。アルゴリズムを構成する数式を理解することは間違いなく難しいことですが、機械学習によってビジネス上どのような成果が得られるのかのイメージを持つための知識を得ることは比較的簡単ですし、実は企画系のビジネスマンの方々にとってはこちらの方がより重要なのかもしれません。 その他のおすすめコンテンツ ・ AIのメリットやデメリットとは。課題やポイントも含めご紹介 ・ AI導入現場から。企業が抱える検討課題の実際とは ・ AI開発の基礎。概要から開発の流れ、必要なものを解説
アバター
対象は人だけじゃない。「非人体キーポイント検出」の可能性と実例 2020.12.15 株式会社Laboro.AI リード機械学習エンジニア 濱本 雅史 概 要 姿勢推定や骨格検出に利用されるキーポイント検出について、その全体像と代表的なアプローチをご紹介した 前回 。その際、キーポイント検出が人体だけでなく「非人体」にも応用できることに触れました。今回のコラムでは、人体に比べて行われることが少ない「非人体キーポイント検出」を実際に行った例をご紹介するとともに、その特有の課題について考えていきたいと思います。 目 次 ・ 非人体キーポイント検出の難しさ  ・ データ準備の難しさ  ・ アノテーションの難しさ   ・ ①アノテーションツールは何を使えばいいのか?   ・ ②キーポイントの定義はどう設定すべきなのか?   ・ ③どこにアノテーションするのか?  ・ モデル学習と精度評価の難しさ   ・ モデルの選択   ・ 評価値の算出 ・ 非人体キーポイント検出の具体例  ・ データセットとキーポイント定義  ・ モデルの学習  ・ 推論結果 ・ まとめ 非人体キーポイント検出の難しさ 前回のコラム で、人体のキーポイント検出は、特徴的な「点」を見つけることがターゲットで、実は、人体以外にも応用できることに触れました。しかし、実際には非人体に対する応用は非常に限られています。非人体キーポイント検出の難しさは、一体どこにあるのでしょうか。まずはその特有の課題について見てきましょう。 データ準備の難しさ 人体であれば、 COCO や MPII といった研究開発用のアノテーション済み大規模データが(研究用途限定も含めて)公開されています。一方、非人体の場合にはそのようなベンチマークとなるデータセットが存在せず、また存在したとしても自分たちの目的とマッチするかはわかりません。この点が非人体のキーポイントの応用例が少ない一つの原因と考えられます。そのため、非人体キーポイント検出では特に学習・評価用データの準備とアノテーション作業が重要になります。 アノテーション の難しさ そうは言っても、COCOやMPIIは数万枚のアノテーション済み画像から構築されているため、匹敵するほどのデータを準備するのは容易ではありません。また、アノテーション業者へ依頼するとしてもニッチな要望にならざるを得ず、様々な面で苦労すると思われます。そのため、まずは小規模のデータに対し自前でアノテーションを行い、どれだけの事ができるのかを確かめるのが良さそうです。 とはいえアノテーションを行う場合、次の3点の疑問が出てきます。 ①アノテーションツールは何を使えばいいのか? ②キーポイントの定義はどう設定すべきなのか? ③どこにアノテーションするのか? ①アノテーションツールは何を使えばいいのか? 物体検出などと比較すると、アノテーションツールは非常に限られているのが現状です。筆者が調査した限りだと、唯一 COCO Annotator というツールのみが無償のオープンソースソフトウェアで、かつ比較的実用に耐えうるものだと感じました。一方でユーザー管理はあまり高機能とは言えず、動作が不安定な面もあります。未検証ではありますが、より大規模で安定したアノテーション環境が必要な場合にはCOCO Annotatorをベースとした DataTorch というSaaS型商用サービスを検討してみてもよいと思われます。 COCO Annotatorのインストール・基本的な利用方法については、 こちらのブログ記事 にわかりやすくまとまっています。ただし実際にアノテーションを行ってみると、細かな多数のノウハウが必要になってきます。一例としてアノテーション結果のエクスポート仕様があり、ここをよく理解していないとモデル学習時に思わぬ落とし穴にはまることになります。 ②キーポイントの定義はどう設定すべきなのか? 2点目のキーポイントの定義ですが、(画像のパターンとして)客観的にわかる特徴的な点であることがまず重要です。ただし人体でもデータセットによって「頭を1つの点で表現するのか、両目と両耳と鼻の5点で表現するのか」「臀部を中央のみ1点で表現するのか、左右の2点で表現するのか」などが異なっており、具体的にどれだけの数を設定するのかは用途次第です。 また非人体で特有の問題として、左右・表裏が対称であり、厳密な位置の定義ができない場合があることです。この点は人体ではあまり考慮されず、写真を反転しても通常右目と左目は一意に定まります。このことは特に学習時における水平方向の反転による水増し(augmentation)に影響が出てきます。一案としてはあえて学習時に水平方向の反転は行わず、写真の位置だけで左右を判別する、といったことが考えられます。 ③どこにアノテーションするのか? 3点目については、人体も含むキーポイント検出特有の課題です。物体検出やセマンティックセグメンテーションと異なり、目や手などは画像の領域であるため、特定の1ピクセルを正解と定めることができません。このことは次節の検出結果の評価で詳しく述べますが、「アノテーションする点のブレは一定許容できるため、厳密さはあまり気にしない」というのが結論になります。 モデル学習と精度評価 の難しさ 無事にアノテーションが完了しデータセットができると、いよいよモデル学習に移ることができます。モデル学習については他のタスク同様に「どのようなモデルを使うべきか」という大きな課題点があります。また、選択したモデルを独自データセットにより学習しようとすると、実はモデルの精度評価値の算出で一つ独特な課題が発生します。 モデルの選択 前回のコラムでもいくつかのモデルを紹介しました。いざそれらを試そうと思っても、次のような課題が立ちはだかります。(キーポイント検出には限った話ではないですが) ・公開されている実装は信頼できるか? ・独自データセットに対して容易に適用できるのか? 1点目は、TensorFlowやPyTorchなどのフレームワーク実装済みモデルを作る場合や、自らでモデルを構築する場合は別ですが、OSSとして公開されている最新のモデル実装を利用する際に問題となります。各モデルを提案した著者の実装が公開されており、それを利用するのが通常は一番信頼できるものの、公開されている著者実装で論文の精度が再現できない場合があります。 こちらのエンジニアコラムで紹介したM2Det もそのひとつです。再現性は度々機械学習の国際会議でも話題になっており、気を付ける必要があります。 もし公式著者実装の再現性が確認できても、2点目については見落とされがちです。ほとんどの機械学習モデルは特定の公開データセットによるベンチマークと共に学術論文で公表されます。アカデミアの世界では、基本的にそのデータセットに対する精度の再現が保証されるところまでしかチェックされません。そのため、特定データセットのためにコーディングされている場合が多く、独自データセットの利用のためにはソースコードを解析して拡張実装しないとならないこともままあります。前回コラムで紹介し、後ほどの具体例でも使用している HigherHRNet はまさにこの例です。 評価値の算出 モデルの学習が出来たあとは、学習されたモデルの性能を定量的な評価値で表すことが通常求められます。 キーポイント検出の場合、物体検出と同じ平均適合率(mAP: mean Average Precision)が使われることが多く、他に正解キーポイント率(PCK: Percentage of Correct Keypoints)や多物体追跡精度(MOTA: multi-object tracking accuracy)といった評価値も使われる場合があります。今回は主要な論文でよく利用される、平均適合率のみを紹介します。 平均適合率は物体検出でも使われますが、キーポイント検出の定義は若干異なります。物体検出の場合にはIoU(Intersection over Union)により、正解領域とモデルの出力領域の重なり度合いを用います。例えば半分以上重なっていれば正解領域の検出に成功したとみなす、というように直感的にもわかりやすいかと思います。 一方でキーポイント検出は正解(アノテーションされた位置)・モデル出力結果ともに「点」であるため、正解かどうかを判別することが容易ではありません。また、一つの物体に対して複数キーポイントが存在するという構造のため、それらをトータルで評価したいというニーズがあります。そこでIoUと対応するOKS(Object Keypoint Similarity)という値を定義して、物体単位で全正解点と検出点の近さの度合いを0〜1の実数値で表現します。OKSが定まれば、あとは物体検出のIoUをOKSに置き換えるのみで同じように平均適合率を計算できます。 OKSは式1のように表現されます。パッと見は複雑ですが、各物体中において正解点と対応する検出結果の全てが近ければ1、遠ければ0に近づくという定義になっています。なお式中に現れるvisibilityラベルとは、0がラベル付けなし、1が人の影になるなどで推測できる場合などラベル付けされているが見えない、2はラベル付けされていてハッキリ見える、というような見え方を表現したものです。前述のCOCO Annotatorでも後者2つを区別してアノテーションすることが可能です。 式1:OKSの定義 \(OKS=\sum_{i}[exp(-d_{i}^{2}/2s^{2}\kappa_{i}^{2})\delta(v_i>0)]/\sum_i[\delta(v_i>0)] \) \(d_i \) : \(i \)番目のキーポイントに対応する検出点とground-truthのユークリッド距離 \(s \) : ground-truthで定められた物体の矩形領域面積 \(\kappa_i \) : キーポイントごとに設定される定数 \(v_i \) : visibiityラベル\((0, 1, 2)\) \(\delta(v_i>0)\) : \(v_i>0\)ならば\(1\), それ以外なら\(0\)となる関数 OKSは様々な方が解説されているものの、定数κについて詳しく触れられているものは少ないため、ここで軽く解説します。κはキーポイントごとに予め設定される値で、そのキーポイントのアノテーションがどれだけブレやすいのか、を表現しているものです。人体の「背中」や「臀部」などブレやすい場合は大きな値が与えられ、多少正解点からずれた点を検出結果としても高い評価値とします。逆に人体の「目」のような場合は小さな値が与えられ、少しのズレで評価値がすぐ減衰するようになります。COCO datasetでは複数人により同じ画像をアノテーションし、その結果から算出した値をκとして用いています。 したがって、COCOと異なる独自データセットで、画像ごとのアノテーションが一つのみの場合には妥当な定数κを定めることは難しいです。ただ、平均適合率はあくまでもそのデータセット内の相対的な精度を表すだけであるため、κはそれほど厳密な値でなくとも現実には問題ないというのが筆者の考えです。ただ、PCKなどの他の指標の方が独自データセットには向いているかもしれません。 非人体キーポイント検出の具体例 ここまでデータの準備からモデルの学習・評価までを説明してきました。次に、具体的に非人体へのキーポイント検出を行った例の一部ご紹介していきます。 データセットとキーポイント定義 今回は現実の業務でもありうる”動画のみ取得できる”状況を想定し、「 RoboTurk 」というスタンフォード大が公開しているロボットアームの操作データセットを使用しました。本来は強化学習等のタスクのために使われるものですが、今回はデータセットに同梱されているロボットアームの動作のRGB動画のみを使用しました。 キーポイントの定義は図1の通り設定しました。筆者はロボットアームについては全くの初心者であるため、適切な定義ではないかもしれませんがご容赦ください。 アノテーションについては90秒ほどの動画を2,697枚の静止画に分解し、このうちロボットアームが映っている2,564枚にアノテーションを行いました。またテストデータとして、アノテーションしていない30秒ほどの動画より分解した926枚の静止画を用いました。 図1 今回設定したキーポイント定義 モデルの学習 モデルについては 前回コラム で紹介したもののうちMask R-CNNとHigherHRNetの2種類を試しました。実装については、前者は著者公式実装の流れを汲むDetectron2、後者は著者公式実装を用いています。 Detectron2はFacebook AI製であり、Mask R-CNNのみならず多数の画像認識モデルを切り替えて使えるシステムであることから、設定ファイルを適切に設定するのみで利用できます。一方でHigherHRNetは前述の通り研究用データセットに特化している実装となっており、容易に独自データセットには適用できない実装となっています。そのため入力データセットに対応するための拡張や推論画像の出力機能などに手を加えています。 学習にはアノテーションした画像中80%の2,052枚を使用し、残りは定量評価用としました。NVIDIA T4×2の環境で100エポックほど学習したところ、いずれのモデルも約4時間の学習時間となりました。独自データセットを使っていることもあり、細かな学習パラメータやモデルの定量評価結果については割愛させて頂きます。 推論結果 図2に推論結果を示します。図の左列がMask R-CNNによる出力結果、右列がHigherHRNetによる出力結果です。Mask R-CNNの場合はモデルの仕組み上物体検出も同時に行われるため、物体検出結果も表示しています。検出閾値のチューニング次第で改善の余地がありますが、主観的な評価をすると全体的にMask R-CNNは比較的検出誤りが目立ち、HigherHRNetは検出された結果はかなり妥当性が高いものの、検出漏れが多少目立つという結果になりました。 図2 Mask R-CNN(左)とHigherHRNet(右)による出力結果の一例 まとめ このコラムではあまり応用例が公開されていない、非人体キーポイント検出について、最新モデルへの適用実例とともに紹介してきました。キーポイント検出の理論的な面だけを見ると人体と非人体では違いはほとんどないものの、いざ実際にデータセット作成から推論までを行ってみると様々な障壁にぶつかります。そのため、人体以上にスモールスタートによるノウハウ構築が重要になるはずです。 コラム執筆者 機械学習エンジニア 濱本 雅史 筑波大学大学院 システム情報工学研究科 博士後期課程修了。博士(工学)。在学中にデータマイニング・テキストマイニングの研究に従事。2008年よりエンジニアとして自然言語処理の研究開発を6年半経験。2015年よりBPM/EAIミドルウェアの製品導入コンサルタントを3年半経験。2018年10月よりLaboro.AIに参画。日本データベース学会 正会員。 その他の執筆コラム ・ “木を見て森を見る”ように。「キーポイント検出」を解説
アバター
今、『AI戦略2019』を振り返る。企業のあるべき姿 2020.12.4 概 要 政府が2019年に発表した『AI戦略2019』。今後日本がAI産業で世界をリードしていくことを目的に、AI人材を教育するための教育改革や技術体系を確立するための仕組みが戦略目標として定められました。国を揚げてAIの競争力強化に取り組む中、企業がAIを取り入れる際にはどのような点に注意する必要があるでしょうか。 今回のコラムでは、AI戦略2019の概要、またそれに大きく関わるデジタル庁の概要について現在分かっていることをはじめ、企業がAIを導入する際に押さえたいポイントをご紹介します。 目 次 ・ AI戦略2019とは  ・ 4つの戦略目標の概要   ・ 戦略目標① 人材の育成   ・ 戦略目標② 産業競争力の強化   ・ 戦略目標③ 技術体系の確立   ・ 戦略目標④ 国際的視点  ・ AI人材の教育改革  ・ Society 5.0とは ・ AI戦略にも関わる「デジタル庁」  ・ デジタル庁とは  ・ デジタル庁の役割   ・ 国と自治体システム統一   ・ マイナンバーカード   ・ 行政手続きのオンライン化   ・ 医療および教育分野の規制緩和 ・ AI導入企業が押さえるべきポイント  ・ 社会実装は日本企業の強み  ・ AI採用に行き詰まる障壁を理解する ・ テクノロジーとビジネスをつなぐ AI戦略2019とは AI戦略2019は、AIにまつわる教育改革を始め、日本におけるAIの課題を解決し成長していくための基本指針として定められました。中心となる理念として、以下の3つが掲げられています。 ・人間の尊厳の尊重(Dignity) ・多様な人々が多様な幸せを追求(Diversity & Inclusion) ・持続可能(Sustainability) この3つの理念を中心に、AI戦略2019では4つの具体的な戦略目標が設定されています。 出典: 首相官邸 イノベーション政策強化推進のための有識者会議「AI戦略」(AI戦略実行会議) 4つの戦略目標の概要 戦略目標① 人材の育成 我が国が、人口比ベースで、世界で最もAI時代に対応した人材の育成を行い、世界から人材を呼び込む国となること。さらに、それを持続的に実現するための仕組みが構築されること 人材育成に関するこの戦略目標では、  ・AI研究を行う人材  ・AIを産業に応用する人材  ・中小事業所で応用を実現する人材  ・AIにより新たなビジネス創出を行う人材 などのカテゴリーでAI人材の数を増やしていくため、その育成や海外からの呼び込みに向けた持続的な仕組みの構築が目指されています。 高校や大学・高専はもちろん、小中学校からAIに関するカリキュラムを見直す大規模な改革案が策定され、例えば、すべての高校生が卒業までに数理・データサイエンス・AIの基礎的なリテラシーを習得することが目指されるほか、大学・高専でも文理問わず数理・データサイエンス・AIの初級レベルを履修できるようにカリキュラムを見直すなどが示されています。 社会人の再教育やエキスパートを育成するための高度な教育環境の整備も目標として設定されており、日本全体でAIリテラシーをベースにした環境に移行させようとしていることがわかります。 戦略目標② 産業競争力の強化 我が国が、実世界産業におけるAIの応用でトップ・ランナーとなり、産業競争力の強化が実現されること SNSや検索サービスなどサイバースペースを舞台とする産業に比べて、医療、農業や物流、製造設備など物理的実世界で価値を提供する産業(実世界産業)には、まだ系統的に取得されていない多くの情報が存在します。 これら分野でAIの活用を進め、産業競争力の向上と、日本の産業が世界のトップランナーとして地位を確立することが目指されています。さらには世界規模でのSDGs達成に貢献することが示されています。 戦略目標③ 技術体系の確立 我が国で、「多様性を内包した持続可能な社会」を実現するための一連の技術体系が確立され、それらを運用するための仕組みが実現されること 「技術体系」は、先の3つの理念を実現するための一連の技術体系を確立・運用していくための仕組みを作っていくことを目指した戦略目標だと言えます。女性や外国人、高齢者など多様な背景を持つ人々が多様なライフスタイルを実現し、一人一人が具体的にメリットを享受できることを目指して、AI関連の技術体系を確立とそのための制度作りを進めていくことが挙げられています。 戦略目標④ 国際的視点 我が国がリーダーシップを取って、AI分野の国際的な研究・教育・社会基盤ネットワークを構築し、 AIの研究開発、人材育成、SDGs の達成などを加速すること AIの国際的な研究・教育において日本が世界をリードし、社会基盤ネットワークを構築していくことに関する戦略目標です。AI関連の人材育成や産業展開は国内で完結させず、国際的な視点で進めていくということが目指されています。 AI人材の教育改革 AI戦略2019で最も重要な項目の1つが、AI人材を輩出していくための教育改革です。AI戦略2019では、AIやデータサイエンスを理解して各専門分野で活用できる人材を年間約25万人、AIやデータサイエンスを駆使して国際的に活躍できるエキスパート人材を年間約2,000人輩出することなどを目標に定めています。 そのための取り組みは年代別に策定されており、教育改革は小中学校から始まります。例えば、小中学校ではSTEM教育のモデルプランを全国展開するなどして理数分野への興味関心を向上させ、高校ではAIを活用するための確率・統計などの分野やAIの基礎を実習授業で教育していくとしています。 Society 5.0とは Society 5.0は、日本が標榜する科学技術基本計画です。AI戦略2019は、Society 5.0を実現することを目的の1つとしています。 Society 5.0は、現実空間(フィジカル空間)と仮想空間(サイバー空間)を高度に融合させるシステムにより経済発展と社会的課題の解決を目指すもので、AIを始めとしたテクノロジーと人間や自然が共存しながら持続していく社会を指し他概念です。 現在のSociety 4.0が抱える多様な課題を、最新技術を活用することで克服し、社会の変革を通じて日本が目指すべき未来社会の姿として掲げられました。 解決が期待されている具体的な課題としては、  ・持続可能な産業化の促進、人手不足  ・食料の増産やロス  ・温室効果ガス  ・高齢化に伴う社会コスト  ・地域間の格差 などが挙げられています。 AI戦略にも関わる「デジタル庁」 AI戦略2019にも大きく関わる最近のトピックとして、菅内閣が設立を目指す「デジタル庁」があります。 デジタル庁とは デジタル庁は、各省庁の業務や手続きをデジタル化していくための司令塔として機能する予定の新しい庁です。当初は2022年発足と発表されていましたが、新型コロナウイルスの対策でデジタル化が進んでいないことによる対応や手続きの遅れもあり、菅政権発足後、優先的に設立準備が進められているとされています。 デジタル庁の役割 各省庁のデジタル化を推進していくことがデジタル庁の大きな役割ですが、行政手続きをスムーズにし、国民の生活を改善するために行政手続き全般のデジタル化なども推進していくことが大きな役割です。具体的には、以下の案件を推進していくとされています。 国と自治体システム統一 現時点では各省庁のデジタル化の度合いはバラバラであり、導入されているシステムもバラバラです。デジタル庁の役目としてはこれらを統一し、自治体のシステムも一括管理できるよう調整していくとされています。 マイナンバーカード 政府が普及を目指しているマイナンバーカードについても、デジタル庁によるデジタル化が進められるとされています。具体的には、保険証や運転免許証をマイナンバーカードに統合することを目指しています。予定では、2021年3月からマイナンバーカードを保険証として使用できるようになり、2022年にマイナンバーカードの機能をスマートフォンに搭載し、2026年に運転免許証とマイナンバーカードを一体化するとされています。 行政手続きのオンライン化 行政手続きの多くは所定の窓口へ行き、書類を作成して提出する必要があります。こういった行政手続きをオンライン化し、利便性を高めていくこともデジタル庁の役割とされています。 医療および教育分野の規制緩和 さまざまな分野でAIを始めとする技術が活用されていますが、医療や教育の分野では規制が強い面もあり、利便性の高いサービスが開発されにくい現状があります。新型コロナウイルスの感染拡大により、3密を避けて診療を受けられるオンライン診療なども話題になりましたが、デジタル庁ではこのような規制を緩和していくことも目指されています。 AI導入企業が押さえるべきポイント AI戦略2019により今後、国内でAI人材の育成やAI産業の活用が進んでいくと考えられる中で、企業がAIを導入したいと考えたとき、どのようなポイントを押さえておくべきでしょうか。 社会実装は日本企業の強み AI戦略2019にも書かれていることですが、モノづくり大国とも呼ばれる日本では、とりわけ実世界産業の領域が世界的にみても存在感が大きいことが特徴にあります。そのため、AI技術の応用(AI for Real World)とインクルージョン(AI for Inclusion)の実現では、世界に比べても優位性を発揮することが期待されています。 学術研究や研究開発分野ではアメリカや中国に少なから後塵を拝している部分がありますが、実世界産業への応用、つまり社会実装でどれだけ力を発揮できるかが、日本企業にとっては重要な点だと言えます。 AI採用に行き詰まる障壁を理解する この際に課題となるのが、戦略目標にも掲げられているAI人材の壁です。 それを表すように、ガートナーが行った調査によると、2019年から2020年の間にAIを導入済みの企業の数は増えているものの、2019年には「1年以内に導入する」としていた企業の多くが導入に至っていない現状があり、従業員のスキル不足やAIによるメリットの理解が不十分であることが障壁になっていると分析されています。 企業、とくに経営層にとっては、AI人材の育成、採用、海外からの呼び込みといった取り組みにより、社内のAIリテラシーを向上させることが今後の成否を握るはずです。この際、AI技術そのものの知識にも増して、それ以上にビジネス実装に関するノウハウがより重要になってくることには注意が必要です。 テクノロジーとビジネスをつなぐ AI戦略2019が本当に実現されていくかは、私たち日本企業の今後の努力にかかっていると言えます。AIが社会システムの多くのシーンで用いられていくことは間違いありません。AIを活用した業務改善やビジネス創出、DXの推進に挑んでいくことは、全ての企業にとっての重要取り組み事項と言えるでしょう。 とは言え、上述の通り、自社のリソースのみでAIを導入することには限界があるケースがほとんどです。現在では、一社単独ではなくAIベンダーと共に課題解決を目指すことがスタンダードになってきています。単なる“AI開発”ではなく、ちゃんと“AIというテクノロジーと、ビジネスをつなぐ”ことを目指す場合には、Laboro.AIにご相談いただけましたら幸いです。
アバター
AI精度に不可欠な評価基準の検討 2020.11.26 株式会社Laboro.AI 代表取締役CTO 藤原 弘将 概 要 AIは新しい技術を使って開発すれば良いというものではなく、精度・性能を正しく評価することが当然ながら必要になります。この際、不適切な評価基準でAIの性能を測ってしまうと、やはり意味のあるツールとして使えることはありません。異常検知を例に、「精度9割」 という評価基準について考えてみましょう。 (*本コラムは、日刊工業新聞の連載『AI・ロボット転機予報part2』へ寄稿した内容を再編集したものです。) 目 次 ・ PoCを軽んじてしまう現状 ・ 「9割」とは一体どのような状態なのか? ・ 達成後のイメージを共有する PoCを軽んじてしまう現状 AIの導入プロジェクトでは、本格的なシステム開発の前にPoC(概念実証)と呼ばれるフェーズがあり、この段階でAIが本当に役に立つのかを検証することが通例です。PoCでの目標の決め方が非常に重要であることは言うまでもありませんが、意外にも軽く扱われることが多いのが実際です。 例として製品の写真から不良品を検知する問題を考えてみましょう。ある工場では、1日に1万個生産する製品のうち、不良品が10個程度発生するとします。精度目標を決めようとして、AIベンダーである私たちが工場の担当者の方に対して「どの程度の精度が出ると実用化できそうでしょうか」と問いかけると、大抵の場合「8〜9割」という答えが返ってきます。 おそらく多くの人は、「何かがそれなりにできている」という感覚から、こうした数字を連想するのだと思います。ですが、ここに大きな落とし穴があります。この9割を達成するということは、一体どのような状態で、業務上どのような効果が見込めるでしょうか。この点を考えずに曖昧に「9割」とだけ決めてしまうと、後悔することになりかねません。 「9割」とは一体どのような状態なのか? まず、9割の定義として「1万個のうち、何個を正しく判定したか」という基準が思いつきます。ですが、不良品が10個しかないこのケースでは、とりあえず全てを良品だと判定すれば、9,990個は正解することになり、正解率は99.9%になります。確かに目標は達成していますが、不良品の存在を無視したとも言えるこのAIが何の役にも立たないことは言うまでもありません。 すると担当者から「不良品を全部漏らしては意味がない。不良品10個のうち9個は検出して欲しいんだよ」という注文が出てきます。つまり、良品のうち9割を正しく判定し、かつ不良品のうち9割を正しく判定するということです。前者を特異度、後者を感度と呼びますが、この特異度と感度が両方同時に9割を達成するというのはどういう状態でしょうか。この裏を返せば、9,990個の良品のうち、1割の999個を誤って不良品と判定することになります。 そもそも不良品は10個しかないので、不良品と判定したものの中で実際に不良品である製品の割合は約1%しかありません(この割合を適合率と呼びます)。要は、AIが判定した不良品のうち、約99%は実際には良品ということになります。このケースでも、AIはおそらく使い物になりません。 こうなると次は、「特異度ではなく、適合率9割を目指しましょう」という話になります。ですが、これは特異度としては良品のうち99.9%を正しく良品と判断できている状態で、一般論として相当高い精度が要求されることになります。 達成後のイメージを共有する 仮に今回の問題が、技術的に99.99%の精度が出せるものではなかったとしても、こうした検討が事前にできていれば、そもそも解くべき問題設定を変えることも選択としてできたはずです。しかし、PoCフェーズに入った後にその評価をする中で上記のような問題が明らかになるケースや、さらにひどい場合には、業務に組み込んだ後に発覚するケースも想定され、その場合には大きな損害を被ることになりかねません。 もちろん、問題の種類が異なれば、異なる評価基準が存在し、それぞれに個別の落とし穴があります。PoCに入る前の時点で、どのような計算で表される評価基準が適切かを関係者間で合意すること、そして目標が達成されたときに業務がどう変わっているかをイメージすることが重要です。 コラム執筆者 代表取締役CTO 藤原 弘将 京都大学大学院修了 博士(情報学)。2007年、産業技術総合研究所にパーマネント型の研究員として入所。機械学習を用いた音声/音楽の自動理解の研究に従事。開発した特許技術を様々な企業にライセンス提供し、ライセンス先企業の技術顧問も務める。2012年、ボストンコンサルティンググループに入社。ビッグデータ活用領域を中心に多数業界・テーマのプロジェクトに従事。AI系のスタートアップ企業を経て、2016年に株式会社Laboro.AIを創業。代表取締役CTOとして技術開発をリード。 その他の執筆コラム ・ AIで「やりたいこと」とデータは、両輪で議論する ・ “AI”のギャップが、ビジネスへの導入を妨げる ・ AIは不完全。本当に必要な「AI人材」の役割とは ・ ディープラーニングによる一般物体認識とビジネス応用<上>画像分類 ・ ディープラーニングによる一般物体認識とビジネス応用<下>物体検出
アバター
TV 録画から自動構築した音声コーパス 『LaboroTVSpeech』を公開 2020.11.19 株式会社Laboro.AI 代表取締役CTO 藤原 弘将 機械学習エンジニア 安藤 慎太郎(現:東京大学大学院工学系研究科) 概 要 Laboro.AIは、 当社の研究開発として、TV録画から長時間音声と字幕テキストを抽出して音声コーパスを自動構築する独自システムを用い、約2,000時間に及ぶ音声データから構築した日本語音声コーパス『LaboroTVSpeech(ラボロティービースピーチ)』を開発し、学術研究用に無償公開いたしました。 こちらのコラムでは、その概要についてご紹介いたします。 なお、LaboroTVSpeechのご利用については、 こちら でご確認いただけます。 目 次 ・ 背景 − これまでの音声認識モデルと音声コーパス ・ LaboroTVSpeechについて ・ LaboroTVSpeech比較実験について ・ LaboroTVSpeechの今後の可能性 ・ LaboroTVSpeechのご利用について ・ 公開・更新情報 背景 − これまでの音声認識モデルと音声コーパス 一般的に音声認識モデルの性能は、その学習データの量に大きく左右され、高品質な音声認識システムを構築するためには大規模な音声コーパスが必要とされています。そのため、英語モデルの開発の場合には、商用目的では数千〜数万時間を超える音声データが用いられることもあり、研究目的でもSwitchBoard-Fisherデータセット(約2,000時間)やLibriSpeech(約960時間)などの大規模な音声コーパスが公開されています。 一方、日本語版の音声コーパスについては、研究用として代表的な 日本語話し言葉コーパス(CSJ) で約600時間、 新聞記事読み上げ音声コーパス(JNAS) で約90時間など、英語版と比較すると十分なデータ量に基づく音声コーパスが存在しているとは必ずしも言えないのが現状です。 この背景としては、音声コーパスの構築に際して書き起こしや録音作業など、人手による手間やコストがかかることが理由として挙げられます。その対応として、これまで人手の作業を伴わず自動的にデータ収集を行う手法が模索されてきました。その一つの方法として挙げられるのが、テレビ放送を用いた音声コーパスの自動構築です。多くのテレビ番組には字幕情報が付与されているため、音声と字幕のテキスト情報を時間的に紐付けることで、コーパスを自動構築できる可能性が示されてきました。 しかしながら、字幕は視聴者にとっての読みやすさを優先して作成されているため、必ずしもテレビ音声の正確な書き起こしにはなっていません。そのため、音声コーパス構築の自動化を行うためには、以下をはじめとする点に留意する必要があり、その実現ハードルは高いのが実際です。 ●字幕の表示時間と実際に音声が発生される時間にはズレがあり、特にニュースなどの生放送番組では音声が発せられてから字幕が表示されるまで10秒以上の遅れを伴う場合がある。 ●コマーシャルなど、全ての音声に字幕があるわけではなく、また字幕が実際の発話とは異なる形で整形されたり短縮されたりすることがあり、忠実な書き起こしとは限らない。 ●バラエティ番組などでは発話の一部が字幕ではなく,いわゆるテロップとして映像上に付与される場合があるが、テロップはテキストとして情報を取得できないため、データとして取得される字幕テキスト上では複数の単語や文章が不規則に削除されているような状態となる。 LaboroTVSpeechについて 今般当社で構築した音声コーパスLaboroTVSpeechは、B-CASカードによるアクセス制限がないワンセグ放送を利用し、2020年2月〜9月にかけて放送された、12ジャンル(デジタル放送規格の番組種別)計9,142番組のテレビ番組の録画データを用いており、2,049時間に及ぶ音声データから構成された大規模音声コーパスです。当社では、LaboroTVSpeechをアカデミア領域でのAI技術研究に広く活用いただくことを目的に、学術研究用に無償で公開することといたしました。 LaboroTVSpeechを構成する番組ジャンルと音声の長さ LaboroTVSpeechは、当社が独自開発したシステムにより構築しています。具体的には、テレビ番組の長時間の音声データと、その不完全な書き起こしである字幕データの時間的な対応関係を抽出する手法である準教師付きデコーディング(lightly-supervised decoding)と呼ばれる手法をベースとしています。これにより、本来であればテレビ番組のデータから音声と字幕がセットになって抽出されるべきところ、先のような何らかの問題で対応した情報として取得できなかった場合に、準教師付デコーディングによる音声と字幕の対応関係の抽出を繰り返し行うことで、一度対応が取れなかった区間からも可能な限りデータ抽出を行う仕組みを採用しています。 なお、LaboroTVSpeechについては、本年12月2日(水)・3日(木)に開催の(一社)情報処理学会 第246回自然言語処理・第134回音声言語情報処理合同研究発表会 にて報告いたしました。 予稿「 テレビ録画とその字幕を利用した大規模日本語音声コーパス の構築 」は こちら からご覧いただけます。 LaboroTVSpeech比較実験について LaboroTVSpeechを用いたモデルの音声認識の性能を確認するため、日本語のTEDxを用いて構築した独自の音声認識システム評価用データセット ※ を用意した上で、従来の日本語音声コーパスCSJで学習されたモデル及び、国内外の主要なクラウド音声認識APIとの比較実験を行いました。 LaboroTVSpeechを使用したモデルに関する実験では、音声認識のツールキットとして、従来型のDNN-HMMハイブリッド方式を採用する Kaldi と最先端のEnd-to-End方式を採用する ESPnet の2種類を用いました。 その結果、ESPnetを用いた場合で、誤り認識率13.0% ※ を達成し、当社開発モデルが従来の研究用日本語音声コーパスで構築したモデルや、国内外の主要なクラウド音声認識APIを凌ぐ誤認識率を実現しました。 ※ Youtube上のプレイリスト「TEDx talks in Jpanaese」に含まれる動画から音声と字幕データを取得したもの。 ※ https://github.com/espnet/espnet/tree/master/egs2/laborotv/asr1 日本語TEDコーパスに対する誤認識率(CER:Character Error Rate)の比較(※) ※ クラウド音声認識API の評価は、全てデフォルトの音響モデル及び言語モデルを用いて実施しています。上記の結果は、実環境での音声認識システムの性能とは異なる場合があります。 ※ LaboroTVSpeechを用いた実験においては、言語モデルはLaboroTVSpeechに含まれる書き起こしと OSCARコーパス で学習した言語モデルを使用しています。実験条件の詳細は 第246回自然言語処理・第134回音声言語情報処理合同研究発表会の予稿「 テレビ録画とその字幕を利用した大規模日本語音声コーパス の構築 」をご覧下さい。 LaboroTVSpeechの今後の可能性 LaboroTVSpeechの利点は、テレビ放送をデータソースとしていることからデータ量を絶えず増加させることが可能な点にあります。当社ではLaboroTVSpeechのデータ量を増強するために定期的なアップデートを実施し、公開することで、国内におけるAI音声認識分野の技術力向上に寄与してまいります。 LaboroTVSpeechのご利用について LaboroTVSpeechに含まれる音声及びテキストデータの権利は、元のテレビ放送の著作権者に帰属していますが、著作権法30条の4に基づき、情報解析等の用途のために、大学等の公的学術研究機関における非商用利用を対象に無償で公開いたします。ただし、元のテレビ番組の音声を再構成し鑑賞する事を防ぐために、発話単位でランダムに並び替えられており、かつ番組名や放送局等の付加情報は含まれておりません。 配布対象 無償配布の対象としては、下記のような機関を想定しています。 ●国立大学、公立大学、私立大学、高等専門学校 ●国立研究開発法人(産業技術総合研究所、情報通信研究機構、理化学研究所、等) ●地方自治体等が所管する研究機関 ●その他公的な性質を持つ研究機関(公益法人等) ただし、上記に該当する機関であっても、営利企業等からの提供された資金で運営されているプロジェクトや、無償配布対象外の機関との共同研究プロジェクトでの利用は、無償配布の対象外となりますのでご注意ください。 配布の流れ ご利用にあたっては、 こちらのお問い合わせフォーム よりご連絡ください。その際、LaboroTVSpeechの無償利用の申し込みである事を明記いただいた上で、下記の点を記載ください。 ●所属機関 ●申込担当者氏名・所属部署・役職・メールアドレス ●(申請者が学生等の場合)申込責任者氏名・所属部署・役職・メールアドレス 申込書を電子契約サービスであるクラウドサインを通じて、指定のメールアドレスに送付させていただきますので、必要事項を記入の上、申し込みをお願いします。弊社側で申込書を審査した上で、申込書に記載のメールアドレスにコーパスをダウンロードするURLを記載したメールをお送りいたします。 なお、申込書の名義は、原則として教員や職員の方でお願いしております。学生等の方からの申込の場合は、申込書の記入は学生の方でも結構ですが、申込者の欄には教員の名前を記入頂き、教員の方のメールアドレスに申込書の承認の依頼をお送りさせて頂きます。 配布には、フォームより問い合わせをいただいてから、3週間程度の時間がかかりますことをご了承ください。 営利企業での使用について 営利企業における研究開発用途や商用目的での利用をご希望の場合は、同じく こちらのお問い合わせフォーム からご相談ください。 学習スクリプトの公開 John Hopkins大学が開発する音声認識ツールキットである Kaldi を用いて、LaboroTVSpeech音声認識モデルを学習するためのスクリプトを githubページ にて公開しております。 また、ESPnetを用いて音声認識モデルを学習するためのスクリプトは、ESPnetの公式レポジトリの レシピ を参照ください。 謝辞 本研究開発は、株式会社NTTPCコミュニケーションズ様のInnovationLABから GPUリソースの支援を受け実施いたしました。 公開・更新情報 2020年11月19日 LaboroTVSpeechを公開しました。 2020年11月19日 プレスリリースいたしました。 2020年12月 2日 情報処理学会 第246回自然言語処理・第134回音声言語情報処理合同研究発表会にて報告を行いました。 2020年12月 2日 予稿をアップしました。  2020年12月 9日 ESPnetを用いた実験結果を更新しました。 2021年 3月 4日 本件論文が情報処理学会 SLP研究会 2020年度 企業賞(Fairy Devices賞)を受賞 しました。 2021年 5月 7日 本件論文がIEEE ICASSP 2021で採択・公開されました。
アバター
AI開発の基礎。概要から開発の流れ、必要なものを解説 2020.11.11 概 要 将来的にAIを導入したいと考えていても、具体的な知識がない中で一から企画を立ち上げるのはかなり難しいことです。具体的に何から手をつけていいか分からない方も多いかもしれませんが、まずはAIとは何かについて理解し、開発に必要な事柄を整理することも重要なプロセスです。 このコラムではAIの基礎的な話から、開発の流れ、開発のために必要なもの、各スキルの学び方についてご紹介していきたいと思います。 目 次 ・ そもそもAIとは何か?  ・ AIの概要  ・ AIの種類  ・ AIとビッグデータ ・ AI開発のプロセス  ・ 1.構想フェーズ  ・ 2.PoCフェーズ  ・ 3.実装フェーズ  ・ 4.運用フェーズ ・ AI開発に必要なもの  ・ プログラミング言語  ・ 開発環境  ・ ライブラリとフレームワーク ・ AI開発の学び方 ・ まとめ そもそもAIとは何か? AIという言葉にはさまざまな捉え方があり、曖昧なイメージでは開発時に社内のチームメンバーやクライアントなどと共通のビジョンを持ちにくくなります。AIにまつわる技術も進歩が進んでいる中、現在の技術に即した理解をすることが大切です。 AIの概要 「AI(人工知能)」という言葉には共通した定義がなされてるわけではありませんが、主に「人間の知能を模した機能を持つコンピュータシステム」と捉えられています。その機能とは、具体的には分類、回帰、推論などで、AIはこれらの知能的な機能を用い、入力された情報に対してなんらかの処理を行った上で結果を出力します。 単純な数値計算やデータ処理を行うITや情報システムなど、AIではないコンピュータシステムは入力された情報に対して決められた処理しか行えませんが、AIはデータを学習することをベースに、分類や推論するよう設計された技術だと言えます。 現在のAI技術は、人間に代わるような万能コンピュータではなく、単一の機能に特化したものが大多数を占めます。AIを活用したサービスの中には複雑な処理を行うものもありますが、基本的にはそれぞれ独立したAIの機能が組み合わさって構成されています。 AIの種類 AIにはさまざまな技術があり、よく挙げられるものに「機械学習(マシンラーニング)」と「深層学習(ディープラーニング)」があります。 機械学習は、AIと呼ばれる技術領域のひとつで、大量のデータを用いてコンピュータに学習させ、その精度を増していく技術です。その学習手法には「教師あり学習」「教師なし学習」「強化学習」といったものがあり、目的に応じて用いる手法が変わってきます。また機械学習と一言で言っても、ロジスティック回帰やk-means法、サポートベクターマシンなど、具体的には様々な技術やアルゴリズムが含まれます。 一方、ディープラーニングは機械学習の技術の一つで、人間の脳内ニューロンの構造を参考にしたネットワークにより、人間による調整や判断なしにコンピュータ自身が学習を深めていくことを目指した技術です。画像認識でよく用いられる畳み込みニューラルネットワーク(CNN)、時系列データの予測などでよく使われる再帰型ニューラルネットワーク(RNN)などが、ディープラーニングの代表的なアルゴリズムです。 AIとビッグデータ AIと一緒に語られることの多い言葉として、「ビッグデータ」があります。ビッグデータは単に量の多いデータというわけではなく、量(Volume)に加えて速度(Velocity)、多様性(Variety)の3つの要素を満たしたデータとして定義されます。機械学習やディープラーニングなど、AI技術の進歩と共にビッグデータ活用の可能性が拓かれています。 ビッグデータには、例えば、SNS上の投稿、気象データ、スマートフォンに記録された行動データなどが挙げられます。もちろんこれらのデータから有用な予測結果を出力することは従来からも可能でしたが、機械学習やディープラーニングを活用することで、データに潜む特徴的なパターンを抽出し、これまでにない気づきを得るような予測も可能になってきています。 AI開発のプロセス AIを活用したシステムやサービスを開発する場合、そのプロセスは主に以下の4つのフェーズに分けられます。 1.構想フェーズ ビジネス課題に対してAIが十分な解決策となるのかを検討し、その解決に向けてどのようなAIモデルを用いれば良いかを構想するフェーズです。 AIは万能な技術では決してないため、開発しようとしているAIが本当に課題解決につながるのか、課題のうちどの領域をAIによって解決するのか、導入によって自社にメリットをもたらすのか、その構想は実現可能なのかなど、ビジネスとAIの双方の観点からの検討を行います。 2.PoCフェーズ 構想フェーズでAI開発の内容が具体的に決まったら、次はPoCフェーズへ移行します。PoC(Proof of Concept)は「コンセプト(構想)の証明」という意味で、構想フェーズで想定したAIが技術的に実現可能かどうかを実際に検証します。 AIの仮モデルとなるモックアップを開発し、機械学習やディープラーニングに必要なデータの量と質が確保できているか、期待した精度は出せるか、処理スピードは費用対効果に合っているか、出力に誤りがあった場合のオペレーションは上手く回るかなどの要素を検証します。 3.実装フェーズ PoCフェーズでその実現性が確認できたら、モックアップの開発内容をベースに最終的なシステムとして完成させる実装フェーズへ移行します。 本番環境に必要な要件を定義し、開発を進め、AIのモデルを最終化していきます。完成後にはテストを行い、問題なく動作するかどうかの検証はもちろんのこと、ビジネス上の実務オペレーションも踏まえた稼働につなげます。 4.運用フェーズ 実装フェーズの次には、そのAIを適切に運用していくための運用フェーズに移行します。システムが安定して稼働するための保守に加え、構想フェーズで設定した目標達成状況の確認を都度行い、PDCAサイクルを回していきます。 AI開発に必要なもの AI開発を始めるあたって必要なスキルや環境などには様々なものがありますが、ここでは、プログラミング言語の習得と開発環境の整備、ライブラリ・フレームワークの活用についてご紹介します。 プログラミング言語 AIを開発するにはプログラミング言語を習得し、システムを構築できるようになる必要があります。プログラミング言語にはPython、SQL、JavaScript、C++、Julia、Javaなどさまざまな種類があり、それぞれ得意な開発分野が異なりますが、AI開発ではPythonとSQLが多くのシーンで用いられています。 Pythonはより使い勝手のいいプログラミング言語であることを目指して開発された言語で、初心者でも習得のハードルが比較的低いと言われています。また、AI開発に必要な多くの機能が使用できる点もポイントです。 SQLはデータベースの構築や処理などに使用されるプログラミング言語で、AIに学習させるためのデータベースを作る際に用いられます。 また、最近ではより簡単にA Iの構築ができるツールの普及が進んでおり、コードを書くことなく操作できるツールをGUIツール(Graphical User Interface)と呼び、マウス操作で構築することも可能になっています。 開発環境 AI開発では膨大なデータを取り扱うため、システムを稼働させられるだけの開発環境も必要です。具体的には、ビッグデータを保存するためのストレージや、機械学習やディープラーニングを可能とするだけの計算能力を備えたコンピュータなどを用意する必要があります。これらの一部は、クラウドサービスによって補うことも可能です。 ライブラリとフレームワーク AIに関する基本的な機能をひとまとめにしたアプリケーションのことを、ライブラリ、あるいはフレームワークと言います。ライブラリ・フレームワークを用いることで本格的な開発をせずともAIを用いたシステムを構築がしやすくなります。代表的なライブラリ・フレームワークには、NumpyやPandas、Matplotlib、Googleが提供しているTensorFlowなどがあります。 AI開発の学び方 AI開発を学びたい場合には、独学でのスキル習得、オンラインサービスの活用、スクールの3つの選択肢があります。 AI開発が活発になっている現在では、AI関連の本も多く、初心者にも読みやすい本を見つけることもできるため、まずは独学でのスキルアップがおすすめです。インターネット上でも多くの記事が公開されているので、十分なレベルの学習が可能です。独学から始めたいという場合は、以下の記事でおすすめの本をご紹介しているので、ぜひ参考にしてください。 コラム: ビジネスパーソンが読んでおきたい、AI関連オススメ本7冊! まとめ AIはあらゆるビジネス課題を解決できる万能のツールではありませんが、多くの事例で報じられているように、活用次第でより一層の業務効率化やビジネス成果の向上、新たなビジネス知見の発見など、さまざまな恩恵を得ることが期待できる技術です。 一方で自社開発には多くの専門知識や人材が必要であり、ハードルが高いのが実際のため、開発を得意とするAIベンダーと共にプロジェクトを進めることが主流になっています。AI導入の検討が具体化した際には、当社のようなAIベンダーと相談機会を設けてみることも、プロジェクトの第一歩として非常におすすめです。
アバター
時系列データに異常発見。「時系列異常検知」とは 2020.10.20 株式会社Laboro.AI リード機械学習エンジニア 大場 孝二 概 要 気温や降水量をはじめとする気象データや交通量データなど、時間の変化に沿ってまとめられた情報は、時系列データと呼ばれます。時系列データは、時期や時間ごとの変化を捉えるため主に用いられますが、ビジネスシーンではこうした時系列情報をただ捉えるだけでなく、急激な変化や異常が起きた場合にそれを察知したり、場合によっては通知するような仕組みを検討することも重要なポイントになるはずです。 このコラムでは、こうした時系列データに表れる異常を検知するための手法「時系列異常検知」の紹介と、とくにSR法と呼ばれる手法の技術解説をしていきます。 目 次 ・ 時系列異常検知とは ・ Spectral Residual(SR法) ・ SR法の技術概要  ・ 技術解説  ・ SR法を異常検知に適用する  ・ 論文著者たちの工夫  ・ SR法のデータへの適用例 ・ いろいろなデータに対してのSR法の適用  ・ 検知できるケース  ・ 検知できないケース  ・ その他のケース ・ まとめ ・ 参考文献 時系列異常検知とは 安定していた株価が急変した、動きを保っていた機械が急におかしな動きをしだした、一定量だったSNSの投稿量が激増(炎上していた)など、「いつもと違う」で表されるような急激な変化は、私たちの身の回りでもしばしば発生します。 「時系列異常検知(Time Series Anomaly Detection)」は、その名の通り、時系列上に並べられた大量のデータから、通常とは異なる値や変化、動きを見つけ出す技術です。上の株価データや機械センサーのデータ、SNS投稿のようなトラフィックデータはその代表的な例ですが、データ上に表れる急激な変化を捉えることは、ビジネス上の危機管理や安全管理に結びつく重要な取り組みと言えるでしょう。 今回は、その時系列異常検知の手法の一つである、Spectral Residual(SR法と呼びます)を、その研究論文 Time-Series Anomaly Detection Service at Microsoft をベースにしながら紹介したいと思います。また、実際にSR法を用いてデータ分析を行い、どのようなデータだと異常を検知しやすく、また検知しにくいのかということを見ていきます。 Spectral Residual(SR法) SR法は、実はもともと画像データに対して用いられていた手法です。画像の中にある人が感じる特徴的な箇所、つまり際立った傾向がある部分を捉えるための技術としてSR法が用いられます。( 参考文献 ① ) 具体的には、SR法では2次元で表現される画像データをフーリエ空間(周波数に変換・表現した空間)で処理を行うことで、特徴を捉えます。下の図は、入力された画像イメージにSR法を適用したものです。3×3、5×5、7×7、3つのフィルター(local average)の幅での結果を示していますが、いずれでも家のある位置が強調されていることがわかります。 (出典: 参考文献① ) このSR法を時系列データに適用するということは、一次元のデータに適用するということです。先に結果を示すと以下のようになります。2次元の画像データと同じように、1次元の時系列データでも赤点の部分の異常値が強調されていることがわかります。 (出典: 参考文献② ) SR法の技術概要 以下からは、SR法の詳細について、論文” Time-Series Anomaly Detection Service at Microsoft “ に基づいて、その技術的な概要を解説していきます。 SR法によって算出される値をsaliency mapと呼びます。SR法による異常検知は、時系列データに対してSR法を適用してsaliency mapを算出、そしてsaliency mapがある閾値以上の点をanomaly(アノマリー:異常値)と判定するものです。 具体的には、時系列データから実空間データをフーリエ空間に飛ばし、フーリエ空間上で“ある処理”をした後に、実空間に逆フーリエ変換で引き戻す手法です。“ある処理”というのは、上で見たように、周りと違う周波数領域を際立たせるというもので、そうすることで実空間での特徴的な部分を際立たせることができると考えられています。 問題設定として一次元データで考えた場合の手順を、次に解説していきます。 技術解説 \(\vec{x}\ =(x_1, x_2, \cdots, x_n)\)を実空間のベクトルとします。これをフーリエ変換することで、\(\vec{f}\ =(f_1, f_2, \cdots, f_n)\)が得られます。それぞれの\(f_j\)は複素数で、\(f_j = r_j \exp(i \theta_j) (r_j, \theta_j \in \mathbb{R})\)と表現します。そして、絶対値成分である\(r_j\)を変換して\(f’_j = r’_j exp(i \theta_j) (r’_j, \theta_j \in \mathbb{R})\)を新たに作成します(\(r’_j\)を算出する式は後述)。\(\vec{f’} \ = (f’_1, f’_2, \cdots, f’_n)\)に対して逆フーリエ変換を行い、実空間に引き戻したベクトル\(\vec{x’} \ = (x’_1, x’_2, \cdots, x’_n)\)に対して絶対値成分を取り出した\(\vec{S} \ = (\|x’_1\|, \|x’_2\|, \cdots, \|x’_n\|)\)をsailency mapと呼びます。saliency map は、上で書いたとおり、\(\vec{x}\)の人間が見て「特徴的だなー」と感じる点を際立たせたものです。ここで、\(\log{r’_j}\)は、\(\log{r_j}\)に対して直近の平均を引いたもので、数式で表現すると、\(\log{r’_j} =\log{r_j} – \frac{1}{q}\sum_{i=1}^{q}{\log{r_{j+1-i}}}\)です。\(q\)はハイパーパラメーターで、local average を算出する際に使用するデータ数です。 この手順をまとめると、次のようになります。 1. フーリエ変換 ・  \(\mathcal{F}:\vec{x}\ = (x_1, x_2, \cdots, x_n) \mapsto \vec{f}\ = (f_1, f_2, \cdots, f_n)\) ・  \(f_j = r_j \exp(i \theta_j) (r_j, \theta_j \in \mathbb{R})\) 2. フーリエ空間での処理 ・  \(\vec{f}\ = (f_1, f_2, \cdots, f_n) \mapsto \vec{f’}\ = (f’_1, f’_2, \cdots, f’_n)\) ・  \(f’_j = r’_j exp(i \theta_j) (r’_j, \theta_j \in \mathbb{R})\) ・  \(\log{r’_j} =\log{r_j} – \frac{1}{q}\sum_{i=1}^{q}{\log{r_{j+1-i}}}\) 3. 逆フーリエ変換 ・ \(\mathcal{F}^{-1}:\vec{f’}\ = (f’_1, f’_2, \cdots, f’_n) \mapsto \vec{x’}\ = (x’_1, x’_2, \cdots, x’_n)\) ・  \(\vec{S}\ = (\|x’_1\|, \|x’_2\|, \cdots, \|x’_n\|)\) ・  \(\vec{S}\) : saliency map なお、 \(f’_j = exp(i \theta_j)\) としてsaliency map を求めるバージョンも存在しており、ほぼ同じsaliency map が得られることが知られています( 参考文献③ )。計算負荷的には、\(f’_j = exp(i \theta_j)\)の方が軽く、論文では、\(f’_j = r’_j exp(i \theta_j) (r’_j, \theta_j \in \mathbb{R})\) の方を用いています。 SR法を異常検知に適用する 上の手順で求めた saliency map に対してスコアを算出し、anomalyを判定します。具体的には、SRのスコアを \(\frac{S_i – \overline{S_i}}{\overline{S_i}}\) と定義し、この値が閾値\(\tau\) を超えた場合にanomalyと判定します。ここで\(S_i\) は \(x_i\) と同じ位置に対応する saliency map で、\(\overline{S_i} =  \frac{1}{z}\sum_{j=1}^{z}{S_{i+1-j}}\) です。\(\tau\) はanomaly判定の閾値で、\(z\) はlocal average を算出する際に使用するデータ数です。 論文著者たちの工夫 詳しい方ならご存知のところですが、フーリエ変換はデータ端の影響を強く受けます。SR法でもデータ端の影響を受けてしまい、端のsaliency mapに意図しないピークが出る傾向があります。下の図は、左が時系列データで、右がそのデータにSR法を適用したものです。元々の時系列データでは特に異常がなかった端が、saliency map では両端の値が大きくなっているのがわかります。 saliency map のデータ端の意図しないピークのケアのために、著者たちは以下のように元々の時系列データに値を追加する工夫を行っています。\(\vec{x} \ = (x_1, x_2, \cdots, x_n)\)に対して、右端に\(\kappa\)個のデータを追加し、新しく\(\vec{\hat{x}}\ = (x_1, x_2, \cdots, x_n, x_{n+1}, \cdots, , x_{n+\kappa})\)を作成します。ここで、\(x_{n+1} = x_{n+2} = \cdots = x_{n+\kappa}\)で、算出式は以下です。 \(\overline{g}\ = \frac{1}{m}\sum_{i=1}^{m} g(x_n, x_{n-i})\) \(x_{n+1} = x_{n-m+1} + \overline{g} \cdot m\) ここで\(g(x_i, x_j)\)は傾きで、 \(g(x_i, x_j) = \frac{x_i – x_j}{i – j}\)です。 \(\vec{\hat{x}} \)に対して、saliency map: \(\vec{\hat{S}}\ = (\hat{S}_1, \hat{S}_2, \cdots, \hat{S}_n, \cdots, \hat{S}_{n+\kappa})\)を計算し、\((\hat{S}_1, \hat{S}_2, \cdots, \hat{S}_n)\)を取り出すと、データ補間を行わなかった場合よりもキレイなsaliency map を取得できることが実験的に明らかになっています。 SR法のデータへの適用例 上に示した時系列データに対して、SR法を用いてデータ補間を行わなかった場合(\(\kappa=0, m=0\))、データ補間を行なった場合(\(\kappa=5, m=5\))の2通りで、saliency mapとscore を算出した結果が下の図です。両者でその他のハイパーパラメーターは共通のものを用いており、\(\log{r’_i}\)を求める際のlocal average の幅 \(q\)は3, scoreを求める際のlocal average の幅 \(z\)は5としています。また、窓幅はデータ区間そのもの、つまり全データを含む幅としています。 この図からわかることは、2点あります。 1. anomaly点に対して、saliency map、 score の値が大きくなっていて、anomalyを捉えることができている。 2. データ補間の有効性が確認できる。つまり、データ補間を行った\(\kappa=5, m=5\)では、saliency mapの右端の値のピークが消えている。それに付随する形で、scoreの右端のピークも消えている。 (※saliency mapの左端のピークを消したい場合は、データ補間を左端にも行えば良い。ただし、score を求める処理の性質上、scoreの左端のピークは消えるのでデータ補間を行う必要はない。) いろいろなデータに対してのSR法の適用 今回、YAHOO RESERCHの時系列異常検知用のデータセット( 参考文献④ ) の全データに対してSR法の適用を試みました。その中からいくつか抜粋して、異常として検知できそうなデータにどのような傾向があるかを定性的に把握してみたいと思います。 下図の見方:各段の、 ・左の図は、YAHOO データセットの時系列データで、黒丸がanomalyとして定義されたもの ・中央の図は、saliency mapデータ ・右の図は、saliency mapを求める際に\(f’_j = \exp(i \theta_j)\)としたバージョンでのsaliency map 右の図のsaliency mapの計算は、計算負荷の観点から軽量化したものですが、中央のものと大きく違わないことがわかります。 検知できるケース ・周辺の点に対して、飛び出しているケース 検知できないケース ・なだらかに変化しているような異常点や異常点が局在するケース t=500〜600にある異常点を検出できていない t = 900 ~1000 の異常点(の集合)を検知できていない その他のケース 一方、目視では異常だと思えない異常点の検知がSR法だとできるケースもあります。 t= 1000~1500にある異常点は目視では気づけないが、SR法だとわかる。 まとめ 今回は、時系列データからの特徴や異常を検出するための技術、時系列異常検知のうち、SR法を解説しました。 SR法は単一の閾値を用いていましたが、より柔軟な形で異常検出を行うことを目指したSR-CNNというモデルも開発されています。SR-CNNは、その名前の通り、SRにCNN(Convolutional Neural Network:畳み込みニューラルネットワーク)を組み合わせたモデルです。 SR-CNNのアーキテクチャ SR-CNNにはチューニングの難しさなど、まだ課題が感じられる部分もあります。ですが、時系列異常検知の技術は、冒頭で紹介した気象データや株価、センサー領域などだけでなく、そのほか多くのビジネス領域での活用可能性をもつ技術です。今後ますますの改善と進歩が進み、様々なビジネスシーンで導入されていくことが期待されます。 参考文献 ① Saliency detection: A spectral residual approach ② Time-Series Anomaly Detection Service at Microsoft ③ Spatio-temporal saliency detection using phase spectrum of quaternion Fourier transform ④YAHOO RESEARCHデータセット A Benchmark Dataset for Time Series Anomaly Detection コラム執筆者 機械学習エンジニア 大場 孝二 東京大学大学院 工学系研究科物理工学専攻 博士前期課程修了。修士(工学)。在学中は、物理の第一原理計算を用いて物質の性質の研究を行う。卒業後、証券会社のクオンツとして金利・為替系のデリバティブのプライシングモデルの作成・検証およびリスク計算業務を担当。その後、車両データを用いたデータ分析業務とサービス企画や仮説検証(PoC)に従事。2020年2月よりLaboro.AIに参画。
アバター