TECH PLAY

Laboro.AI

Laboro.AI の技術ブログ

146

機械学習の活用事例―機械学習の基本から活用方法まで通しで解説― 2020.11.12公開 2024.10.28更新 株式会社Laboro.AI 執行役員 マーケティング部長 和田 崇 リードマーケター 熊谷勇一 概 要 人間の知能を模したコンピュータ技術と言われるAIの領域のうち、特に知られる技術が機械学習です。機械学習はコンピュータ自身が予測や分類などのパターンを学習していく技術で、すでにさまざまなサービスとして世の中で活用されています。機械学習について理解を深めながら、実際に私たちの生活で使われている事例についても紹介します。 目 次 ・ 機械学習の基礎知識  ・ 機械学習とは  ・ 機械学習が普及してきた背景  ・ 機械学習で解決できる課題   ・ 画像認識の活用   ・ 音声認識の活用   ・ 分析・予測   ・ レコメンデーション ・ 機械学習とディープラーニングの違い ・ 機械学習の手法   ・ 機械学習の手法:教師あり学習   ・ 機械学習の手法:教師なし学習   ・ 機械学習の手法:半教師あり学習   ・ 機械学習の手法:強化学習 ・ 機械学習の活用事例  ・ ①画像認識の活用   ・ データ化やダイジェスト作成   ・ 顔認証   ・ 異常検知・故障予知  ・ ②音声認識の活用   ・ 音声AIの家庭での活用   ・ コールセンターでの活用  ・ ③自然言語処理の活用   ・ 文書分類の自動化  ・ ④分析・予測   ・ 売り上げ・需要予測   ・ タクシーの乗車予測  ・ ⑤おすすめを提案してくれるAIレコメンデーションシステム   ・ 献立の提案   ・ 目的地の提案 ・ 機械学習がこれまでになかったサービスを創出していく 機械学習の基礎知識 機械学習とは 機械学習とは、AIのプログラム自身が与えられたサンプルデータに潜むパターンやルールを学習し、予測や分類などのタスクを自動で実行できるようにする技術です。人間が何かを習得するときと基本的には似ていて、学習の対象であるサンプルデータの数が多ければ多いほど、望ましい学習結果が得られ、より高度なタスクを実行できるようになります。 例えば、赤リンゴと青リンゴを分類できるように機械学習で学習する場合、コンピュータが利用できる赤リンゴと青リンゴのサンプルデータ(この場合は画像データ)が多ければ多いほど、学習後のテストで赤リンゴと青リンゴかを間違える可能性が減ります。こうした、同じリンゴでも色の違いで分類することは、コンピュータにとっては離散的な値(連続しない値)を予測して分類することであり、「分類問題」と呼ばれます。 分類問題と対になる概念が「回帰問題」です。例えば、自分が担当する商品・サービスの今後の売り上げを予測したい場合、サンプルデータ(この場合は過去の売り上げや、天候など売り上げに影響を与えるデータ)が多ければ多いほど予測精度は上がります。そうしたサンプルデータは日次、週次、月次…といった粒度で連続しているデータであるべきです。例えば、来月の売上予測をするときに、前月や前々月の売上データが失われていたら、立てる予測の信頼性が大きく損なわれるのは想像に難くないでしょう。こうした連続した値を予測することを「回帰問題」と呼びます。 機械学習が普及してきた背景 前述の通り、機械学習によって高精度なタスクを実行できるAIを開発するには、大量のデータが必要になります。機械学習は、もともと文字認識などのパターン認識の分野で長年蓄積されてきた技術であり、機械学習で大量のデータを扱えるようになった最初のきっかけは、1990年にインターネット上にウェブページが初めて作られたことでした。その後、ウェブページは爆発的に増加し、それとともにさまざまなデータがインターネット上に蓄積されるようになり、機械学習はそれらのデータを利用できるようになったのです。 2000年以降は、ウェブページだけでなく、交通系ICカードに記録される乗車履歴やGPS(全地球測位システム)から得られる位置情報、メールの内容、SNSの投稿内容といった大量のデータを蓄積・利活用するビッグデータという概念が生まれ、これもまた機械学習に利用されるようになりました。その結果、機械学習が実用化され、さらに特徴量(対象を認識する際に注目すべき特徴を定量的に表したもの)をAIが自ら習得するディープラーニングが注目されることにもなりました。なお、このビッグデータ、そしてディープラーニングをきっかけに生まれたAIの進展を「第3次AIブーム」と呼ぶことがあり、現在まで続いていると理解されています。 なお、第3次AIブームがあるということは、もちろん、第1次も第2次もありました。第1次AIブームは1950年代後半から1960年代で、「推論・探索の時代」とも呼ばれます。コンピュータによる推論や探索の研究が進み、例えば迷路や数学の定理の証明といった特定かつ簡単な問題(トイ・プロブレム、おもちゃの問題)が解けるようになりました。その半面、現実の複雑な問題は解けないことが分かり、ブームは急速に冷めました。 第2次AIブームは1980年代で、「知識の時代」とも呼ばれます。コンピュータに知識を入れると賢くなるというアプローチの下、データベースに大量の専門知識を蓄積したエキスパートシステムが数多く構築されました。日本では、政府が「第五世代コンピュータ」と名付けた大型プロジェクトが推進されましたが、実用レベルに至るには、知識の蓄積・管理に膨大なコストがかかることが明らかになり、1995年ごろにブームが沈静化しました。 ただし、機械学習の本質的な技術の提案は第1次ブームのときにすでになされていたり、第1次ブームの中心の推論・探索や第2次ブームの中心の知識は現在も重要な研究分野として継続されていたりするなどしています。ブームの時期に断絶はありましたが、研究としては王道の「巨人の肩の上に立つ」、つまり、先人たちの研究の上に新しい研究が積み重ね続けられてきたことで、現在のAIの隆盛があるわけです。 機械学習で解決できる課題 機械学習で解決が図られている課題は今や多岐にわたります。まず、前述のインターネット上のウェブページの爆発的な増加をきっかけに急速に進展したのは、ウェブページ上の文字を扱う自然言語処理であり、その中でも統計的自然言語処理と呼ばれる分野の研究が特に進みました。統計的自然言語処理を使った翻訳では、従来のように文法構造や意味構造を分析して単語単位で訳を割り当てるのではなく、複数の単語をひとまとまりにした単位(句または文単位)で用意された膨大な量の対訳データを基に、最も正解である確率が高い訳を選択します。この確率を利用するところから「統計的」という名称が付けられています。 例えば、英語のbankという言葉には、「銀行」や「土手」という言葉が訳語候補となりますが、コーパスと呼ばれる対訳データが大量にあれば、bankの近くにmoneyやinという単語が現れた場合は、「銀行」という訳になる確率が高いということを、機械学習を使って習得することができるわけです。 そのほか、自然言語処理だけでなく、さまざまな課題を解決するために、画像認識や音声認識の活用、分析・予測、レコメンデーションなどがあります。具体例を交えた詳細は後述しますが、ここでは代表的なタスクの概要を説明します。 画像認識の活用 コンピュータは通常、画像をピクセル(画素)の集まりとしてしか認識できません。しかし、その画像には人や動物の姿、イラスト、文字など、必ず何かしらの情報や意味が含まれています。コンピュータは組み込まれた演算処理を通して、ピクセルのパターンから特徴を抽出し、その類似の範囲や差異を学習することでそこに写ったものを認識し、識別、分類などの処理を行えるようになります。 音声認識の活用 音声認識とは、文字通り、人が発した「音声」をコンピュータに「認識」させることを目指した技術領域です。具体的に言えば、人間が話す音声を空気の振動として測定し、そこから得られた波形データを解析、文字データに変換するための技術です。Amazon Echo(Alexa)やGoogleアシスタント、AppleのSiriなどのスマートスピーカーや音声アシスタントの存在も日常的に使われるようになってきました。AIによる音声認識が進化したことで、声だけでデバイスを操作したり、会議の議事録を効率よく作成したりといったことが実現されてきています。 分析・予測 ビジネスはつまるところ製品・サービスの提供であり、過去の売れ方を分析したり、それを基にして将来の需要を予測したりすることが欠かせません。そうしたデータ分析や需要予測にAIを用いることの一番のメリットは、従来、人が頭をひねらせていた予測値の算出作業をコンピュータにさせることによる業務の効率化です。たとえその予測精度・予測内容が完璧でなかったとしても、毎月のデータ集約や分析作業が少しでも楽になれば、人的リソースを他業務に割り振ることができるというわけです。 レコメンデーション レコメンデーション、あるいはレコメンドとは「recommend(おすすめする)」という言葉の通り、商品やサービスを顧客におすすめすることを指します。例えばECサイトで「あなたにおすすめ」といった具合に商品画像がいくつか表示されることが当たります。その主要技術は「協調フィルタリング」であり、AIが活用されています。また、「おすすめ」をテキストなどのコンテンツを生成するタスクとして捉えて、生成AIであるChatGPTを活用したサービス事例も出てきています。 参考:日本ディープラーニング協会監修『ディープラーニングG検定公式テキスト第2版』 機械学習とディープラーニングの違い 機械学習は前述の通り、大量のデータをコンピュータに読み込ませることでパターンやルールを学ばせ、予測・分類などのタスクを自動で実行できるようにする技術です。例えば、リンゴの画像を大量に取り込ませて学ばせることでコンピュータはリンゴの特徴について学び、赤リンゴと青リンゴの画像の違いを特徴から抽出、次に来る新しいリンゴの画像を高い確率で分類するといったことが可能になります。 ディープラーニングは、機械学習と同様に現在のAI活用の文脈でよく語られる用語ですが、カテゴリーとしては機械学習の1種であり、機械学習を発展させたものでもあります。 主要な機械学習技術とディープラーニングの大きな違いは、特徴量を人間が指定するかコンピュータ自身が学習するかという点にあります。例えばリンゴの画像を分類しようとした場合、形に着目してしまうと赤リンゴと青リンゴを見分けるのは困難ですが、色に着目すれば見分けができそうです。この「色」が特徴量の一つで、ディープラーニングではコンピュータ自身が大量の画像を学習する過程で「色に着目すべき」と判断します。 機械学習の手法 ディープラーニングを含め、機械学習の手法には大きく分けて四つあります。 機械学習の手法:教師あり学習 赤リンゴか青リンゴかの違いを学習させる際、画像に「赤リンゴ」や「青リンゴ」のラベルを付けた上でコンピュータに学ばせることを「教師あり学習」と言います。教師あり学習では入力に対しての正解が示されているので、コンピュータはそのパターンを学習していきます。 画像の識別の他にも、身近な例としては、迷惑メールのフィルタリングにこの技術が使われています。安全なメールと迷惑メールにそれぞれラベルを付けて学ばせることで、コンピュータはそれぞれの境界線がどこにあるかを学び、次に来たメールが安全かどうかを判断できるようになっていきます。 機械学習の手法: 教師なし学習 「教師なし学習」は、データにラベルを付けずにコンピュータに学習させます。ラベルがないのでコンピュータは正解が何か分かりませんが、与えられたデータの中から規則性や分類項目を見つけ出していきます。 教師なし学習の代表的な活用方法として、顧客データの分類が挙げられます。顧客データには性別や年齢、取引内容、取引の日付などが含まれていますが、リンゴの画像のように一意の正解があるわけではありません。しかしコンピュータは顧客データにさまざまな項目があることを学習し、データの分類を行うことができるようになります。 機械学習の手法: 半教師あり学習 教師あり学習と教師なし学習の間に位置するのが、「半教師あり学習」です。教師あり学習を行いたくても、ラベル付きのデータを大量に用意することは困難なケースもあります。その場合は、少量の教師あり学習でパターンを学習させ、さらに教師なし学習でその精度を深めていくアプローチが取られます。これが半教師あり学習です。 半教師学習については、以下のコラムで詳しく解説しています。 「教師あり学習」「教師なし学習」とは。文系ビジネスパーソンのための機械学習 機械学習の手法: 強化学習 「強化学習」は、正解となるラベルが付かない点では教師なし学習と同じです。違いは、コンピュータが返した出力内容を評価し報酬を与える点にあります。強化学習は、コンピュータが高い報酬を得るように動くことを求め、コンピュータ自身に処理方法を試行錯誤させていく技術です。 強化学習は、投資やゲームなど結果に優劣が付く分野での応用に用いられます。Googleの子会社であるDeepMindが開発し、当時の囲碁世界チャンピオンを打ち破り世界を驚かせた「AlphaGo」は、強化学習を用いて囲碁の勝ち方を学習したAIです。 強化学習については、以下のコラムで詳しく解説しています。 正解のない課題にこそ生きる「強化学習」の基本 機械学習の活用 事例 機械学習を用いたAIサービスは、すでに私たちの生活のさまざまな場面で展開されています。ここでは、画像認識、音声認識、自然言語処理、分析予測、レコメンドの五つのジャンルに分けて事例をご紹介します。 ①画像認識の活用 画像認識は機械学習が得意としている分野の一つであり、応用や組み合わせによりさまざまなサービスが登場しています。 データ化やダイジェスト作成 画像認識の身近な活用例として、手書き書類の自動データ化が挙げられます。手書きの書類をデータ化するには、従来であれば人が入力する必要がありましたが、機械学習により文字を識別する機能が進化し、入力作業を大幅に削減することが可能になっています。人的リソースを別の業務に生かせるだけでなく、入力内容が人が行うより正確になるメリットもあります。 画像データを用いたAIサービスとしては、動画のダイジェストやハイライトの生成などもあります。長時間の動画から見どころを抜き出して短時間の動画を生成するもので、撮影後すぐにダイジェストを配信したい報道機関や、手軽に動画編集を行いたいコンシューマー向けなどに展開されています。 また近年普及が進み続けているネット配信向けショート動画にも活用されています。ショート動画の制作者は「顔のアップは控えたい」「カメラの動きは遅めで」「各カットの長さは短めに」といったさまざまな要望を持っており、例えばNHKは、自動生成された要約動画を簡単な操作で修正できる機能も実現させています。 出典: NHK放送技術研究所「映像自動要約技術の最新動向」     NHK放送技術研究所「画像解析AIによる番組映像自動要約システム」 顔認証 顔認証も、画像認識の活用例としてよく知られているでしょう。まだ実用段階にはないようですが、例えば公共交通機関の乗車システムに顔認証を活用する実証実験がされており、より便利な社会インフラの構築が目指されています。 異常検知・故障予知 画像認識の技術が実用レベルとして活用されているケースでは、製造業における異常検知・故障予知があります。これは工場内の要所にカメラを設置し、リアルタイムで画像分析を行い、異常や故障が起こりそうになったらアラートを出すといったものです。機械学習の力を借りることで人の負担を減らし、また検知や予知の精度も高くなることが期待できます。以下のコラムで詳しく解説しています。 AI×センサーで見通せ。「故障予知」から始まる未来 「品質管理AI」の違和感。その役目は人にある。 画像認識についてはこちらもご覧ください。 画像認識AIの世界。その仕組みと活用事例 ②音声認識の活用 大量のデータを収集しやすい音声の認識も機械学習が得意なジャンルであり、自然言語処理や自動応答といった他のAI技術と比べて、現時点で高いレベルに達しているといわれています。 音声AIの家庭での活用 音声AIとしては、Appleの「Siri」やGoogleの「Googleアシスタント」をはじめとした音声アシスタントがよく普及しています。音声アシスタントは、スマートフォンだけではなくスマートスピーカーからも利用可能で、生活の一部に取り込んでいる家庭も少なくないでしょう。 コールセンターでの活用 音声認識の技術が活用されている業種としては、コールセンターが挙げられます。顧客の問い合わせ音声からコンピュータが自動で何を要望しているか認識し、オペレーターがFAQや顧客データを検索するまでもなくディスプレイに表示させるサービスも登場しています。コンピュータが自動応答まで対応することで、コールセンターの営業時間外でも受付が可能になっています。 また逆に、コールセンターから顧客への営業などの電話にも、音声認識が活用されています。電話の録音・分析し、商談化に結び付きやすい話し方を知見として見いだし、人材教育に用いる例も出てきました。 出典: PRTIMES「Hmcommが、通販大手ディノス・セシールとコールセンター集中呼自動応答(音声Bot)」の共同開発を開始」   : 日経ビジネス「ベルシステム24野田社長「音声データがAIで宝の山に」」 音声認識についてはこちらもご覧ください。 音声認識AIのいま。その技術や事例を知る ※画像はイメージです。 ③ 自然言語処理 の活用 AIは目的に合わせたパターンを学習することで、人間が話す言葉を処理する「自然言語処理」の精度を高めていくことも可能です。 文書分類の自動化 例えば、Laboro.AIではテキストを認識し、文書分類を自動で行う事例を手掛けました。ある大手通信企業では申込書の分類が担当者による手作業で行われていましたが、数が膨大なため、未振り分けのまま送られて不要な情報まで伝達されてしまう課題がありました。機械学習の1種であるニューラルネットワークによる文書分類アルゴリズムを構築することで、自然言語処理によるAIがテキストを分類、結果として業務改善につながっています。 参考:プロジェクト事例  文書分類による業務自動化率の向上 自然言語処理についてはこちらもご覧ください。 無意識で意識的な自然言語処理 ※画像はイメージです。 ④分析・予測 分析や予測も、機械学習が得意とするジャンルの一つです。過去のデータを大量に学習することで、膨大なデータの分析や、将来どのような結果が起こり得るかの予測ができます。 売り上げ・需要予測 機械学習の分析・予測を生かしたジャンルとしては、売り上げや需要の予測があります。 店舗の来客分析への応用はその一つの例です。店内に分析用のカメラを設置して顧客属性ごとの商品の購買傾向、売り場の移動の仕方などを分析する技術は、機械学習により高精度に行う技術も登場しています。これにより、従来以上にターゲットを意識した仕入れや商品配置、導線を意識した売り場づくりなどの店頭施策の実施が可能になってきています。 小売り向けの自動発注システムを手掛けるシノプスは、スーパーの需要予測を卸業者や食品メーカーと共有するサービスを始めています。AIを活用した需要予測を基にスーパーから卸業者への発注を平準化したり、急な追加発注を減らしたりすることでトラックの無駄な配送を減らすことがねらいであり、トラック運転手の不足が懸念される「2024年問題」も見据えたサービスになっています。 出典: monoist 2020年2月26日「トライアルが首都圏初のスマートストア、リテールAIによる流通情報革命の現場に」   : 日経産業新聞「シノプス、スーパーの需要予測を卸と共有 配送効率化支援」 売上・需要予測についてさらに詳しく知りたい方は、以下の二つのコラムをぜひ参考にしてください。 需要予測AIよ、需要は予測するものでなく作るものだ。 POSからの脱却。小売AIの進化と可能性 タクシーの乗車予測 タクシーの乗車予測にもAIが活用されています。例えば、ソニー系のタクシー配車アプリ大手「S.RIDE」は、ソニーグループの開発チームが携わった独自AIを採用。過去のタクシー利用客がいつ、どこから乗車し、どこで降りたかといった乗降データをAIで分析し、エリア内を走るタクシー空車台数などのデータと突き合わせて、時々刻々と変わるタクシーへの需要の高さを算出するなどしています。導入した会社の一つでは、AI需要予測サービスを使っているドライバーは、使っていないドライバーに比べ、5〜10%売り上げが高いという例も出ています。 出典: 日経XTREND「ソニー系配車アプリS.RIDE好調 AI需要予測で売り上げ増」 ※画像はイメージです。 ⑤おすすめを提案してくれるAIレコメンデーションシステム 機械学習によって大量のデータを分析し、傾向や法則性を導き出すことで、利用者におすすめを提示する「レコメンド」系の製品・サービスが登場しています。 献立の提案 献立のレコメンドサービスの一例として、自動献立提案AIアプリ「勝ち飯®AI」があります。これはトップアスリート向けの献立を分析し、一般アスリートや家庭での献立作りにも取り入れられるようにしたものです。詳しくは、以下のコラムをご覧ください。 新・食体験に挑む。食品AIの可能性 目的地の提案 「クルマに乗ってどこかへ遊びに行きたいけど、行くべきところを具体的におすすめしてほしい」というニーズに対応し、機械学習によっておすすめの目的地をレコメンドするシステムをLaboro.AIが開発しました。AIとの対話を行うことで、ユーザーの潜在的なニーズを分析し、その内容から目的地を提案するAIレコメンデーションシステムです。 ユーザーのニーズを分析するとともに、観光スポットに関するデータを活用することで、レコメンドを行う対象を選定しています。詳しくは、以下のコラムをご覧ください。 自動運転だけじゃない。自動車×AIの最先端 レコメンデーションについてはこちらもご覧ください。 潜在意識も刺激する、AIを用いたレコメンデーション 機械学習がこれまでになかったサービスを創出 していく AI技術の一つである機械学習は、人間ではリソース的にも精度的にも不可能だったデータの出力を可能とし、さまざまなサービスの創出につながっています。多くの応用例が登場しているため、こうした情報をキャッチしながら、自社内でのAI活用の可能性を探ってみるのがおすすめです。 Laboro.AIでは、オーダーメイドによるAIソリューション、「カスタムAI」を開発・ご提供しています。こちらに過去の導入事例・活用事例をまとめていますので、ぜひご覧ください。 Laboro.AI カスタムAI導入事例 執筆者 執行役員 マーケティング部長 和田 崇 立教大学大学院経営学修士(マーケティング論・消費者行動論)。立教大学大学院ビジネスデザイン研究科博士後期課程中退。KDDI株式会社に入社、コンシューマ向け商品・サービスのクロスメディアによるプロモーション施策の立案・企画運営に携わったのち、全国漁業協同組合連合会を経て、2019年にLaboro.AIに参画。マーケティング/ブランディング業務に従事する傍ら、 NewsPicksプロピッカー として活動するほか、 日経クロストレンド などメディア寄稿多数。 リードマーケター 熊谷勇一 中央大学文学部卒業、北陸先端科学技術大学院大学情報科学研究科博士前期課程修了。日本経済新聞社など日経ブランド企業で16年以上、雑誌、書籍、ウェブサイト、動画などの編集・執筆を手掛けた後、2022年からLaboro.AIに参画。 その他のおすすめコンテンツ ・ AIのメリットやデメリットとは。課題やポイントも含めご紹介 ・ AI導入現場から。企業が抱える検討課題の実際とは ・ 機械学習とディープラーニング(深層学習)の違いとは The post 機械学習の活用事例―機械学習の基本から活用方法まで通しで解説― first appeared on 株式会社Laboro.AI .
アバター
「SIAI2024」イベントレポート:Laboro.AI企業体験会を開催 2024.10.3 概 要 Laboro.AIでは、2024年9月6・7日に人工知能学会が主催した、企業と若手・学生AI人材のマッチングイベント「 第6回SIAI 産学クロススクエア『ミライをつくるAI人材』 」に出展しました。お台場にある産総研臨海副都心センター別館で開催されたこのイベントでは、有識者による講演や研究室展示のほか、企業展示として「1hour企業体験」が催され、二日間に渡り多くの学生・若手のAI人材が集まり盛況のうちに終了しました。 このコラムでは、本イベント内で当社エンジニアリング部が行った「1hour企業体験」の様子をお伝えし、Laboro.AIで働く機械学習エンジニアの業務の一端をご紹介していきます。 目 次 ・ 最適化プロジェクトをテーマにした企業体験 ・ 最適化プロジェクトのワークフローを追体験  ・ ある中学校からの悩み相談  ・ Step1. 最適化要件の洗い出し  ・ Step2. 最適化問題の定式化  ・ Step3. プログラムの実装・検証 ・ Laboro.AIのエンジニアリングの特徴 ・ Laboro.AI機械学習エンジニアを目指す方へ 最適化プロジェクトをテーマにした企業体験 今回当社が実施した企業体験プログラム「Laboro.AI1hour企業体験」では、1時間の時間を使って当社のAIプロジェクトを追体験いただくことを目的に開催、2日間で約40名の学生・若手AI人材の方々にご参加いただきました。 そのテーマは 「最適化定式化プロジェクトを追体験しよう」 。Laboro.AIでは、組合せ最適化問題のプロジェクト実績を多く保有していますが、実際のプロジェクトでは、クライアント様にヒアリングを行いながら最適化問題として定式化するために必要な制約条件などを洗い出していきます。今回のプログラムでは、参加者の方々にLaboro.AIの機械学習エンジニアになってもらった想定で、これらのワークフローを追体験していただき、Laboro.AIの最適化プロジェクトの一端に触れてもらいました。 最適化プロジェクトのワークフローを追体験 ある中学校からの悩み相談 今回用意したサンプルワークの設定は、ある中学校からの相談があったというもの。具体的にはクラス編成に関する相談で、近年の生徒数の増加や保護者からの要求の増加によってクラスの編成がより難しくなっていること、そしてこれまで編成を担ってくれていたベテラン教員が定年退職してしまったことから、自動でクラス編成を最適化するシステムを作りたいという相談があった、という設定です。 そして今回の企業体験では、実際のプロジェクトでも行われ最適化プロジェクトの中核にあたる、最適化要件の洗い出し、最適化問題の定式化の2つのフェーズにチャレンジしてもらいました。 Step1. 最適化要件の洗い出し 「数理最適化問題」という言葉そのものには聞き馴染みがない方も多いのかもしれません。ですが、与えられた制約条件のもとで特定の目的関数を最小化(最大化)することを指すこの問題、実は高校数学で習う例えば以下のような問題(所与の要件を表す直線グラフが交わる点を導く)も数理最適化問題の一種で、とても身近な数学問題の一つでもあります。 ある工場では、製品Xと製品Yを製造しています。製品X, Yを製造するには、原料としてアルミと鉄が必要で、それぞれ以下の表で表されます。このとき、売り上げを最大化するためには、製品X, Yをそれぞれ何kg製造すれば良いでしょうか。 ですが実際のビジネスに関連する最適化問題の場合、与えられる条件はこれほどシンプルなものではありません。今回のワークのクライアントである中学校から来たクラス編成に関する事前情報は、以下のような内容でした。では、これらの情報からどのような最適化要件を設定すべきなのでしょうか。(ぜひ考えてみてください) 実際のAI開発プロジェクトでも要件定義は非常に重要な事前タスクで、要件の洗い出しが疎かになったり不適切だったりすると、プロジェクト開始後に解決のアプローチを一から変更しなければならなくなる、新たに要件が追加されることで人材や資源リソースの不足を招くといったリスクにつながってしまいます。 そのため通常はクライアントに対する入念なヒアリングから要件を明確化していくものですが(※)、今回は参加者の方々に仮説として考えられる最適化要件の洗い出しを行ってもらいました。例えば以下のような要件が正解例として想定されます。 ※当社では主たるクライアントワークはAIコンサルタントであるソリューションデザイナが実施いたしますが、クライアント担当者様との技術専門性の高い内容に関する議論などについては機械学習エンジニアが行うケースもございます。ソリューションデザイナ、機械学習エンジニアの役割について詳しくは、こちらの採用ページでご確認いただけます。 Step2. 最適化問題の定式化 次のステップは、洗い出した要件の定式化です。実際に最適化ソルバー(数理最適化問題を解くためのアルゴリズムが搭載されたソフトウェアやツール)を使って解を導くためには、この制約条件の定式化が不可欠です。なお、最適化ソルバーを用いるにあたっては、\(x < 1 \ if \ y >1\)のような絶対値条件やif文条件が扱えないこと、ソルバーが扱いやすい定式化を行うことなどに注意が必要です。 それを踏まえて企業体験ワークでは、以下の決定変数、リスト、定数を利用することを前提に定式化にチャレンジしてもらいました。洗い出したそれぞれの制約条件はどのように定式化すべきでしょうか。(ぜひ考えてみてください) 例えば「1. 各生徒は必ず1つのクラスに割り当てる」は、次のように定式化することができます。まずある一人の生徒 001 に注目します。生徒 001 は必ずクラスA~Fのどこかに属する必要があるので、生徒 001 に関する決定変数\(x_{001, \ A} \ , x_{001, \ B} \ , … , x_{001, \ F} \ \) の和が必ず1になる必要があります。この条件式を各生徒に対して一般化したものがこちらの解答例です。 次に「2. 各クラスの生徒は39人以上、40人以下とする」の定式化は、まずある一つのクラス A に注目します。クラス A に所属する生徒の合計は、クラス A に関する決定変数\(x_{001, \ A} \ , x_{002, \ A} \ , … , x_{237, \ A} \ \) の和で表すことができます。この和が39人以上、40人以下にすることでクラス A に関する条件式は完成です。この条件式を各クラスに対して一般化したものがこちらの解答例です。 そして今回の制約条件の中で最も定式化が難しいのが「4. 各クラスの学力試験の平均点は学年平均点±2点以内とする」で、今回の参加者でも正解できたのはわずか1人でした。その定式化の例がこちらで、詳しい解説は最後に記載しています(※)。 Step3. プログラムの実装・検証 今回の企業体験では時間の関係からこれまでの2つのステップ、最適化要件の洗い出し、最適化問題の定式化に絞って開催しましたが、実際の当社プロジェクトでは次のステップとして、定式化した制約条件をプログラムで実装することも行います。 クライアントとの認識を合わせるためにも、簡易的なアプリの実装を行うことは少なくなく、双方にとってとても重要なステップです。なお、最近ではChatGPTに代表されるLLM(大規模言語モデル)に制約条件を尋ねるだけで一定レベルの実装スクリプトを返してくれるようにもなってきており、プログラミングの効率化が進んでいます。イベント会場では今回のワーク内容に照らした実装結果の簡易的なデモを紹介させてもらいました。 Laboro.AIのエンジニアリングの特徴 2日間に渡り実施した「Laboro.AI 1hour企業体験」、参加された方々には当社で働く機械学習エンジニアになっていただいたつもりで、その業務の一端を体験いただきました。 この企業体験の内容からもわかるように、当社のエンジニアリングの大きな特徴は、その裁量の大きさにあります。Laboro.AIでは『カスタムAI』の名の下、オーダーメイドによる受託開発型でのAIソリューションの開発・提供をしていることから、自社プロダクトを持たない分、クライアントの課題に寄り添い、そのためのベストな手法を選択し、最適なソリューションを構築することを目指します。一つ一つのタスクは地道なことの積み重ねではありますが、エンジニアとして与えられた裁量を存分に活かし、よりベストなアプローチを探索することが、クライアントへの価値提供に直結する点は大きな魅力です。 また、今回のワークのように、定式化などに留まらず実装まで含めた開発範囲の広さも特徴です。言い方を換えれば、当社のエンジニアリングの視点は「いかに精度を高くするか」ではなく、「いかにクライアント成果に貢献するか」にあります。当社では「テクノロジーとビジネスを、つなぐ。」というミッションを掲げていますが、技術精度のみを追求するのではなく、クライアントのビジネス成果達成に最適な形のAIソリューションをお届けすることを第一に、より一歩踏み込んだ範囲でのエンジニアリングを行っています。 さらにLaboro.AIは、最適化だけでなく、LLM、強化学習、画像、音声など、非常に幅広い分野でのカスタムAIソリューションの開発・提供をカバーしている点も特徴です。クライアントに対してよりマルチなアプローチでの提案ができることはもちろん、エンジニアにとってはそれぞれが保有しているスキル・ノウハウを活かしながら、より多様な範囲の新たな知見を習得できる環境があります。 Laboro.AI機械学習エンジニアを目指す方へ Laboro.AIでは、機械学習エンジニアの採用を随時行っています。このコラムを読んで少しでも興味を持ってくださった方、より詳しく業務内容や働き方について知りたいと思った方は、ぜひお気軽に こちらのフォーム からお問い合わせください。また、当社エンジニアの業務内容などについては、こちらの 採用ページ でもご紹介しています。皆様からのご連絡を心よりお待ちしております。 (※) 解説:「4. 各クラスの学力試験の平均点は学年平均点±2点以内とする」の定式化 あるクラス A の学力試験の平均点はどのように定式化できるでしょうか。平均点は合計点数÷合計人数で求められることに注目すると、合計点数および合計人数をそれぞれ定式化すればよいことがわかります。 まず、合計人数の定式化を考えます。これは、条件2の定式化でおこなったクラス A に所属する生徒の合計と同じです。したがって、決定変数\(x_{001, \ A} \ , x_{002, \ A} \ , … , x_{237, \ A} \ \) の和で表すことができます。 つづいて、合計点数の定式化を考えます。たとえば、生徒 001 の点数は定数\(score_{001}\)で与えられているため、クラス A における生徒 001 の点数は\(score_{001} × x_{001, \ A}\) で表されます。もし生徒 001 がクラス A に所属していない場合、\(score_{001 } × x_{001, \ A} = 0\) となり合計点数にはカウントされないことがわかります。この積を各生徒に対して足し合わせることで、クラス A に所属する生徒の合計点数を求めることができます。最後に、合計点数および合計人数を利用して、平均点を求めた条件式を各クラスに一般化したものが文中に示した解答例です。 参考 ・ Laboro.AI 採用ページ ・ SIAI 2024 The post 「SIAI2024」イベントレポート:Laboro.AI企業体験会を開催 first appeared on 株式会社Laboro.AI .
アバター
ファインチューニングとは 応用分野からプロセス、発展まで 2024.10.1 構 成 株式会社Laboro.AI リードマーケター 熊谷勇一 概 要 既存のリソースを活用しつつAIモデルの効率と精度を向上させられる手法であるファインチューニングについて、その重要性や応用分野、実施のプロセスなどについて解説します。なお本コラムは、当社の代表取締役COO兼CTOの藤原弘将と、機械学習エンジニアの計6人が執筆した書籍『 今日から使えるファインチューニングレシピ AI・機械学習の技術と実用をつなぐ基本テクニック 』(オーム社刊)の一部を抜粋・編集したものです。 目 次 ・ ファインチューニングとは  ・ ファインチューニングの重要性  ・ 事前学習済みモデルの役割  ・ モデル共有サービス  ・ 応用分野   ・ 画像処理   ・ 自然言語処理   ・ 生成AI   ・ 強化学習 ・ ファインチューニングのプロセス  ・ 事前学習済みモデルの選択  ・ データの準備と前処理  ・ 実行方針の検討と実行 ・ 発展的な話題  ・ 効率化   ・ LoRA   ・ Prefix Tuning   ・ Prompt Tuning / P-Tuning  ・ 継続的学習   ・ EWC   ・ ER  ・ RAG ファインチューニングとは ファインチューニングは訳すならば「微調整」で、特に深層学習において、大規模データで事前に訓練された事前学習済みモデルを、別のデータセットを用いて再学習することで、特定のタスクやドメインに特化させる手法です。既存の知識を活用しつつ新しいタスクに対する効率と精度を大幅に向上させられるとも言えます。 OpenAI 社によって開発されたChatGPT は、公開されているウェブサイトや書籍、新聞、雑誌などのデータで学習されています。例えば、ある会社の非公開情報について返答するチャットボットをつくりたい場合、ChatGPTをそのまま活用するだけでは実現が難しいので、その会社の内部情報などでファインチューニングすることで実現できます。 ファインチューニングの重要性 特定のドメインやタスクに特化したデータの収集は、時間とコストの両面で困難な場合が多く、現実のタスクに対するAI の適用を難しくしています。しかし、ファインチューニングで事前学習済みモデルを活用することで、精度の高いモデルを構築することが可能です。データの効率が飛躍的に高まり、より効果的・効率的なAI ソリューションの構築が実現します。 ファインチューニングには以下の四つのメリットが見いだせます。 一つ目は「特定のドメインへの適応」で、汎用的なモデルを特定のドメインに適応させる点です。例えば、医療分野や金融分野など高い専門知識が求められるでも、事前学習済みモデルをファインチューニングすることで、限られたリソースで高い精度を持つ専門的なモデルを効率的に構築することができます。 二つ目は「特定のタスクへの適応」です。特定のタスクに事前学習済みモデルをファインチューニングすることで、ベースの事前学習済みモデルの特長を活かしつつ、特定のタスクに適切に対応させられます。例えば、質問応答タスクでは、文章を理解する能力は事前学習モデルに頼り、ファインチューニングで適切な回答を回答データセットから抽出する能力のみを学習することで、効率的に高精度なモデルが実現できます。 三つ目は「開発サイクルの高速化」で、モデルの開発サイクルを大幅に短縮させられる点です。機械学習済みを用いた新しいアプリケーションやサービスを迅速に市場に投入したい場合、事前学習済みモデルを少ないデータでファインチューニングすることで、開発初期段階でのプロトタイプの開発速度を上げられ、初期投資を抑制しつつ短期間でPoC(Proof of Concept、概念検証)を実施できるようにもなります。 四つ目は「計算リソースの節約」です。ファンチューニングでは特定のタスクや新しいデータセットに適応するための追加学習だけで済み、大幅に計算リソースを節約できます。これにより、大規模なインフラ投資をすることなく、技術的な進歩を享受できます。 五つ目は「低リソース言語」への対応です。英語やスペイン語、中国語などを除く多くの言語では、機械学習に利用可能な学習データセットが少ないため、高精度なモデルの構築が困難です。しかし低リソース言語でも、英語などの事前学習済みモデルを使用し、入手し得る少量のデータでファインチューニングすれば、高品質なモデルを構築できます。 事前学習済みモデルの役割 ファインチューニングにおける事前学習済みモデルの重要な役割は二つあります。一つ目は、幅広いデータに対して、さまざまなタスクに適応するために必要な基礎的な理解力を提供することです。事前学習済みモデルは、通常、大量のデータと計算リソースを投入して学習されます。例えば画像識別においてはImageNet と呼ばれる1000 万枚を超える大規模学習データセットを用いて学習された事前学習済みモデルがよく使われます。自然言語処理では、BERT(Bidirectional Encoder Representations from Transformers)などに代表される教師なし自然言語処理モデルが知られています。 もう一つの重要な役割は、モデルの収束速度や最終的な性能に大きな影響を与えるパラメータの初期値を提供することです。事前学習済みモデルはすでに学習されたパラメータを持っているため、ファインチューニングでこれを利用でき、モデルは迅速に収束しします。また、少量のデータしか利用できない場合でも、この初期値が過学習を防ぎ、モデルの汎化性能を高めるのに役立ちます。 モデル共有サービス ファインチューニングには事前学習済みモデルと学習プログラムが不可欠で、その過程で重要な役割を果たすのがモデル共有サービスです。モデル共有サービスとは、広範囲にわたるタスクを学習済みのモデルを無料で提供するサービスのことです。モデルをゼロから訓練することなく、ファインチューニングに開発リソースを集中させられます。 特に、Hugging Face と呼ばれるモデル共有サービスが中心的なプラットフォームとなっています。その特長の一つは、パラメータだけでなく、学習プロセスに関する情報も提供していることです。報告済みの研究結果を他者が再現しやすく、研究の透明性と信頼性を保証しやすくなるほか、既存のパラメータをもとに新しいタスクに適応させられ、開発スピードを大幅に向上させられます。 応用分野 ファンチューニングが応用されている四つの分野と、それぞれの代表的な事前学習済みモデルを紹介します。 画像処理 画像処理における最も基本的なタスクは画像識別で、入力画像の中に何が写っているかを一つ答えるというタスクです。前述のImageNet データセットを使って学習したモデルがさまざまな深層学習のフレームワークに標準的に実装されています。 画像識別の発展形とも言えるのは、物体検出やセマンティックセグメンテーションです。前者は画像の中に写っているものの名前とその領域を四角形などで検出するタスクで、後者は画像の中の写っているものをピクセル単位で色分けするタスクです。特に物体検出では、学習するためのソースコードと学習済みモデルがセットになったDetectron2、MMDetection などのツールキットが複数公開されていて、非常に簡易に利用できます。 なお、特にファインチューニング時の追加学習データ量が少ない場合に、過学習を防ぐ効果を狙って、事前学習済みモデルの一部または全部のパラメータを固定し、固定していない部分のみを再訓練することがあります。 物体検出についてはこちらもご覧ください。 物体検出【ビジネス成長のためのAI用語】 自然言語処理 自然言語処理では、大規模なデータから教師なし学習を行った事前学習済みモデルが広く使われていることが特徴です。例えばBERT では、学習データの文中にある一部の語をマスクしてそれを予測する学習方法と、与えられたテキストの続きを予測する学習方法を採用して、約33 億語にもわたる大量のテキストデータから教師ラベルなしで学習しています。 このBERT は、さまざまなタスクに柔軟に適用できることが特長です。以降、RoBERTa、ALBERT、DistilBERT などの改良モデルと、それらを使って各言語やタスクに特化した事前学習済みモデルが開発されたことで、BERTは自然言語処理の標準的なモデルになりました。さらに、OpenAI 社が開発したGPTシリーズにより、処理能力は飛躍的に発展しました。 自然言語処理のファインチューニングについてはこちらもご覧ください。 自然言語処理におけるファインチューニング【ビジネス成長のためのAI用語】 生成AI 生成AI 分野の代表的なタスクは、文章生成、画像生成、動画生成、音楽生成です。文章生成モデルは一般に大規模言語モデル(LLM)と呼ばれ、文章の生成の他、幅広いタスクに対応できます。この代表的なモデルが前述のGPT シリーズなのです。当初は純粋に言語の生成タスクにフォーカスしていましたが、2020 年に登場したGPT-3 では、自然言語で記述した文章の続きを生成させることで、言語の生成タスクを超えた適用が可能になりました。さらに2022 年に登場したChatGPT は、指示内容を対話的に入力できるようにしたことで広く普及しました。 GPT シリーズの大きな特長は、天文学的な数のデータと計算リソースを使って、常識を超えたパラメータ数を持つモデルを学習したことです。これによりあたかも人間と同じ知能を持ったかのような文章を生成し、適切な応答が可能になりました。 GPT シリーズのソースコードやパラメータは、OpenAI 社が運営するサービスなどを経由してでしか利用することしかできませんが、GPT と類似したモデルをオープンソースで開発するMeta 社のLLaMA などもあり、手元のGPU(Graphics Processing Unit) でもファインチューニングを実施できます。 画像生成においても生成AI は革新的な進展を遂げています。GAN(Generative Adversarial Networks、敵対的生成ネットワーク)やVAE(Variational Auto Encoders、変分オートエンコーダ)などの、写真のようにリアルな画像を生成、変換する手法に加えて、近年では、Stable Diffusionのようなユーザが入力した文章をもとに画像を生成するモデルが注目を集めています。Stable Diffusionは、文章の内容を理解するためのCLIP(Contrastive Language-Image Pre-training)と呼ばれるモデルと、画像を生成するための拡散モデル(Diffusion Model)と呼ばれるモデルを組み合わせたものです。オープンソースの事前学習済みモデルにファインチューニングを実施することでカスタマイズが可能です。 生成AIについてはこちらもご覧ください。 仕組みから知る生成AIと技術研究の今 強化学習 強化学習の分野ではRLHF(Reinforcement Learning from Human Feedback)があります。事前学習済みモデルに対して、強化学習の技術を用いて人間のフィードバックを与えることで性能を向上させる手法です。前述のChatGPT の開発においてもRLHF が重要な役割を果たしています。モデルの回答品質が向上したほか、倫理的に好ましくない対話や有害な情報を出力することを防いでいます。 強化学習についてはこちらもご覧ください。 正解のない課題にこそ生きる「強化学習」の基本 ファインチューニングのプロセス ここでは、ファインチューニングのプロセスの概要を解説します。 事前学習済みモデルの選択 まず、使用する適切な事前学習済みモデルを選択します。ターゲットとなるタスクやドメインよりも広い、一般的な特徴をとらえたものが使われます。ファインチューニングにより、より狭いタスクへの適応と、パフォーマンス向上を目指します。 画像識別タスクにはResNet やEfficientNet、自然言語処理タスクにはBERT やGPT などがよく使用されます。高性能なモデルを使ったほうが精度は良くなるはずですが、それらは一般に大規模で、処理に多くの計算リソースを必要とします。性能と計算リソースのトレードオフを考慮してモデルを選択しましょう。 データの準備と前処理 ファインチューニングの成功の可否は、使用する追加学習データの質と量によるので、適切なデータ準備と前処理が不可欠です。必要なデータの量は、少なくともターゲットとなるタスクやドメインの全体像を網羅できる程度は必要です。 当然ながら、評価データも準備する必要があります。ファインチューニングの成否を計測するため、対象となるタスクの代表的なケースを網羅したものが望ましいです。 実行方針の検討と実行 次に、選択した事前学習済みモデルと前処理済みのデータを使ったファインチューニング実施の方針として、下記の点を検討します。 • 事前学習済みモデルの構造の一部を変更する必要があるか。変更する場合は、その構造はどのようにするか • 事前学習済みモデル中の固定するパラメータと更新するパラメータの選択 • 最適化アルゴリズムや学習率などの学習時に必要なパラメータ • アーリーストッピングやデータ拡張など過学習を防ぐ方法 方針が決まったら、ファインチューニングを実施します。通常はGPUやTPU(Tensor Processing Unit)などの深層学習用の計算リソースを用います。 発展的な話題 ファインチューニングの発展的な話題として、モデルの訓練時間を短縮する高速化手法や、モデルが既存の知識を保持しつつ新しい情報を学習できる仕組みである継続的学習や、既存のLLMをドメインに適応させる手法・RAG(Retrieval-Augmented Generation、検索拡張生成)について解説します。 効率化 画像生成モデルやLLM などの生成AI 分野を中心に、事前学習済みモデルのサイズがどんどん巨大化しており、ファインチューニングの実行にさえも莫大な計算リソースが必要になっています。例えば、画像生成モデルのStable Diffusion 3 は最大約80 億、LLM のLlama 3 では最大700 億個のパラメータを持っています。 このような大規模モデルをファインチューニングするためには、PEFT(Parameter-Efficient Fine-Tuning)と呼ばれる技術を用い、更新するパラメータ数をなるべく抑える必要があります。特にLLM においては破滅的忘却(Catastrophic Forgetting)と呼ばれる現象が問題となりますが、PEFT はこれを減らせるとされています。PEFT の代表的手法として以下で三つを解説します。 LoRA モデルパラメータのファインチューニングにより変化する差分を、近似的に少な いパラメータ数で表現することで、モデルの訓練にかかる時間とメモリ使用量を削減する手法です。顔を特定の人物に似せる、特定の姿勢の描写を精密にするなど、出力画像を特定の方向に誘導できます。さらに、同一の事前学習済みモデルに対して複数の差分を同時に適用することができ、複数の効果を同時に得られます。そのため、指示文(prompt、プロンプト)だけでは表現できない出力画像の内容コントロールにも使われています。 Prefix Tuning LLM を構成するトランスフォーマの各層の先頭にタスク固有のベクトルを追加する(プレフィックス(prefix)を付ける)手法です。これによって、プレフィックス部分のみを学習するだけで済み、ファインチューニングが高速化されます。 Prompt Tuning / P-Tuning モデルに与えるプロンプトを調整することで、特定のタスクに対する性能を向上させる手法です。当然、もとの事前学習済みモデルのパラメータは完全に固定したままですので、少ない時間で処理できます。 継続的学習 継続的学習は、モデルが新しいデータやタスクを学習する際に、既存の知識を保持しつつ、新しい情報を効率的に統合する手法です。モデルは継続的に進化し、過去の学習内容を忘れることなく、新しい知識を獲得できます。ここでは、継続的学習の代表的な手法として、EWC(Elastic Weight Consolidation)とER(Experience Replay)について解説します。 EWC モデルをファインチューニングしてパラメータ更新する際に、事前学習済みモデルのパラメータの変更を制限する手法です。事前学習済みモデルの中の重要なパラメータを確率的に推定し、重要としたパラメータの変更に対してはペナルティを科し、それらが大きく変わらないようにします。 ER ER は、事前学習時の学習データをファインチューニング時に再利用することで、事前学習済みモデルの知識を保持する手法です。その発展的な手法のDGR(Deep Generator Replay)は、事前学習済みモデルから生成したデータを仮想的な過去のデータとして利用する方法です。 RAG RAG は、LLM に外部知識を組み合わせることで、より詳しく正確な応答の生成を目指す手法です。まずユーザからの質問にもとづいて、質問に最も関連性の高い外部データを検索し、その後、検索結果をもとに質問に対する自然な言語での応答を生成するという2 段階のプロセスを経ます。これにより、大規模なドキュメントコーパスから適切な情報を効率的に抽出できます。 RAG には以下のようなメリットがあります。 ・最新情報への対応:事前学習された後に発生した出来事や情報を検索することで、最新の情報を含む応答が可能 ・専門知識の保管:特定の専門分野に関する質問に対して、外部の専門知識を用いてより正確で信頼性の高い応答が提供できる ・応答の多様性:複数の関連ドキュメントを参照することで、応答の多様性が増し、より豊かな会話が可能 本コラムの基になった書籍『 今日から使えるファインチューニングレシピ AI・機械学習の技術と実用をつなぐ基本テクニック 』は各書店で好評発売中です。目次などの詳細の確認や、試し読みは こちら からしていただけます。 The post ファインチューニングとは 応用分野からプロセス、発展まで first appeared on 株式会社Laboro.AI .
アバター
LLM(大規模言語モデル)、トレンドは「小で事足りる」 公開2024.1.22 更新2024.9.12 株式会社Laboro.AI リードマーケター 熊谷勇一 用語解説 LLM(Large Language Models、大規模言語モデル)とは、文字通り大量のデータとディープラーニングを用いた言語モデルのことです。自然言語処理の分野で使用され、テキストの生成などの能力に長けています。しかし一方で、単語や文章の生成に特化しているため、音声や画像の処理には制約があります。 LLMが大規模たる所以は、この「データ量」に加えて「計算量」と「パラメータ数」の規模の大きさにあります。計算量とはコンピュータが処理する仕事量のこと。そもそも言語モデルとは、文章の並び方に確率を割り当てる確率モデルを指し、実体は、簡単な計算式を大量に組み合わせた超巨大な数式です。そして、この数式には膨大な量のパラメータが含まれています。パラメータ数とは確率計算を行うための係数の集合体のことで、パラメータ数が豊富なことはLLMの特徴の一つです。 LLMの開発では、後に続く単語の予測がうまくいくようにパラメータを調整すること(=学習または訓練)を通して、精度を向上させていきます。こうして作られた学習後の言語モデルに質問などを入力すると、それに続く単語を次々に予測し、長文の回答が出力されていきます。 応用&詳細解説 「データ量」「計算量」「パラメータ数」三つの大規模化については、2020年にサム・アルトマン氏が率いるOpenAIが発表した論文 ” Scaling Laws for Neural Language Models ” で触れられ、自然言語モデルの性能とこれら三つの間には「Scaling Law(スケーリング則)」が成立すると提唱されました。OpenAIはこの論文の主旨に則って三つを大規模化することで、精度の高い大規模言語モデルをつくり出すことに成功したのです。 LLMを違う説明の仕方をすると、「自然言語処理において大量のテキストを学習し、自然な文章の作成や要約、受け答えができるようにしたAIモデル」とも言えます。代表的なモデルにはChatGPTのGPT-4やGPT-3.5(パラメータ数非公開)の他に、GoogleのLaMDA(同1370億)や、国産ではオルツが開発したLHTM-2(同1600億)などがあります。ChatGPTは「GPT-4やGPT-3.5というLLMにチャットというユーザーインタフェースを組み合わせた生成AI」とも言えます。 既に実現している使い方としては、文書の校正・要約・翻訳、プログラミングのサポート、対話的なウェブ検索、小説などの制作やその制作のためのアイデアの生成などがあります。さらに今後サービス化が考えられる例として、ストレスや時間の制約のないカウンセリング・コーチング、学習のサポート、士業や医療など高度な専門性が必要な仕事のサポート、より親しみやすいインターフェース、文献調査の効率化などによる科学研究の加速などが期待されるところです。 マルチモーダルLLMとGPT-4、GPT-4o GPT-4では入力データとして画像が扱えるようになったところ、ChatGPTの最新モデルであるGPT-4oでは音声もテキストも動画も入力として受け付け、音声とテキストおよび画像の出力ができるようになりました。こうした異なるモダリティー(種類)を扱えることをマルチモーダル、それが実現できるAIのことをマルチモーダルAI、さらにそれがLLMであればマルチモーダルLLMと呼ばれます。 GPT-4でも音声認識や音声合成と組み合わせれば音声での対話はできましたが、それは音声をテキストに変換して、テキストをLLMに入れて、出てきたテキストを再び音声に変換する方式でした。そのため、処理に時間がかかる、まとまった量の音声をためないとテキストに変換ができなし、声のトーンを変えられないなどのボトルネックがありました。 GPT-4oではそうした制約を取り払い、平均の応答時間を0.3秒に短縮し、途中で割り込んだり、内容に応じて声のトーンを変えたりできるようになりました。これにより、音声認識に向かって話しかけるのではなく、人と話すような自然な対話ができるようになっています。 マルチモーダルAIについてはこちらもご覧ください。 マルチモーダルAI【ビジネス成長のためのAI用語】 応用例 NECはボクシング世界戦の試合映像からハイライトシーンを作成する実証実験をしたと発表しました。AIによる映像認識技術を駆使して試合映像を分析し、激しい打ち合いなど勝負の分かれ目となるシーンの映像と画像を抽出し、状況を説明する文章をLLMで生成しました。実用化できれば、試合開始から終了まで映像を常に視聴することが難しい場合でも、SNSを通じて臨場感あふれる試合情報を把握しやすくなると見込んでいます。さらに、この映像認識とLLMを組み合わせた技術は、ドライブレコーダー動画の分析で活用を見込んでいたといいます。交通事故の際に動画を分析し、損害保険金請求用の報告書に活用することなどを想定し、ドライブレコーダー動画の分析以外の用途開拓を狙うとしています。 自律移動ロボットを開発するプリファードロボティクスは、音声による指示で家具などを移動するお手伝いロボット「カチャカ」をLLMに対応させました。カチャカは従来、「A(物)をB(場所)に持ってきて」などという定型の音声コマンドにのみ対応していましたが、LLMに対応させることによって自然な会話を通じて指示を出せるようになりました。例えば、「いつものやつを持ってきて」と言うだけで、仕事の道具を載せた専用棚を仕事部屋に持って来てくれたり、棚を運んできたら30秒後に棚を戻すという動作などを習慣化させたりすることもできるとしています。 ビジネス応用 2023年6月に経団連(一般社団法人日本経済団体連合会)がAI活用促進に向けた 政策提言 を発表し、その主眼の一つが「LLMをはじめとするAI基盤技術を日本独自でまかなうべき」というものでした。さらに経団連に歩調を合わせるかのように、2023年からは日本企業によるLLMの開発が相次いでいます。 また、前述の通りLLMはテキストデータを中心に処理する能力を持ちますが、数値、音声、画像など複数のモダリティーと組み合わせることでより広範な応用ができるため、さまざまな生成AIと組み合わせることで複合的なタスクに取り組めるようになることが期待されます。しかしそうしたマルチモーダルを含むLLMを運用するためには高性能なGPUなどへの設備投資が必要になり、実用されるまでに時間的・金銭的コストも多くかかってしまいますし、特定のビジネスのために活用するにはオーバースペックということもあります。 そこで最近注目されているのが、SLM(Small Language Model、小規模言語モデル)で、GAFAMに代表されるITジャイアントたちが、小規模モデルゆえに低コストで運用できるSLMの開発・性能向上に注力するようになってきています。例えばマイクロソフトが2023年11月に発表した「Orca2」は、モデルのパラメータ数が130億と70億でありながら、およそ10倍の規模である1000億パラメータ級のLLMに匹敵する推論性能を備えていると言われています。 こうした「小規模でも事足りる」ということの他にも、SLMが注目される理由として二つ挙げられます。 一つは、上記のようなITジャイアントによるLLM独占への警戒感があることです。大規模モデルの学習は規模が大きくなるほど必要な演算量も増えます。AWS(アマゾンウェブサービス)を使って学習をする場合、数十億円から数百億円がかかるといわれているという中で、継続してモデルを大規模化できる企業は限られるためです。 もう一つは推論側の演算量の削減です。モデルの大規模化に伴い、回答の性能は向上するものの、回答のための推論演算の量も増してしまうことです。GPT APIを使ったビジネスアプリケーションにおいてもこの観点は重要で、ビジネスでLLMを活用する場合も消費電力や利用コスト当たりの性能が当然重要になってくるからです。 近年、日進月歩で進化するLLM、SLMのこうした動きに注目しつつ、自社ビジネスに最適な言語モデルの在り方を検討していくことがビジネス応用において重要になってきています。 参考 ソフトバンク「 大規模言語モデル(LLM) 」 産総研マガジン「 自然言語処理とは? 」 NRI「 大規模言語モデル 」 教育とICT Online「 生成AI、対話型AI、LLMは何が違う? 」 ITmedia「 「GPT-4o」は何がすごい? なぜLLMは画像や音声も扱えるの? “マルチモーダル”について識者に聞いた 」 日本経済新聞「 NEC、AIでハイライトシーン抽出 ボクシング試合で実証 」 日本経済新聞「 コミュ力高いロボ、荷物も移動 大規模言語モデルで進化 」 岡野原大輔『大規模言語モデルは新たな知能か ChatGPTが変えた世界』 日経XTECH「 小規模言語モデルに注目 」 ITmedia「 機械に話しかけて設定できる時代が来る? なぜ“小規模”なLLMが求められるのか 」 The post LLM(大規模言語モデル)、トレンドは「小で事足りる」 first appeared on 株式会社Laboro.AI .
アバター
画像検索【ビジネス成長のためのAI用語】 公開2024.5.17 更新2024.9.6 株式会社Laboro.AI リードマーケター 熊谷勇一 用語解説 画像検索は、特定のクエリに基づいて、ウェブ上やデータベースの中から画像を検索する技術です。 そうした検索エンジンは、クローラーというロボットを使ってウェブページを巡回させ、画像だけでなくテキストや動画などのコンテンツをデータベースに登録します。この登録はインデックス作成と呼ばれます。インデックスには、コンテンツが掲載されているページのURL、キーワード、メタデータなどが含まれます。ユーザーがクエリを入力すると、検索エンジンはインデックスを検索して、関連する画像を探し、キーワードに一致する、または類似しているとされた画像が表示されます。 応用&詳細解説 すでに多くの人が利用しているように、「画像を画像で検索する」という「類似画像検索」も生まれました。この場合のクエリはもちろん画像であり、その画像の特徴(色、形状、テクスチャなど))を抽出して特徴量を分析します。その特徴量と、ウェブ上やデータベースにある各画像の特徴量を比較し、類似しているものを出力するシステムです。 特徴量を抽出する手法には三つの代表例があります。一つ目は「AKAZE」で、他の二つと違ってディープラーニングを利用していません。拡大・縮小や回転を施しても類似性を維持しやすい、学習の必要がなくすぐに利用できるなどのメリットがあります。また、PythonのOpenCVに実装されている点や、無償で商用利用できるなどの使いやすさもあります。ただしAKAZE自体は特徴点・特徴量を抽出するだけで、類似画像検索を実行する際は、特徴量の類似度を計算する必要があります。 二つ目は、ディープラーニングの学習済みモデルを用いた特徴抽出です。学習済みモデルは誰でも入手でき、AKAZEと同様に学習が不要なので、すぐに使えるというメリットがあります。また得られる結果は人間の判断にかなり近いという意見がある一方、どこに注目して似ていると判断したのかが分からないというデメリットがあります。 三つ目は、「Triplet loss」です。Triplet lossは、「似ている」としたい画像間の特徴量同士の距離を近くし、「似ていない」としたい画像間の特徴量同士の距離は遠くなるように、ネットワークのパラメータを取得するために使用されるロス関数のことです。つまり、人間の都合に望ましい結果が出る検索が可能になりますが、その分、学習量が膨大になるというデメリットがあります。 Googleのマルチ検索 類似画像検索はすでに普及していると言える状況になっており、最近ではGoogleが2023年に実装した「マルチ検索」といった拡大した機能も実現しています。マルチ検索は、Google レンズを使って、撮影した写真やスクリーンショットにさらにテキストを加えて検索できる機能です。例えば、ボードゲームのような物を撮影し、その画像に「このゲームはどのようにして遊ぶのですか」というテキストを組み合わせて検索すると、生成AIや画像認識技術、ウェブ検索を組み合わせて、AIによる回答と検索結果が表示されます。AIによる回答に対しては、文脈を引き継いだまま次の質問をすることもできます。 家具の画像検索などで利用法人数が3.7倍 リクルートのインテリア提案業務支援サービス「MINTERIOR」(ミンテリア)は2024年1月から、見た目が似ている商品をカタログから検索できる「類似画像検索機能」を搭載し、使い勝手を高めています。「形が似ている」「カラーが似ている」といった軸だけでなく、「ドラマの登場人物の部屋にあるソファに似た商品を探したい」といった複雑かつ新しい情報にも対応した検索も可能にしたとしています。これらの改善によってミンテリア事業が好調となり、2024年1月末時点の利用法人数は2023年3月末から3.7倍に増えたといいます。 ヤフーの画像検索技術 日本のインターネット企業であるLINEヤフーでももちろん、画像検索技術を開発・活用しています。類似画像検索についてはこれまで、2019年からiPhoneアプリ版のYahoo!ショッピングで利用可能にし、さらにファッション画像検索アプリ「FavNavi」をリリースしています。 それらでは、「物体検出を利用した矩形領域ベースの類似画像検索」の仕組みを採用しています。つまり、検索対象となるのは画像全体ではなく、画像内の各オブジェクトだということです。これにより、複数の商品が写っている商品画像でも、個々の物体を検索対象にできます。また、構図や背景に依存しない特徴量を抽出しやすいというメリットもあります。検索対象となるすべてのオブジェクトの特徴量は、商品情報などのメタデータと紐付けた上でインデックスされ、検索可能な状態になります。 そうしたインデックスされるオブジェクト数はおよそ10の8乗規模ですが、この規模の高次元特徴量を高速に検索するため、近似近傍探索(最近傍探索に比べ厳密な近傍点を求めず、近傍点との距離を近似計算することで、計算時間を抑えながら近傍探索を行う手法)を採用しています。同社の類似画像検索の特徴としては、データから、物体検出、特徴量、近似近傍探索までの実施を自社で完結していることも挙げられます。 物体検出については当社コラム「 物体検出【ビジネス成長のためのAI用語】 」もご覧ください。 ビジネス応用 ECやネットオークション、フリーマーケットサイト、画像SNSなど、大量の画像を扱うサービスが普及しており、類似画像を検索する需要も高まっています。従来のように人手によるタグ付けは多大な労力が必要なだけでなく、画像の色合い(ヒストグラム)や形状などの類似度を用いるだけでは、例えば色合いは似ているが中身は全く違う画像が誤って選ばれてしまうなどの不適切な検索結果となることもありました。 しかし現在では、適切な教師データで事前にディープラーニングを施しておくことで、一つずつの画像にはタグを付与しなくても、AIが画像の中身を理解して適切な画像を出力するソリューションも実現しています。 それにより、例えばEコマースにおいては、ECサイトの裏側に走る商品検索システムとしてAI画像検索を活用することで、ユーザーが閲覧している商品と近い商品をレコメンドするための商品画像をより高い類似度で検索できるようになります。そのことから、こうしたレコメンドシステムでよく課題となる「コールドスタート問題 (閲覧・購買履歴が十分に蓄積されていない初期ユーザーには、レコメンドできる商品が見つからない問題)」を解決するために、画像検索は大きな貢献を果たします。例えばユーザーが選んだ画像に加えてタグや気分も情報として加え、より精度の高いレコメンドができる可能性が生まれます。 大量の画像データを保存・検索・活用するためのコンテンツ管理システムでは、画像をクエリとして内容が近い画像を検索できるようになり、従来のタグやファイル名、日時などに基づく検索システムに組み合わせて使うことで、より直感的な画像検索が可能になります。 さらに、こうした類似画像検索のソリューションでされてきた代表的な工夫の例を二つ挙げます。一つ目は、畳み込みニューラルネットワーク(CNN)のアーキテクチャであるResNetを採用し、高い精度での画像検索を可能にしているものがあることです。ResNetは100層を超える「深い」ニューラルネットワークのアーキテクチャで、画像認識のコンペティションであるILSVRC(ImageNet Large Scale Visual Recognition Challenge)で人間を超える精度を実現したモデルです。画像理解のコアの部分にResNetのアーキテクチャを使用することで、画像の内容を正確に把握して検索することを可能にしています。 もう一つが、柔軟な教師データによる類似尺度のコントロールをしている例があることです。「どのような画像が似ているのか?」という判断は、そのシステムが使われるコンテキストにより変わります。クエリ画像とそれに似ている画像、似ていない画像の三つの画像の組を教師データとして与えることで、類似尺度をコントロールします。これは、ランク学習(Learning to rank)と呼ばれる機械学習手法をディープラーニング技術と融合する事で実現しています。 ごく最近では、GPT-4oを活用する方法も出てきました。GPT-4oに画像を読み込ませ、人間が作業する場合の作業者の興味・関心の強さによらずさまざまな特徴をが画像説明文(キャプション)として高速に生成させ、さまざまな在り方の検索に対応できるデータベースの構築に役立てられます。 当社ソリューション Laboro.AI「 類似画像検索ソリューション 」 参考 PLAN-B「 クローラー、インデックスとは?Googleの検索エンジンにページが認識されるまでの仕組みを理解しよう 」 TOSHIBA「 深層学習を用いた類似画像検索技術 」 iMagazine「 類似画像検索の3つの手法と精度向上のテクニック 」 Google Japan Blog「 AI が可能にする新機能 -より視覚的な検索体験を 」 日経XTECH「 Googleが生成AI使った「マルチ検索」開始、画像とテキストの合わせ技 」 日本経済新聞「 リクルート、「似ている」家具を画像検索 提案業務支援 」 LINEヤフー「 ヤフーの類似画像検索技術と特徴量モデル 〜 Yahoo!ショッピングの事例紹介 」 PR TIMES「 Laboro.AI、画像を内容の近さで検索できるAI画像検索システム「類似画像検索エンジン」をリリース 」 The post 画像検索【ビジネス成長のためのAI用語】 first appeared on 株式会社Laboro.AI .
アバター
AI創薬【ビジネス成長のためのAI用語】 公開2024.6.14 更新2024.8.21 株式会社Laboro.AI リードマーケター 熊谷勇一 用語解説 AI創薬とは、AIを活用して新しい医薬品を開発することを指します。従来、創薬には時間などの膨大なコストがかかり、新薬が市場に出るまでに多大なリソースを要しました。しかしAIを活用することにより、化合物の設計やドッキングシミュレーション(低分子・生体高分子間相互作用における複合体の安定構造をコンピュータ上で計算的に推定する手法)、創薬ターゲットの特定、スクリーニング(有用な物質を薬剤候補群の中から見いだしたり、最も高い薬効を示す物質を選別したりする作業)、病理画像解析による薬効・安全性の評価、自然言語処理を用いた論文検索などを、迅速かつ効率的に実施できる可能性が出てきました。さらにAIは膨大なデータから、人間では分からなかったパターンを見いだすことがあり、これにより新しい創薬が促進される面があります。 海外のAI創薬の動き 中国の晶泰科技 中国がAIや量子技術を活用する次世代創薬で攻勢に出ています。新興で創薬支援の晶泰科技(XtalPi、クリスタルパイ)は2024年6月の上場を機に研究開発能力を高め、政府も多額の補助金で産業振興を急いでいます。晶泰の株主にはグーグルや中国ネット大手の騰訊控股(テンセント)、ソフトバンクグループ傘下のビジョン・ファンドが名を連ね、上場前から7億ドル(約1100億円)超の資金を調達していました。米調査会社フロスト・アンド・サリバンによると、AIを活用した創薬を手掛ける新興企業として世界最多の調達額です。 晶泰は、新薬の開発で効き目のありそうな新薬の「タネ」を探す段階で量子力学による計算や生成AIを使っています。コロナ向け飲み薬である米国のファイザーの「パクスロビド」の開発では結晶構造の特定を支援し、通常は数年かかる開発工程を6週間に短縮したといい、それにより、同社の研究開発能力が世界に知れわたりました。ファイザー以外にも同じく米国のジョンソン・エンド・ジョンソン、イーライ・リリー、ドイツのバイエルもすでに晶泰の顧客で、メガファーマ(大規模な製薬会社)やバイオ技術企業で世界トップ20社のうち16社とも取引があるといいます。 晶泰は新薬候補となるたんぱく質の予測などに活用する独自の生成AI「プロテインGPT」などを活用し、顧客である製薬大手の創薬を支援しながら成長を目指しています。さらには化合物を生成する能力を生かし、農薬や化粧品の開発など幅広い分野でも事業領域を広げていく計画です。 ドイツのメルク ドイツの医薬品メーカーであるメルクは、大部分のIT インフラを米国のアマゾンが提供するAWS(アマゾンウェブサービス)へ移行し、特に分析とAIに関するサービスを活用することにより、研究開発の加速を見込んでいます。メルクが持つ数テラバイトに及ぶ検査データから洞察を引き出し、機械学習モデルの事前学習に必要なデータが限られている場合でも、亀裂や異物の混入といった複雑な不良を見つけやすくなり、規格不適となる医薬品の誤検出を減らすことができるとしています。 米国のポラリス・クオンタム・バイオテック 米国のポラリス・クオンタム・バイオテックの創薬プラットフォーム「タキオン」は、AI・機械学習が活用されており、膨大な化学ライブラリーを自動プロセスで検索し、同時に複数の並列プロジェクトを実行できます。それにより、新薬のリード化合物(創薬標的分子に対して活性が認められ、さらに医薬品として適切な性質を持つ化合物)を開発するための新規分子を、現在の医薬品開発プロセスと比較してわずかな時間とコストで見つけることができるとしています。 フランスのサノフィと英国のエクセンシア フランスの製薬企業サノフィと英国のAIベースの製薬を手掛けるエクセンシアは、実際の患者試料(臨床検査に⽤いた⾎液、尿など、診断のための⽣検(内視鏡検査などの際 に組織の⼀部を採取すること)試料、⼿術で切除した組織など)を使用して、エクセンシアのAI創薬プラットフォームを用い、がんを中心とする腫瘍と免疫の分野で低分子の新薬を発見・開発する協業をしています。AIと機械学習の活用で患者試料を扱えることにより、マウスを使った手法よりもはるかに高い精度で創薬ができる可能性が生まれ、さらにはスケジュールの短縮も見込まれています。 応用&詳細解説 三つの事例を基に説明します。 エーザイは、機械学習やディープラーニング等のAI技術を活用することで、より効率的に医薬品候補品を見出すことに取り組んでいます。大量の化合物についての評価データ(薬効、物性、薬物動態、安全性)で学習した機械学習やディープラーニングのモデルは、化合物を合成することなく、その化学構造から薬効、物性、薬物動態、安全性を予測することを可能とし、研究者による新規化合物の設計を支援するとしています。 富士通は理化学研究所と協働し、生成AIを使って、薬が標的とするたんぱく質の体内での状態を予測する技術を開発しています。「クライオ電子顕微鏡」と呼ばれる先端顕微鏡で撮影したたんぱく質の画像を学習して、動きのある立体構造として再現する生成AI技術のことで、薬が標的とするたんぱく質の形や動きを推定する作業を高速化できるとしています。代表的な物質の「リボソーム」を使った実験では、専門家が1日かけていた作業を2時間と10分の1以下に短縮しています。2025年3月期には製薬会社と実証実験を始める計画です。 日本医療研究開発機構が旗振り役となり、京都大学や武田薬品工業などが参加する創薬AIの共同プロジェクトもあります。AIは学習用のデータが多ければ多いほど、より精度が向上する傾向が高まりますが 、日本の製薬会社は欧米のメガファーマに比べて規模が小さく、1社だけでは創薬AIの学習データが十分にそろわないという弱点があります。そこでこのプロジェクトでは、連合学習という手法を用い、参加各者が持つ実験結果や薬剤の化学構造など、知的財産に関わるため機密性が高く、社外に持ち出すのは難しかったデータを連携させています。 連合学習とは、学習データセットが分散している環境下での機械学習モデルの学習法の一つです。従来の機械学習では、データセットが分散している場合、まずそれらを一つの大きなデータセットに集約し、それから機械学習モデルの学習を始めていました。しかし連合学習では、機械学習モデルを一つずつ学習させ、その結果得られた各モデルをマージし、それを各モデルに戻す、という流れを繰り返して学習を進めます。 ビジネス応用 AI創薬により、創薬のための時間などのコストを低減させられる可能性があることは、前述の通りです。さらなる応用としては、患者ごとの遺伝情報や病歴に基づいた最適な治療法を提案できることが考えられます。これにより、患者ごとに異なる治療効果や副作用を改善させられることも見込めます。 副作用については、過去の薬剤データや副作用情報を活用し、AIがリスクの高い化合物を排除し、さらに候補化合物の副作用を事前に予測することで、安全性の高い薬剤を早期に見つけ出せる可能性も出てきます。 このように、単に創薬に関わる業務・作業が効率化するということだけでなく、新薬の発見に向けたシミュレーションやパーソナライズ化を通して、一人ひとりの消費者とっての健康増進やウェルビーイングにつながる可能性が拓かれる点に、創薬AIの本質的な価値があります。また、製薬会社だけでなく、研究機関、保健所、公的機関なども含めたデータ共有プラットフォームの構築などを通じて、企業単体での活動ではなく産業全体が連携することになれば、より豊富なデータを元にした高度なAI予測も可能になってくるはずです。 こうした期待の高まりの一方で、AIによる創薬、具体的にはマテリアルズ・インフォマティクスやAIシミュレーションなどは、開発難易度の高いAI領域の一つでもあります。そのことは、上記で挙げた創薬AIの取り組み例が基本的に複数社が協働するかたちになっていることにも反映されているといえるかもしれません。データさえあれば良いというわけではなく、人命にも関わる分野であることからも、データの前処理はもちろん、目的に適したAIモデルの選択・設計、評価方法の検討など、専門的な知見を備えた上での慎重な検討を積み重ねていくことが肝要です。 参考 実験医学online「 ドッキング 」 日本経済新聞「 量子創薬の中国・晶泰、1000億円超調達 ファイザーも頼る 」 PR TIMES「 AWS と Accenture、Merck の創薬期間の短縮と臨床開発の加速をクラウドテクノロジーで支援 」 AT PARTNERS「 Polaris Quantum Biotech 量子コンピュータを利用した創薬 」 Business Wire「 エクセンシアとサノフィが戦略的研究の協業関係を構築し、AIを駆使した精密工学的医薬品のパイプラインを開発へ 」 エーザイ「 AIを活用した低分子医薬品候補のデザイン 」 日本経済新聞「 富士通、生成AIで創薬速く たんぱく質状態予測10分の1 」 MSIISM「 連合学習とは?Federated Learningの基礎知識をわかりやすく解説 」 中外製薬「 AIを活用した新薬創出 」 The post AI創薬【ビジネス成長のためのAI用語】 first appeared on 株式会社Laboro.AI .
アバター
マルチモーダルAI【ビジネス成長のためのAI用語】 公開2024.6.11 更新2024.8.19 株式会社Laboro.AI リードマーケター 熊谷勇一 マルチモーダルAIとは、テキスト、音声、画像、動画などの異なるモダリティー(データ形式)を組み合わせたり関連付けたりして、それらの複合的な情報を一つのネットワークで学習・推論・処理をするAIのことです。対義語はシングルモーダルAI、つまりテキストや音声など単一のデータ形式のみを扱うAIです。 シングルモーダルAIとマルチモーダルAIを比較すると、前者は例えば画像という単一種類のデータを処理 して 顔認識をしたり、音という単一データを処理してテキスト変換したり、テキストという単一データを処理して要約や翻訳をしたりするAIモデルを指します。シングルモーダルではそれぞれのAIが個別特定のデータから学習・推論することに対して、後者は例えば画像と音、テキストの複数のデータを一つのAIモデルで学習し、与えられた環境を認識・推論することを得意とします。複合的な情報を同時に、そして組合せて処理することから、シングルモーダルAIでは得られない、多様な表現や解釈、洞察を備えたAIを開発できる可能性があります。 市場調査を手掛けるインサイトパートナーズ社は、マルチモーダルAIの市場規模は2023年の8億9350万ドルから 2031年には約12倍の105 億5020万ドルに達すると予測を出しており、業界を問わず広く活用されていくことが見込まれます。 応用&詳細解説 GPT-4o OpenAIが2024年5月に発表した最新のAIモデル「 GPT-4o(ジーピーティーフォーオー) 」は、一般向けのサービスとしては初とも言えるマルチモーダルAIです。その詳しい仕様は公開されていませんが、単一のニューラルネットワークで構成されたAIであり、言語、画像、音声、動画を複合的に処理できるとされています。従来のChatGPT/GPT-4でも部分的に複数データへの対応が実現されていましたが、これらはChatGPTにDALL•E(画像生成AI)など別のAIモデルを連携させる形が取られていたことが考えられます。AI同士の即興デュエットを披露したりするなど、マルチモーダルAIの強みが発揮されたその様子が公開され、世界を驚かせました。なお、名称の「o(オー)」はomniは、「すべての〜」を表す接頭辞です。 OpenAIはさらに7月に、最新のAIモデル「GPT-4o mini」を発表しました。従来のモデルに比べて小型で利用料が安いのが特徴です。API経由での提供も開始しており、利用料は100万入力トークン当たり15セント、100万出力トークン当たり60セントで、「GPT-3.5 Turbo」と比較して60%、最高性能モデルである「GPT-4o」との比較では10分の1以下です。パラメーター数などを抑えた「安くて速い」AIモデルが技術開発のトレンドとなっており、この流れに追随したかたちと言えます。ビ LLMではなくLMM LLM(大規模言語モデル)と似た用語として、LMM(Large Multimodal Model、大規模マルチモーダルモデル)も出てきました。その名の通り、マルチモーダルAIのことを指していますが、特にデータが大規模であることを強調した用語と言えるかもしれません。 言語習得の謎に迫る 人はどのように言語を習得するのかという、言語学者が長年追い続ける謎に、ニューヨーク大学はマルチモーダルAIを活用した研究で迫ろうと挑みました。一人の子供の頭部にカメラを取り付け、生後6〜25カ月のときに見た映像と耳にした声を集め、60万フレームの画像情報と3万7500の発話を起こした文字情報、つまりマルチモーダルな情報でAIに学習させたところ、「ボール」「ネコ」など22種類の言葉を6割以上の精度で見分けられるようになったとしています。 ビジネス応用 自動運転 自動運転では、走行中に障害物を検知する必要があります。目の前に現れた物体が何かを視覚的に判別するカメラ(画像データ)に加えて、物体がそこに存在するかどうかを判別するのに視覚情報に頼らないセンサー(時系列データ)の両方のモダリティーを組み合わせることで、障害物を高速かつ精度高く検出できる可能性が広がります 。 フリマアプリでの不正出品検出 1日100万品以上が出品されるフリマアプリ「メルカリ」では、不正出品の検出にマルチモーダルAIを活用しています。商品の説明文やブランド、カテゴリー、価格という情報だけでなく、商品画像も入力とすることで、以前より高精度な不正出品の検出ができるようになったとしています。 医療分野 マルチモーダルAIの例として、画像診断と電子カルテ情報を組み合わせた診断支援があります。比較的手軽な超音波検査による画像とカルテにある患者情報というテキストデータを基にAIが十分な診断支援ができれば、従来必要だった検査が不要になるなどさまざまなコストを低減させられることが期待されます。 迷惑行為や不正行為の監視 マンション管理にもマルチモーダルAIを応用できる可能性があります。例えば、大声などの騒音や、嘔吐や走り回りなど施設・設備を毀損する可能性のある迷惑行為、共有部に長時間放置されている物品などを、監視カメラによる映像とマイクによる音情報を活用することで検知し、警備員の業務支援ができるようになるかもしれません。 感情分析 マーケティングにおける市場調査で消費者・利用者にインタビューした結果を業務に生かす場合、発話という音声データと表情という画像データを一緒に解析してより高度な感情予測ができれば、製品・サービスの改善だけでなく、新商品・サービスの開発にも役立てられるようになるかもしれません。なお、このように人の感情を把握・予測・分析するAIは「感情分析AI」とも呼ばれています。 マルチモーダルAIにはさまざまなデータ形式が使われることを説明してきましたが、特にビジネス応用における現在の主流は、テキストと画像の二つのデータの活用です。その場合、例えばGPT-4oなどのAIモデルをAPIで活用する手があり、逆に言えば、1社での利用でそれらと同等のモデルを開発するために必要な膨大なデータを収集するのは、現実的ではないでしょう。いずれにせよ、目指すビジネス目標に対してどんなデータ活用法が最適なのかを見いだすには、ビジネスセンスが欠かせないのは言うまでもありません。 参考 産総研マガジン「 マルチモーダルAIとは? 」 ソフトバンク「 マルチモーダルAI 」 ビジネス+IT「 GPT-4oをわかりやすく解説、専門家が「時代の転換点」と評価するヤバすぎる能力とは 」 The Insight Partners「 マルチモーダル AI 市場 – 2031 年の成長予測、統計、事実 」 日経XTECH「 OpenAIが「GPT-4o mini」発表、激しくなる「安くて速い」AIモデルの開発競争 」 日本経済新聞「 人を再現? 耳目で言葉学ぶAI、言語習得の謎に迫るか 」 メルカリエンジニアリング「 マルチモーダルモデルによる不正出品の検知 」 日経XTECH「 「マルチモーダルAI」を医療に応用、患者情報も学習した画像診断AIの実力とは 」 DATA INSIGHT「 マルチモーダルAIによる行動認識技術 ~COVID-19対策への適用例~ 」 日本経済新聞「 AIロボで効率接客 」 The post マルチモーダルAI【ビジネス成長のためのAI用語】 first appeared on 株式会社Laboro.AI .
アバター
生成AIが作り出す音楽は「ファーストフード」で終わるのか 2024.5.5 監 修 株式会社Laboro.AI 執行役員 マーケティング部長 和田 崇 概 要 SunoやUdioといったAI音楽スタートアップが注目を集める中で、AIを用いて音楽を生成することへの逆風が強まっています。 今年6月24日、ソニーミュージック、ワーナーミュージック、ユニバーサル ミュージックは、SunoとUdioに対し、トレーニングデータを許可なく使用し、AIモデルが本物の人間の音声録音品質を模倣した曲を生成できるようにしたとして、著作権侵害の訴訟を起こしました。 一方で、この音楽生成AIの著作権問題に対策済みの、倫理的に訓練された音楽生成AIも新たに登場しています。倫理面に関しては、そもそも従来の音楽業界のあり方に懐疑的な声もあり、テクノロジーによって間口が広がる中で、ミュージシャンやクリエイターにとっての透明性を追求した著作権管理サービスも広まっています。 今回は、最新のテクノロジーが音楽業界に与えている影響に注目し、音楽制作の未来について考えていきたいと思います。 目 次 ・ 音楽生成AIに吹き荒れる逆風  ・ 開発に使われたトレーニングデータ  ・ もはや生成ではなく、模倣である ・ 倫理的な音楽生成AIの登場  ・ 著作権にかからない、トレーニングデータ  ・ 限られたトレーニングデータでできること ・ 音楽テクノロジーとファン心理  ・ 機械の歌声に感動する ・ 反倫理的な面を持つ音楽業界  ・ 終わりと始まり  ・ 倫理と透明性が広まるインディーズ  ・ ロイヤルティを「死角」から露す ・ AI音楽でチャンスを増やすために  ・ 「タップしてプレイする」のが人ではない  ・ 環境問題のように音楽にも取り組む  ・ どんな音楽も「きれいさ」は普遍的 音楽生成AIに吹き荒れる逆風 開発に使われたトレーニングデータ 飛躍的な進歩を遂げた音楽生成AIが、激しい論争の的となっています。その渦中にある音楽生成AIの一つで、今年1億2,500万ドル(約200 億円)の資金を 調達した 音楽生成AIの「 Suno 」は、簡単なプロンプトだけで、歌詞付きの完成された曲を作成し、それを人間的な声で歌わせることができる音楽生成システムです。 いわば音楽版ChatGPTで、例えば「カピバラの歌を作って」と指示すれば、一瞬でカピバラの歌ができ上がります。ちなみに、カピバラの歌は実際にSunoで生成された人気ソングに挙げられていたものです。 こうした音楽生成AIに非難の声が高まっているのは、たとえミュージシャンの名前をそのまま入力することはできない仕様になっているとはいえ、プロンプトを一工夫するだけで過去のヒット曲を思い起こさせるような曲を作り出すことができるためです。 Sunoのトレーニングデータにはオンラインで公開されているさまざまな音楽や音声が含まれているそうですが、 確認されている 既存の楽曲との類似例を聞けば著作権がすでに所有されている楽曲がトレーニングデータに含まれていることはほぼ明らかです。Sunoの初期投資家の一人が語った次のような 言葉 はその深刻さを物語っています。 「 正直言うと、もしこの会社がスタートしたときにレーベルと契約を結んでいたら、おそらく投資しなかったでしょう。制約を設けずにこの製品を作る必要があったと思います。 」 もはや生成ではなく、模倣である これを見過ごすことはできない音楽業界では、まずソニーミュージックが今年5月、700社以上のAI開発企業やストリーミングサービス企業に対して オプトアウト書簡 を送り、自社の音楽をAI開発のトレーニングデータに使用しないよう警告 しました 。 続いて今年6月、ソニーミュージック、ワーナーミュージック、ユニバーサル ミュージックは、SunoとUdioが、想像を絶する規模で著作権保護された音楽を許可なくトレーニングデータに使用し、AIモデルが本物の人間の音声録音品質を模倣した曲を出力できるようにしたとして訴訟を起こ しました 。 さらにアメリカでは、多くのミュージシャンを輩出してきたテネシー州が「エルヴィス法」というAI 音楽に関する法律を制定し、AIによる音声や作品の類似物の制作・流通を禁止する初めての州となり ました 。 こうした音楽生成AIに対する危機感や批判が高まる中で、ついに倫理的に訓練された人工知能を搭載した新しい音楽生成AIも発表されることとなります。 倫理的な音楽生成AIの登場 著作権にかからない、トレーニングデータ 透明性や倫理性を重視した音楽生成AI「 Jen 」は、テキストプロンプトから音楽を生成するAIシステムで、歌や歌詞をつけることは現時点ではできません。 初期トレーニング セットには完全にライセンスされた40以上のカタログが含まれており、すべての出力において、アーティストと業界の著作権基準の両方を尊重することが保証されている そうです 。 Jenでは、1億5,000 万ものトラックが含まれるデータベースを使用して、トレーニングデータも、生成された楽曲も、オーディオ認識と著作権識別に関して自動的にチェックされます。 さらに、生成されたトラックはルート・ネットワーク・ブロックチェーンに記録され、利用者が作成したトラックを所有し、録音して販売可能にすることができるよう準備されている そうです 。 Jen共同創業者のシャラ・センダーロフ氏はかつてブロックチェーンのベンチャーファンド兼スタジオを設立した経緯もあり、そすた経験がこの音楽生成AIのサービスに集約されているのかもしれません。 限られたトレーニングデータでできること それでは、著作権が固く保護されている楽曲以外から学んだであろう ”倫理的な” この音楽生成AIがつくる曲は、一体どのような曲なのでしょうか。 実際にWiredに掲載されていたプロのミュージシャンの感想によると、システムのデータ不足なのか「シティ・ポップ」などの指示がうまく通じず、生成された曲をクールだと感じる瞬間はなく、サウンドがクリーンすぎる、というような コメント が見受けられました。 おそらく現段階では、人を楽しませたり癒したりする域には及ばないものの、コスト重視の低予算の広告などにはすぐにでも使われるようなレベルなのでしょう。今後、トレーニングデータに関するライセンス取得が広範囲に進展すれば、人の心を揺さぶるような曲も徐々に生み出せるようになっていくのかもしれません。 音楽テクノロジーとファン心理 機械の歌声に感動する 音楽とAIに関しては音楽生成AIが広まる以前に、2023 年にもビートルズの新曲「ナウ・アンド・ゼン (Now And Then)」が議論を呼びました。古いデモ音源からジョン・レノンの声をAIで分離して楽曲が作成され、その完成度の高さからAIによる音声再現は人間の声にとって代わる脅威だとする見方が 出てきた ためです。 ところが蓋を開けてみれば、YouTubeで公開されたこの楽曲のミュージックビデオは今年7月時点で126万いいねを獲得し、コメント欄はファンからの熱いメッセージで埋め尽くされて います 。 機械的な歌声、いわゆるボーカロイドについても、日本では初音ミクをはじめとするバーチャルシンガーがすでに広く受け入れられており、「感情のない声が深いことを歌うから面白い」というような若者の声も聞かれます。 さらに、デジタル化によってオートチューンの効果で完璧な音に聴こえるようにされてきましたし、人気アーティストがコンサートで事前録音され調整された自身のバッキングトラックに合わせて歌っていたりと、デジタル技術はだいぶ前から音楽に深く入り込んでいます。 反倫理的な面を持つ音楽業界 終わりと始まり テクノロジーは私たちの想像をはるかに超えて音楽の中に溶け込んできたにもかかわらず、音楽生成AIの登場に「音楽はついに終わりだ」といったコメントを見かけます。しかしながら、人々が掲げるAI音楽への非難は、以前から苦境に立たされ続けてきた多くのミュージシャンやクリエイターにとって、音楽業界がどうあるべきかを再構築する上でも、音楽ビジネスに一石を投じたともいえそうです。 SunoとUdioを訴えた世界の三大メジャーレーベル、ソニーミュージック、ワーナーミュージック、ユニバーサルミュージックは音楽市場の70%近くのシェアを 占めています 。そして、これら企業が大きな力を持つようになったビジネスのあり方そのものが、反倫理的な面を持っているという意見があることも事実です。 従来の音楽業界では、大企業 VS 個人という図式で多くのミュージシャンが不利とも言える契約を結ばざるを得ないこともあったり、昨今のデジタル化による楽曲の流通の複雑さから、どこでどのように利益が生まれているのかが不透明だったりといった問題が指摘されて います 。 倫理と透明性が広まるインディーズ 大企業的なビジネスモデルとは打って変わって、デジタル化はまた、音楽に携わる個人にとってSpotifyなどの自由な楽曲発表の場を設け、ソーシャルメディアによって楽曲制作はこれまで以上に共同作業が可能になり、1 つのトラックのクレジットに何十人ものライターが登場するという新たな流れを生み出して きました 。 SoundCloudなどのプラットフォームも人気を呼んでインディーズ市場は 活気を帯び 、ミュージシャンやクリエイターへの倫理的な著作権管理サービスを提供する企業が注目されています。 収益を最大化させることよりも透明性を選んだこうした企業の一つであるKobaltは、ミュージシャンやクリエイターに選ばれることによって黒字化を実現し、現在アメリカとイギリスでトップ100位以内の楽曲およびアルバムの40%に関わるほどに成長している そうです 。 ロイヤルティを「死角」から露す KobaltのCEO、ローラン・ユベール氏は、次のように 語ります 。 「 ロイヤルティ徴収の流れは、ソングライターや権利者にとって大きな死角となっています。そのデータをアンロックすると、新進気鋭のソングライターから世界最大のアーティストにまで、衝撃を与える可能性があります。 」 新しいテクノロジーによって生まれた新たな動きが、メジャーレーベルの築き上げた立場さえも揺るがしつつあります。 AI音楽でチャンスを増やすために 「タップしてプレイする」のが人ではない 音楽生成AIは、その生成の速さや簡単さを揶揄して「ファーストフード」と例えられたりもします。しかし、バークリー音楽大学のベン・キャンプ教授はインタビューの中で、音楽生成AIを別物としたりなかったことにしたりするよりも、その倫理的使用について積極的に教えることの重要性を強調しています。 そして、テクノロジーがどれほど進化しようが人は人とつながり、音楽には人が集まり、そのような文化をつくれるのは人なのだとして、人はただ「タップしてプレイする」だけの存在ではないと 述べます 。 人がAIで音楽を生成するとき、ただタップしてプレイするのではなく、AIと音楽を共同制作する体験になることをAI開発者も目指しています。前出の音楽生成AI、Jenの開発においても、開発したモデルがユーザーの芸術的想像力や嗜好を生成プロセスに組み込むのには柔軟性が欠けていることから、それを修正するためのアプローチの詳細が 論文 に発表されています。 その中では、ユーザーとAIが対話するようにして協力し合うことの重要性とともに、人とAIの音楽的な役割が次のように示されていました。 「 (人間の)自由な即興と( AIの)全体的な構造の一貫性のバランスをとり、両方の長所を組み合わせて音楽生成を次のレベルに引き上げる 」 環境問題のように音楽にも取り組む AI音楽の市場規模は、今後5年間で10倍以上に成長し、2028年までに30億ドル(約 4,822 億円)の収益が見込まれていますが、同時に音楽クリエイターの27%が音楽生成AIによって収益を失うリスクにさらされ、このままいけばリスクが機会を上回ると予測されても います 。 それを覆し、チャンスがリスクを上回るようにするために必要なことは、法整備なども含めて倫理的で透明性あるシステムをつくり、音楽業界における変化を促進することはもちろん必要です。ただそれだけではなく、自然の価値を見直してプラスチック消費を減らすことと同じように、テクノロジーとの融合も含めた新たな音楽の在り方を、ファーストフードとしてではなく、その可能性や素晴らしさを再認識して守っていく意識を高める教育も必要になるの でしょう 。 どんな音楽も「きれいさ」は普遍的 例えば選挙演説と比較しても、いい音楽が呼び寄せる人の数は桁違いで、音楽が人を動かす力は偉大です。小澤征爾氏が、「 沈む夕日のようにきれいさが違わないということが音楽じゃないか 」という 言葉 を残したように、誰が見ても、どんなに疲れていても、よい音楽がよい音楽であることには変わりありません。テクノロジーが使われていてもいなくても、私たちの心はよい音楽に引き寄せられ続けていくものなのではないでしょうか。 The post 生成AIが作り出す音楽は「ファーストフード」で終わるのか first appeared on 株式会社Laboro.AI .
アバター
異常検知【ビジネス成長のためのAI用語】 公開2024.4.25 更新2024.7.30 株式会社Laboro.AI リードマーケター 熊谷勇一 用語解説 AIによる異常検知 (anomaly detection。異常検出とも)とは、大量のデータの中から、平均値から大きく外れていたり、急激な変化が起きるきっかけとなったり、通常とは振る舞いが異なったりする「異常値」となるデータを検出する技術です。どの程度異常であれば異常値となるかは、正常値とから外れる度合いを設定することによって定義できます。 異常検知は従来、人間の五感に頼るところが大きく、しかもそれぞれの業界や業務に特有の専門的な知識や経験が必要であったり、異常がないかどうか確かめなければならない対象が多くなればなるほどより多くの人手が必要になったりするという課題がありました。そうした課題をAIによる異常検知で解決できる可能性があるのです。 応用&詳細解説 AIによる異常検知の方針には、大きく分けて三つあります。一つ目は「変化点検知」で、データの構造や性質などが急激に変化する部分を検出することです。時系列データにおいて急激な変化が起きるタイミングを検出することとも言えます。例えば、ウェブサイトへのアクセスが急激に増加し、その傾向が継続する始まりとなったタイミングを検出し、社会情勢の影響などを検証するきっかけにできます。 二つ目は「異常部位検知」で、モニタリングしている時系列データのうち、一定時間続いた異常を検出することです。例えば、心拍が緊張や恐怖、病気などで大きく変化したことを検知することなどに活用できます。 三つ目は「外れ値検知」で、全体的なデータから大きく外れているデータを検出することです。 データが多くなればなるほど、外れ値を目視で確認するのに時間がかかります。例えば、手入力によって誤った値で入力されたデータを検出することが挙げられます。時系列データも、それ以外のデータも扱えるということです。 それぞれの違いが分かるように整理すると、変化点検知は発生してその後正常に戻らなかった異常が発生したタイミングを検出すること、異常部位検知は一定時間発生してその後正常に戻った異常を検知すること、外れ値検知は時系列データであれば一瞬の異常や、時系列データでなくてもデータの集合の平均から大きく外れた値を検知することです。 活用事例 JR博多駅ビルの複合商業施設「JR博多シティ」は、AIで防犯カメラの映像を解析し、暴力行為や転倒などを検知する取り組みを始めています。400種類を超す防犯カメラの映像を、建物内にある防災センターで24時間監視。AIが映像データを解析して異常を検知するとセンター内のモニターに警告を表示し、監視員が映像を確認した上で、必要に応じて近くの警備員に連絡し、現場に急行させます。AIが検知するのは暴力行為やけんか、転倒といった非常事態から、同じ場所にずっととどまり続けるなどの不審行動、車いすや白杖の人まで多岐にわたります。従来は防災センターの監視員が常時、複数のモニターに入れ替わり表示される映像を目視で確認していましたが、そうした人員を別の業務に回すなど警備業務を効率化できたと言います。 似たようなシステムは、RIZAPグループの低料金ジムで、会員数が110万人超で国内首位を誇る「chocoZAP(チョコザップ)」でも導入されています。AIカメラが店舗を常時監視し、わずかな人数で全店を監視できるとしています。利用者が動かないなどの異常を検知するとアラートが出て、遠隔監視センターのスタッフが確認し、急病なら救急車を直接呼び、マシンの故障対応なら近くのRIZAPの店舗からスタッフを向かわせるなど、状況に合わせた対応を取っていると言います。 鉄鋼商社の岡谷鋼機は、鋼材の切断機で使う薄い帯状の刃物に生じたヒビを、AIを活用して検知できるシステムを開発しました。切断機に集音マイクを設置し、ヒビが切断機の部品に当たる際の微小な音を検知して警告を出す仕組みです。顧客の鋼材加工工場の切断現場で4カ月間集めた音のデータをAIに学習させ、音を聞き分けることで破断の予兆を高い精度でつかめるようにしています。ヒビが入った刃物を早い段階で研磨し直すことで使用期間を延ばし、鋼材のロスや刃物の交換時間の削減につなげられるとしています。 また、技術としては異常検知に重なる部分があり、ここ2年ほどのインターネット検索のトレンドとしては異常検知を上回っているのが、不正検知です。AIを活用した不正検知サービスの対象は大きく二つに分かれます。一つはクレジットカード決済や銀行振込などインターネットを介した金融取引における異常を検知するもので、人間の監視では見逃され得る損失を防ぐ効果が期待されます。もう一つは、例えばメールを監視し、各種ハラスメントや贈収賄、会計不正の予兆を検知するもので、金銭的な損失だけでなく、従業員のエンゲージメントの低下を防いだり、評判リスクを低減させられたりすることが期待されます。 ビジネス応用 AIによる異常検知は、製造業での品質管理や、ウェブサイトのアクセス状況、業界を問わず施設における防犯など、幅広い用途に用いられています。従来は人力で確認していた作業を部分的にでもAIが行うことによって人的コストを減らせたり、ヒューマンエラーを減らせたりすることが期待できます。さらに、日々蓄積されていくデータも検出に生かされるため、使えば使うほど精度が向上するという強みもあります。 当社事例では、ディープラーニングによる画像認識アルゴリズムを用い、画像内の劣化箇所の検出と劣化内容の識別を行う仕組みを開発したり、物体検出技術と異常検知技術を組み合わせることによる線路設備の不良判定を実現したりする事例があります。さらには、人の目でのチェックが必要な検査や点検の件数を削減でき作業の省力化が測れることや、作業者による品質のバラツキを防ぐといった効果が期待されるソリューションも開発しています。 当社事例 Laboro.AI「 線路設備の不良判定の自動化 」 Laboro.AI「 インフラ設備の劣化箇所検出 」 当社ソリューション Laboro.AI「 不良・異常検出ソリューション 」 参考 日立ソリューションズ・クリエイト「 AIで異常検知! 取り入れるメリットや成功事例を解説 」 スキルアップAI Journal「 異常検知とは|意味や事例、メリット、代表的な手法、導入課題を解説 」 日本経済新聞「 博多駅ビル、AIで暴力や転倒検知 防犯カメラの映像解析 」 日本経済新聞「 「コンビニジム」で突如国内首位 RIZAPは黒字化視野 」 日本経済新聞「 岡谷鋼機、AIで産業用刃物の劣化診断 切断音を聞き分け 」 The post 異常検知【ビジネス成長のためのAI用語】 first appeared on 株式会社Laboro.AI .
アバター
マッチングアプリ化する「AI 採用」。出会いの効率化は成長への一歩か 2024.5.5 監 修 株式会社Laboro.AI 執行役員 マーケティング部長 和田 崇 概 要 2023 年に転職希望者が初めて 国内1000 万人を超え、雇用市場は新卒・中途の違いに限らず、すべての人にとってよりオープンな場所へと変わりつつあります。 そして、企業側でスクリーニングや面接ボットなどのAI活用が進むだけでなく、LLM(大規模言語モデル)の登場によって求職者側でも文章を作成したり校正したりとAIの利用が進んでいる今、雇用マッチングにおける『AI vs AI』のせめぎ合いが注目されています。 その一方で、続々と導入される新しいAIシステムに対し、世界ではAI を使用した企業の採用活動に関する法規制の制定も徐々に進みつつあり、採用・転職のプロセスでより良い結果を生み出すためにAIをどう活用すればいいのか 、あらゆる方面で試行錯誤の真っ只中にあります。 今回は、このような雇用にまつわるAI活用の動向を掘り下げ、そこから”人”を採用する”人”の役割について考えていきます。 目 次 ・ 大企業の8割超がAI採用 に前向き  ・ 転職は新卒よりも「売り手」市場 ・ 仕事探しの「マッチングアプリ化」  ・ 深く悩まず、瞬時に大量に応募する  ・ 「AI + 従来の応募方法」でチャンスを増やす ・ 求職者の半数が履歴書にAIを利用  ・ AIでスキルをマッチングさせる  ・ AIで調整すると応募先の反応が変わる  ・ 異業種/異職種へのチャレンジ ・ 透明で公平なAI採用を行うために  ・ バイアスに対処し、人権を守る  ・ もう面接をブラックボックスにしない ・ 「量より質」の選考は人に任せる  ・ AIの得意と、人の得意 ・ 『 AI vs AI 』から『 AI x 人間』へ  ・ 人の成長が企業の成長になる 大企業の8割超がAI採用 に前向き 転職は新卒よりも「売り手」市場 総務省の統計によると、2023年に日本で転職希望者が初めて1000万人を超えたという ことです 。また、2024年1月の中途採用の求人倍率が、今年卒業の大卒求人倍率よりも1.5倍以上高かったというデータもあり、今や中途採用の方が求職者にチャンスの多い「売り手」市場という時代を迎えて います 。 転職希望者の半数以上が35歳以上と いいます が、ここ数年で人と職のマッチングに関係するテクノロジーの進化は目覚ましく、転職のために久しぶりに求人に応募する人は、過去に経験したことのない仕事探しのプロセスに戸惑うかもしれません。 実際、昨年にIBMが20カ国を対象に行った 調査 によると、大企業のおよそ42%がすでに採用と人事の業務改善にAIを活用しており、さらに40%が導入に向けてAIを試している段階にあったそうです。 代表的なものが書類選考で応募書類をAIでスクリーニングする応募者追跡システム(ATS)です。ATS は、フォーチュン500企業の99%が使用 している ほど多くの企業に頼られるツールとなっていて、企業側が求めるスキルが履歴書や職務経歴書に含まれていない応募者を、AIで自動的に選別するために用いられます。 さらに書類選考を通過した後に登場するのがAIチャットボットで、AIが面接官のように指示や質問をしながら回答を記録してデータを分析するなどして、候補者の絞り込みを効率的に行うこと試みが進められて います 。 採用プロセスに関わる最新のテクノロジーというと、少し前まで関心が寄せられていたのは、こうした企業側の採用プロセスのAI化についてがほとんどでした。しかしながら、履歴書を作成できるほどにLLMの性能が向上したほか、 マッチする求人をAIで探し出す自動応募アプリなども登場するなど、その関心は求職者自身の応募ツールとして移行しつつあります。 仕事探しの「マッチングアプリ化」 深く悩まず、瞬時に大量に応募する 一般的に求人への応募は手間のかかる作業で、特に仕事をしながら転職活動をするには相当な勇気が必要になるほど、簡単なことではありませんでした。ところが現在、求職者がAIを利用した仕事探しをより効率的に加速させ、仕事探しがよりオープンで手軽なものになりつつあります。 特に今年話題になったのは、あるソフトウェアエンジニアがAI搭載サービスを利用して、ワンクリックで5,000 件の求人に一斉送信し、自動で約20件の面接を獲得したという 話です 。たしかに成功率は低いとはいえ、自分が寝ている間に20件の面接にこぎつけたという意味では、かなりの労力を削減できたと言えます。ちなみに、彼が自分の手作業で応募できたのは200〜300 件で、そのうち面接にこぎ着けたのも同様に20件ほどだったそうです。 こうした変化を「仕事探しの“マッチングアプリ化”」が進んでいるという見方も あります 。応募手続きが簡単になったことを指しているのはもちろんですが、応募書類に感銘を受けた採用担当者が応募者本人に会ってみるとコミュニケーションがうまく噛み合わないなど、データ上の人物と実物とにギャップが起こりやすい点もマッチングアプリ化したと言われる別側面としてあるようです。 「AI + 従来の応募方法」でチャンスを増やす AI で自動応募するアプリを使用した人からは、次のような相反する感想が聞かれている そうです 。 「AIだけを使った場合、手作業で検索すれば見つかるかもしれない、本当にやりたかった仕事を見逃してしまう可能性がある」 「AIのおかげで、今までだったら読み飛ばしていたかもしれない仕事を見つけることができた」 このように人によって受け止め方が異なる現状をふまえると、転職希望者にとっては従来の転職サイトやSNSネットワーキングにプラスアルファの武器として、こうしたAIサービス を利用することが可能性をさらに広げるために現時点でのベストなやり方かもしれません。 求職者の半数が履歴書にAIを利用 AIでスキルをマッチングさせる 履歴書をAIで作成することはもはや珍しいことではなく、AIに自分の詳細な職務経歴や仕事内容をプロンプトとして渡して、特定の求人案件に適した履歴書に編集するということも行われています。というのも、前出の応募者追跡システム(ATS)で振り落とされないようにするためには、履歴書の内容が求人の職務内容にあるキーワードの60〜80%を一致させる必要があるということがわかってきて いるのです 。 事実、アメリカ、イギリス、インド、ドイツ、スペイン、フランス、メキシコ、ブラジルの5,000人の求職者が参加したリサーチによると、求職者の45%が履歴書を作成、更新、または改善するために生成AI を使用したことがあると回答した そうです 。 AIで調整すると応募先の反応が変わる このように求人情報と照らし合わせて履歴書をAIで最適化させることで、次のステップに進める確率が上がることは実感として認識されつつあります。昨年行われたある調査では、ChatGPTを使用して履歴書やカバーレターを作成すると応募先企業からの反応が良かったと報告した回答者が70%に上り ました 。 それでは、仕事探しが上手く行った人がどのようにAIを使ったのかというと、まず自分の作成した履歴書の内容と応募する仕事をChatGPTに渡し、以下のような質問をプロンプトとして入力したという例が あります 。 「 私の履歴書がもっと顧客サービス志向で、技術的で、プロフェッショナルに見えるように、必要なだけ質問してください。」(Please ask me as many questions as you need in order to help me write my resume to sound more customer service oriented, technical and professional.) すると、ChatGPTが次のようなことを問いかけてきたそうです。 ・これまでの仕事の責務 ・リーダーシップやプロジェクトに携わった経験 ・ 達成したことや受賞したこと ・ 応募ポジションに必要なスキルの有無 こうした質問に回答した上で、最後にプロフェッショナルな人材に見えるようにさらにAIに頼んで履歴書を仕上げたということです。 異業種/異職種へのチャレンジ また、転職先としてこれまでと異なる業種や職種を希望している場合、履歴書をアレンジするのは頭が痛い作業ですが、そのような時こそAIが大きな助けになると、次のような意見も 聞かれます 。 「例えば、これまでの教師としての履歴書をChatGPTに投げ、『カスタマーサポートの仕事に適したスキルを抽出してください』と問うことができます」 現時点では、AIを使用した履歴書を判別して弾くシステムを導入している企業ももちろんあり、AIで履歴書を作成したために不採用となった 調査結果 もあります。その一方で、Harvard Business Reviewのようなビジネスリーダー向けのメディアは、ChatGPTなどのAIツールを使用して履歴書を作成することが「数年後には新しい標準になる可能性が非常に高い」という予測を提示しても います 。 オンラインコンテンツにより多くの人の目がとまるよう検索エンジンの最適化 (SEO) を施すのが当たり前になっているように、今後、履歴書やプロフィールの最適化が求職者・転職者にとってスタンダードなやり方になっていく日もやってくるのかも しれません 。 透明で公平なAI採用を行うために バイアスに対処し、人権を守る 急速に雇用市場でのAI化ニーズが高まる一方で、個人情報の扱いや雇用差別が行われないための対策にも手が打たれ始めています。例えば数年前、Amazonが従業員を参考にしてシステムを開発した結果、女性が採用されにくくなってしまったという報告も されました 。このようにトレーニングデータを精査し必要な対策を取らなければ、データの偏りが選考に反映されてしまうという可能性は否定できません。 そうしたことからニューヨーク市はバイアス監査法を可決し、採用にAIソフトウェアを使用する企業に対して候補者への通知と、偏見と差別に関する第三者による監査結果を毎年公表することを義務付けて います 。 ほかにもアメリカのメリーランド州やイリノイ州でも、AIを採用活動に導入している雇用主に対する法が施行されています。メリーランド州は顔認識技術の使用に おいて 、イリノイ州はAIビデオ面接に おいて 、応募者の同意を得ることや機密保持などが定められています。 またEUはAIを規制する世界初の包括的な「AI法」において、採用におけるAIの使用を「高リスク」として分類し、雇用主がAIを使って候補者や従業員の感情を読み取ることを禁止する方向です。 これらの採用プロセスにおいてAIが使用されることを前提とした法規制が進む状況を受けて、法の遵守と効率的な採用システムを両立させるためAIをどのように取り入れていくか、多くのAI開発企業が挑んでいます。 もう面接をブラックボックスにしない アメリカよりも速いペースでAI採用市場を成長させてきたイギリスでは、2023 年時点で雇用主のほぼ 3 分の1が新卒や学校中退者の採用にAIを使用していたという ことです 。 そのイギリスに本拠地を置くAI人材採用ソフトウェア会社が「面接」にフォーカスしたAIで 700万ドル (10 億円超)の資金調達に成功したとして注目を 集めました 。面接の要約と分析を自動化する大規模言語モデルに対応したAIソフトウェアを手がけるこの企業は、今後一年半でエンジニアを3倍に増やし、機能の開発とサービスの成長を加速させると話して います 。 この資金調達を実現させた投資家の一人、 Khaled Helioui氏は「重要な面接のステップはテクノロジーによって無視されてきた」とこれまでを振り返りました。そして、この最も不透明な部分の改善に重点を置き、採用決定がAIによって適切、迅速、客観的に行われれば採用プロセスを妨げている偏見は取り除かれ、より公平な職場が実現するという展望を語って います 。 また、昨年夏に発表されたResume Builderの 調査 によると、2024年までにアメリカ国内の大企業10社中 4社が面接で候補者と「会話」するためにAIを活用する予定ということです。そうしたことが企業側で可能ということは、もちろん求職者側がAIの助けを借りることも可能なわけで、面接選考を突破できるようにアシストする「AIスピーチコーチ」というツールが登場もしています。 AIスピーチコーチは、模擬面接の質問に対する回答を記録し、言葉の選択、話すスピード、話し方 (アイコンタクト、間の取り方、笑顔など)をその場で分析する というもの 。 これまで面接の練習は独り言のイメージトレーニングを繰り返すのが通常で、気楽にフィードバックが得られる方法がなかなかありませんでしたが、企業側の面接AIの開発が進むほど、求職者側にとってもそれを突破するためのAIサポートツールが入手しやすくなっていくはずです。 「量より質」の選考は人に任せる AIの得意と、人の得意 現時点で雇用プロセスでのAI活用は、店舗スタッフや新卒社員など、たくさんの応募者が集まるエントリーレベルの仕事や、応募者が何千、何万と集まるような人気企業でのケースが中心です。 例えばMeta では、一部の新入社員には人対人の面接さえせずに内定を出す一方で、マーク・ザッカーバーグ氏が GoogleのAI研究者に個人的に熱烈なメールを送ってヘッドハントをしていることもある そうです 。需要の高い人材は自分から市場に出る必要性が低いため、応募者の中からは見つけにくいということなのでしょう。 「AIはCEO を選ばない」なども 言われます が、採用プロセスにAIの導入が加速されてきたのは、より会社にとっての重要性が高い人材の採用プロセスに採用担当者の時間とエネルギーを100%集中させるためであることが大きな背景としてあります。 あくまで情報処理ツールであるAI は、1,000人の応募者を分類し、評価し、選別することには一定の力を発揮しますが、上位10人から1人を選ぶために、給与や福利厚生、働く場所や時間、パーソナリティ、目指すキャリアパスなどのさまざまな条件を踏まえて戦略的に交渉し、合意に辿り着くには十分ではありません。 人間はこうした複雑な状況・環境を加味した上で、交渉人としてAIよりもやはり格段に優れた判断を行うことができます。組織のニーズと候補者の期待の両方の妥協点を探り、より重要な人材の採用成功率を上げることに注力していくことが人の役目なのではないかと思うのです。 また、「水が合わない」と言われるような定量データでは表すことが難しい、文化的・感性的なミスマッチを人は直感的に判断することができます。きっとこれから、ますます多くの採用担当者がAIという機械では再現できない無形の条件マッチングを、より掘り下げて取り組むようになっていく はずです 。 『 AI vs AI 』から『 AI x 人間』へ 人の成長が企業の成長になる いまのAI採用と言えば『 AI vs AI 』(採用企業が行うAIツールによる人選が優れているか、応募者がAIツールを使用して作成した応募内容が優れているか)という技術面に注目が集まっていますが、本来的にはAIと人の採用担当者が協働することを通して、より効率的で、安全で、自己実現に貢献できる理想的な雇用プロセスをいかに共に作り上げていけるかに目を向けるべきなのかもしれません。 日本では中途採用は売り手市場というものの、転職で収入が10%以上増加した人の割合は3分の1 ほどだそうで、転職の動機を見てみると「今の仕事に耐えきれなくて」というのが目立つそうです。採用とは企業が成長するための人材確保の手段であり、そして企業を成長させるのは結局のところ、そこで働く人の成長です。ゆえに採用市場は人が成長できるチャンスを掴める場であることが理想であることに間違いありません。 AIによって企業側の採用選考がスピーディ行われるようになり、マッチングアプリ感覚で求職者側が気楽に一歩を踏み出せるようになるーー。こうした出会いの効率化で満足することなく、多くの求職者が前向きな転職をして人材としての成長を遂げると共に、企業の成長にもつながっていくような未来に、私たちはAIという武器を携えて挑んでいくべきなのでしょう。 The post マッチングアプリ化する「AI 採用」。出会いの効率化は成長への一歩か first appeared on 株式会社Laboro.AI .
アバター
データ量を約3倍に増量しアップデート 日本語音声コーパス「LaboroTVSpeech2」を提供開始 2024年4月30日 概 要 Laboro.AIは、2020年にTV録画から長時間音声と字幕テキストを抽出して音声コーパスを自動構築する独自システムを用いた音声データから構築した日本語音声コーパス「 LaboroTVSpeech(ラボロティービースピーチ) 」を開発し、学術研究用に無償公開しておりましたが、この度、データ量を約3倍に増量し、より高品質な音声データとしてアップデートした「LaboroTVSpeech2」を開発し、提供を開始いたしました。 目 次 ・ LaboroTVSpeech2開発背景 ・ LaboroTVSpeech2について ・ LaboroTVSpeech2比較実験について ・ LaboroTVSpeech2の利用について LaboroTVSpeech2開発背景 昨今、AIと機械学習の分野では、大規模なデータセットの存在が重要になってきています。例えば、生成AIで注目を集める言語モデルGPTでは、GPT-1からGPT-4への進化においてトレーニングデータサイズの劇的な増加が行われており、現代に求められるAIモデルを開発するためには、大量かつ高品質なデータがAIの精度に大きなプラス効果をもたらすことを示しました。 当社でも、2020年に提供を開始した旧版LaboroTVSpeechについて、より高品質な音声データを提供したいという思いから、リリース後もテレビ番組データの収集を継続し、今般の開発にいたりました。 LaboroTVSpeech2について LaboroTVSpeech2は、旧版LaboroTVSpeechと同様にB-CASカードによるアクセス制限がないワンセグ放送を利用し、2022年12月〜2023年11月放送、12ジャンルの39,248のTV番組、計6,620時間のデータから構成されております。 旧版LaboroTVSpeechが12ジャンルの9,142のTV番組、計2,049時間のデータで構成されていることと比べると、そのデータ量は約3倍と大幅に増加しております。 なお、LaboroTVSpeech2は、旧版と同様に当社が独自開発したシステムにより構築しています。具体的には、テレビ番組の長時間の音声データと、その不完全な書き起こしである字幕データの時間的な対応関係を抽出する手法である準教師付きデコーディング(lightly-supervised decoding)と呼ばれる手法をベースとしています。これにより、本来であればテレビ番組のデータから音声と字幕がセットになって抽出されるべきところ、先のような何らかの問題で対応した情報として取得できなかった場合に、準教師付デコーディングによる音声と字幕の対応関係の抽出を繰り返し行うことで、一度対応が取れなかった区間からも可能な限りデータ抽出を行う仕組みを採用しています。 LaboroTVSpeech2比較実験について LaboroTVSpeech2を用いたモデルの音声認識の性能を確認するため、日本語のTEDxを用いて構築した独自の音声認識システム評価用データセット(※1)を用意した上で、旧版LaboroTVSpeechとの比較実験を行いました。音声認識のツールキットとしてはEnd-to-End方式を採用するESPnetを用いました。 その結果、文字誤認識率(CER)が旧版の13.0%に対して11.4%となり、1.6%の改善が見られたことを確認いたしました(※2)。 (※1)Youtube上のプレイリスト「TEDx talks in Jpanaese」に含まれる動画から音声と字幕データを取得したもの。 (※2)上記の結果は、実環境での音声認識システムの性能とは異なる場合があります。 LaboroTVSpeech2の利用について LaboroTVSpeech2に含まれる音声及びテキストデータの権利は、元のテレビ放送の著作権者に帰属していますが、著作権法30条の4に基づき、情報解析等の用途のために、大学等の学術研究機関に対して無償で公開いたします。ただし、元のテレビ番組の音声を再構成し鑑賞する事を防ぐために、発話単位でランダムに並び替えられており、かつ番組名や放送局等の付加情報は含まれておりません。 ご利用にあたっては、LaboroTVSpeech2の利用相談の旨を明記の上、当社HP内 お問い合わせフォーム よりお問い合わせください。また、営利企業における研究開発用途や商用目的での利用をご希望の場合も、同じく当社HP内 お問い合わせフォーム からご相談ください。なお、お問い合わせをいただいてから配布まで最短3週間前後のお時間を頂戴しておりますことを何卒ご了承ください。 配布対象 無償配布の対象としては、下記のような機関を想定しています。 ・国立大学、公立大学、私立大学、高等専門学校 ・国立研究開発法人(産業技術総合研究所、情報通信研究機構、理化学研究所、等) ・地方自治体等が所管する研究機関 ・その他公的な性質を持つ研究機関(公益法人等) ただし、上記に該当する機関であっても、営利企業等からの提供された資金で運営されているプロジェクトや、無償配布対象外の機関との共同研究プロジェクトでの利用は、無償配布の対象外となりますのでご注意ください。 配布の流れ ご利用にあたっては、こちらの お問い合わせフォーム よりご連絡ください。その際、LaboroTVSpeech2の利用の申し込みである事を明記いただいた上で、下記の点を記載ください。 ・申込責任者 氏名 ・所属組織/企業/機関/学校名 ・部署/研究室名 ・役職 ・住所 ・メールアドレス(組織/機関ドメインのもの。個人アドレス不可) ・利用目的 電子契約サービスであるクラウドサインを通じて、申込書を指定のメールアドレスに送付させていただきますので、必要事項を記入の上、申し込みをお願いします。弊社側で申込内容を審査した上で、申込書に記載のメールアドレスにコーパスをダウンロードするURLを記載したメールをお送りいたします。 なお、申込書の名義は、原則として教員や職員の方でお願いしております。学生等の方からの申込の場合は、申込書の記入は学生の方でも結構ですが、申込者の欄には教員の名前を記入頂き、教員の方のメールアドレスに申込書の承認の依頼をお送りさせて頂きます。 営利企業での使用について 営利企業における研究開発用途や商用目的での利用をご希望の場合は、同じく お問い合わせフォーム からご相談ください。 The post データ量を約3倍に増量しアップデート 日本語音声コーパス「LaboroTVSpeech2」を提供開始 first appeared on 株式会社Laboro.AI .
アバター
物体検出【ビジネス成長のためのAI用語】 2024.4.16 株式会社Laboro.AI リードマーケター 熊谷勇一 用語解説 物体検出とは、画像分類やセグメンテーションなどと並ぶ画像認識技術のタスクの一つで、画像に写っている特定のクラス(例えば、人間、動物、野菜、自動車など)の物体を、コンピュータによる計算で検出する技術です。一般的には四角形(バウンディングボックス。矩形領域とも)で物体を囲んで位置を特定します。身近な例としては、スマートフォンのカメラが人間の顔を認識して枠で囲って表示するのも物体検出です。ちなみにセグメンテーションは似たタスクですが、対象をバウンディングボックスではなくピクセル単位で検出します。 物体検出の結果は、検出したクラス名と、バウンディングボックスの位置と大きさの組で表示されます。物体検出の目的は、物体のクラスの識別、おおよその位置と大きさを知ることであり、バウンディングボックスの位置や大きさが少しずれていることはさほど重要ではありません。 応用&詳細解説 物体検出には、大まかな物体の位置を特定した後、その物体クラスを識別する2段階モデルと位置の特定とクラスの識別を同時に行う1段階モデルがあります。1段階モデルは処理を単純にできるため、高速な処理を実現できることが期待されています。 この1段階モデルで高速化に取り組んだモデルに、2015年に公開されたYOLO(You Only Look Once)があります。2024年2月にYOLOv9が公開されるまでに多くののバージョンが発表され、その間に推論コストに影響を与えずに高速化と高精度化に成功したアプローチが実装されたり、YOLOv5では数行のコードで学習・推論が可能に、YOLOv8では新たに実装されたyoloコマンドによりコードを書かずにYOLOモデルの学習や推論が可能になったりしたなど、ユーザビリティの高さが多くの開発者から支持されています。 ビジネス応用 物体検出は、外観の異常を検出することによる外観検査や、カメラ映像から不審者や不審物を検出することによる防犯、CTやMRIによるスキャン画像から腫瘍や病巣の可能性を検出することによる医療など、さまざまな業界・目的に応用されています。既にある程度確立されているAI技術とも言えるでしょう。 一方、画像認識はさまざまな手法が開発・提案されていることから、選択する手法によって開発コストや得られる成果に違いが出やすいことには注意が必要です。そのため、解くべきタスクを正確に定義し、どのようなアルゴリズム、AIモデルを選択・適用すべきかにはしっかりとした検討をしないと、オーバスペックのシステムを開発してコストの無駄を発生させることなどが起こり得ます。例えば、当社事例の場合、チップを吸着して基板に配置するためのノズルに詰まりが生じていないかどうかを判別するには、詰まりの物体の種類や大きさ、位置まで分かる必要はなく、詰まりという異常があるかどうかの2値分類ができる画像分類タスクで十分、という具合です。 さらに、画像中に写っている特定の物体を数えることだけに特化し、例えば施設・会場での来場者数の把握や、農作物の収穫量や家畜頭数の把握ができる「物体カウント」というソリューションも登場しています。 当社事例 Laboro.AI「 防衛装備品の製造におけるAIによる外観検査 」 Laboro.AI「 物体カウントソリューション 」 参考 高橋海渡ら『図解即戦力 AIのしくみと活用がこれ1冊でしっかりわかる教科書』 日本ディープラーニング協会監修『ディープラーニングG検定公式テキスト第2版』 ソフトバンク「 リアルタイムの物体検出器「YOLO」シリーズの変遷を解説 」 The post 物体検出【ビジネス成長のためのAI用語】 first appeared on 株式会社Laboro.AI .
アバター
機械学習の鍵 「特徴量」。その重要性を考える 2020.12.25公開 2024.3.28更新 概 要 大量のデータを学習することでパターンや一貫性を見つけ出す機械学習では、データの中のどの部分を指標にするかという「特徴量」を考え抜くことが鍵を握ります。特徴量の概要や具体例を紹介します。 目 次 ・ 機械学習と特徴量 ・ 特徴量とは  ・ 概要  ・ 次元  ・ 目的変数  ・ 説明変数 ・ 特徴量が重要な理由  ・ 特徴量の質と量  ・ ノイズ除去と特徴量選択 ・ 機械学習での特徴量の具体例  ・ 売上予測  ・ 画像認識 ・ ディープラーニングと特徴量の関係  ・ 特徴量選択の難しさ  ・ 解決策としてのディープラーニング  ・ 特徴量エンジニアリングという解決策も ・ AIの鍵を握る特徴量 機械学習と特徴量 コンピュータにデータを学習させ、未知のデータに対する予測や判断を可能にする技術が機械学習です。機械学習は、これまでは人間でしか行うことができなかったタスクをコンピュータに学習させることで機械化し、効率化し、自動化するための技術として期待され、AIと呼ばれる技術の中でも近年とくに活用が広がっている分野です。 しかし、機械学習ではただデータを用意すれば良いわけではなく、データの中のどの特徴に着目し、コンピュータに学習させれば良いかを人が指定する必要があります。この特徴それぞれのことを「特徴量」と言い、機械学習を用いるにあたってはとても重要な要素の一つになります。 特徴量とは 大量のデータをコンピュータに学習させる機械学習では、データのどの部分を参考にしてパターンを見つけ出せば良いかの指標となる特徴量を指定する必要があります。 概要 例えば人で考えてみると、その人を表す特徴として身長や体重、性別、年齢などが考えられます。そして私たちは、実際にその人の身長が何cmなのか、何歳なのか、その具体的な数値を知らなくても“背が高い人”や“若い人”といった判断ができます。 ですが、人のような感覚を持っていないコンピュータではそうはいかず、身長の高さや年齢を明確に数値として示すことで、コンピュータはその人の特徴を把握できるようになります。つまり、特徴量とは、対象となるデータの特徴を数値にして表したものです。 とはいえ、大人数のデータをコンピュータに読み込ませるとき、特徴量が色々とあり過ぎると、コンピュータはどれを参考にして良いかの判断がつきません。目的によって身長が重要なこともあれば、年齢が重要なこともあるはずです。 そのため機械学習では、コンピュータがそのパターンやルールを学習しやすいように、学習の指標となる特徴量を指定することが必要になります。 次元 一方で、私たちは、人の個性や人柄を身長だけで判断することはしないはずです。同じように、コンピュータに大量のデータを学習させて、そこに含まれるパターンや一貫性を抽出しようとするときも、特徴量が一つでは物足りないということは、容易に想像がつくかと思います。 そのため機械学習では、複数の特徴量からデータを学習させていきます。この特徴量の数を「次元」と言います。身長と体重、性別を特徴量にする場合は3次元、そこに年齢を入れる場合は4次元といった具合です。 目的変数と説明変数 データを分析する上で重要な特徴量を知るにあたっては、「目的変数」と「説明変数」の2種類のデータの違いについても理解を深める必要があります。 例えば、過去の数値傾向に基づいて次に起こることをAIで予測したい場合、予測対象の過去データを目的変数、予測のヒントとなるデータを説明変数といいます。そして、この説明変数が特徴量です。 少しわかりにくいので例で考えてみると、ある作物の収穫量をAIで予測したいというゴールがあったとします。コンピュータは、過去どれだけの収穫量があったかを学習することで未来の収穫量を予想できるようになるので、「過去の収穫量」が目的変数にあたります。 そして、この予測を正確に行うためには気温、湿度、土の状態、害虫の発生回数など、その予測の根拠となるデータ、説明変数(特徴量)が必要になるというわけです。説明変数の数が増えるほど、過去の収穫量がなぜその量だったのかをより客観的に説明できるようになっていきます。 特徴量が重要な理由 機械学習では、「ゴミを入れたら、ゴミしか出てこない」と言われます。どのようなデータを学習させるかによって、コンピュータがどのようなパターンを抽出するかが変わり、未知の情報を入力したときの出力結果が変わってくるためです。 特徴量の質と量 データは数だけでなく、質の良いデータであることも重要です。この入力データの良し悪しを決める要因の一つが、やはり特徴量です。 特徴量の質が良くないと、せっかくデータを学習させても精度の高いモデルにはならず、見当違いの結果を出力してしまいます。特徴量の質は、どんな特徴量を選択するかはもちろん、データの形式がきちんと揃っていることなどでも変わってきます。 もちろん、特徴量自体の量が少ないと、コンピュータはやはり十分なパターンを学習ができません。上記の作物の収穫量予測で言えば、気温や湿度は確かに収穫量に関係してくるとしても、実際にはもっと多くの要因が関わって収穫量は決まるものです。闇雲に多ければ良いというわけではありませんが、関連性の高いより多くの特徴量を組み合わせ、高次元のデータを学習させることでAIの精度も上がっていきます。 ノイズ除去と特徴量選択 学習用データのノイズは学習モデルの精度向上に関係ないばかりか、場合によっては精度を下げてしまうこともあります。データのノイズを除去することにより、コンピュータは予測対象に関連のある特徴のみを学習できるため、予測の精度をより向上させられることが期待できます。 また適切な特徴量を選択によって、モデルの予測精度の向上が期待できる以外にも下記の効果が見込ます。 ・学習データを縮小することによって学習にかかる時間を短縮できる ・モデルの構造を単純化し理解しやすくできる ・過学習を防ぐことができる 機械学習での特徴量の具体例 次に二つの例を挙げ、どのような特徴量が指定されるかを見ていきたいと思います。 需要・売上予測 需要・売上予測などの数値で表されるデータは、その予測を正確に行うことは難しいとしても、比較的特徴量を把握しやすい分野だと言えます。 需要・売上予測で目的変数となるのは、過去の売上です。そして説明変数となるのは、曜日や気温、店舗周辺のイベント、セールの実施の有無、広告費などが挙げられます。これらを特徴量としてデータを学習させ、次に翌日のこれらの変数を入力することで、コンピュータが翌日の売上を予測してくれるようになります。 需要・売上予測についてはこちらのLaboro.AIコラムもご覧ください。 需要予測AIよ、需要は予測するものでなく作るものだ。 画像認識 画像認識では、売上予測のような数値的に把握しやすいデータと比べると、特徴量の指定が難しくなります。人が見れば何が写っている画像かが明らかだとしても、コンピュータにとってみれば単なる画素(ピクセル)の集まりでしかないからです。 画像認識で特徴量を指定するには、一定のピクセルの集まりを特徴量に変換します。例えば、発疹の症例画像からどんな病名かを診断するAIを開発したい場合、それぞれのピクセルをRGB情報として読み込み、近い色をまとまりとして認識するなどの処理を行います。その後、患部の色や大きさなどを特徴量として設定し、パターンとして学習するなどが考えられます。 画像認識についてはこちらのLaboro.AIコラムもご覧ください。 画像認識AIの世界。その仕組みと活用事例 ディープラーニングと特徴量の関係 これまでご紹介してきたように、機械学習と特徴量は切っても切り離せない関係にあります。しかし、機械学習の1種であるディープラーニング(深層学習)においては、特徴量の指定というタスクから(ある程度)解放されるという大きなメリットがあります。 特徴量選択の難しさ 売上予測の例では曜日や気温、広告費などわかりやすい特徴量の例を出しましたが、実際には、どの特徴量を選択し、どの特徴量を選択しないかの判断はデータサイエンティストやエンジニアが手掛ける領域であり、簡単には行えません。特徴量を上手く選択しなければ良いデータとは言えず、大量に学習させても十分な精度のAIにはなりません。 また、人にとって判断の難しい題材では特徴量選択の難しさが、さらに増します。例えば感情分析では、表情や仕草からその人がどんな感情を抱いているのかを予測することが考えられますが、私たちは直感的に相手の感情を判断していることが多いため、その評価指標を明文化したり、数値化することは難しいはずです。こうしたケースでは、何が特徴量になるのかを判断することにかなり知恵を絞る必要性が出てきます。 さらに、特徴量はそこから得られる効果を意識しなければ、集計、数値変換、コード化などのさまざまな手法を適用したデータ変換の方法が数多く考えられてしまうことがあります。それにより、多くの特徴量を設定した場合に発生する計算時間・リソースが必要となってしまい、さらには大量に作成された特徴量から有用なものを絞り込むのが煩雑になってしまうこともあります。 出典:iMagazine「 今あらためて考える特徴量エンジニアリング ~予測精度をあと一歩改善するテクニック 」 解決策としてのディープラーニング ディープラーニングは、人間の神経回路を参考にした「ニューラルネットワーク」をベースにし機械学習技術の一つであり、第3次AIブームを引き起こすきっかけとなった技術でもあります。その最大の特徴は、「そのデータからどんな特徴量を参考に学習したら良いか」をコンピュータ自身が抽出できる点にあります。 ディープラーニングでは、その他の機械学習技術に比べても大量のデータが必要であることや、膨大な計算量に耐えられるマシンが必要という面もありますが、特徴量の選択をコンピュータ自身が行えることは、これまでに比べて大きな技術的進歩だと言えます。 参考: 機械学習とディープラーニング(深層学習)の違いとは 特徴量エンジニアリングという解決策も 特徴量の選択に難しさがあることから、データから有用な特徴量を作成する技術の確立が目指され、それは「特徴量エンジニアリング」と呼ばれています。以下の五つのプロセスで進められると捉えることができます。 ①データ理解 保持しているデータの内容、取得タイミング、データから読み取れる傾向を理解します。 ②仮説立案 例えば、「ウェブサイトの滞在時間が長い人は、契約する可能性が高い」など、データから見えてきた仮説を立てます。どのデータが特徴量として有用かの見当を付けるプロセスとも言えます。 ③クエリ実装 仮説に基づいて必要な数値をデータから抽出し、特徴量を生成するプログラムを実装します。 ④特徴量リストの試作 ③で開発したプログラムを用いて、機械学習に投入する特徴量リストを試作します。 ⑤特徴量の評価 試作した特徴量リストを用いて、機械学習で分析し、その結果を評価します。 出典:NEC「 特徴量とは?AI活用でなぜ必要なのか、なぜ重要なのか、基礎から解説 」 AIの鍵を握る特徴量 ご紹介してきたように、大量のデータを活かし、未知のデータに対して正確な予測や判断をAIで行うためには、特徴量について知り、最適な特徴量選択を行うことが非常に重要です。 ですが、概念はわかっても特徴量を含めた設計とエンジニアリングにはやはり専門的な知識とスキルが必要になってきます。また、AIを企業に導入する際には、実は、技術にも増してビジネス観点が非常に重要になります。というのも、そもそもその特徴量、目的変数、説明変数を用いることでビジネス成果に貢献する結果が得られるかどうか、この点をまずは念入りに検討しなければならないからです。 Laboro.AIではビジネスコンサルティングの視点を踏まえたAI導入をご支援しています。AI導入をご検討の企業様、導入したものの実運用で成果が出なかったなどでお困りの方、ぜひご相談ください。 その他のおすすめコンテンツ ・ 事例から知る。機械学習の基礎と活用5ジャンル ・ AI開発の基礎。概要から開発の流れ、必要なものを解説 The post 機械学習の鍵 「特徴量」。その重要性を考える first appeared on 株式会社Laboro.AI .
アバター
自動運転だけじゃない。自動車×AIの最先端 2021.4.14公開 2024.3.25更新 概 要 さまざまな業界でAIの活用が進められている中、消費者の生活に密接に関わり、最も期待を集めている活用分野が自動車です。AIシステムを搭載した自動車はすでに市場に登場し、高レベルでの自動運転の実現に向けて各国・各社が開発にしのぎを削っています。しかし自動車業界で見てみると、AIの活用範囲は自動運転だけに留まりません。さまざまに活用される自動車業界でのAI活用の今を紹介します。 目 次 ・ 自動車業界での代表的なAI活用  ・ 自動運転での活用    ・AIによる映像解析    ・AIによる運転判断  ・ 設計・検査フェーズでの活用   ・ ボンネット設計でのAI活用   ・ 検査フェーズへのAI活用  ・ 自動車販売へのAI活用 ・ AIの基礎知識  ・ AI(人工知能)とは   ・ 機械学習(マシンラーニング)   ・ 深層学習(ディープラーニング) ・自動運転車は人間が運転するより安全なのか? ・完全自動運転がまだ実現できていない理由   ・技術面:AIの画像認識技術や判断能力が未熟   ・法整備面:条約、法律の改正 ・自動運転がもたらす良い影響   ・交通渋滞の軽減   ・ドライバーの負担の軽減   ・運送業の人件費削減 ・ 自動車×AI、実例9選  ・ 潜在ニーズの分析を通じた目的地のAIレコメンド【Laboro.AI】  ・ トヨタの自動運転開発  ・ テスラの自動運転車開発  ・ ナンバープレートの読み取り  ・ ドライブレコーダーの機能拡張  ・ プレス工程での検査効率化  ・ タクシーの需要予測とダイナミックプライシング  ・ 住民の交通インフラを支えるMaaS  ・ みちのりホールディングスとの取り組み【Laboro.AI】 ・ 進む、自動車業界でのAI活用 自動車業界での代表的なAI活用 まずは自動車業界での代表的なAI活用例をいくつか紹介します。 自動運転での活用 自動車とAIの活用で真っ先に思いつくのが、この自動運転技術です。自動車の運転をドライバーではなくシステムが行う自動運転は、完全な自動化を目指して、各国・各社がしのぎを削って開発を進めています。 自動運転は、ドライバーとシステムのどちらに運転の負担がかかっているかで、0~5レベルの6段階に分けられています。 レベル0:  なんの自動化もなく、ドライバーがすべての操作を担うレベル レベル1〜2:  システムがアクセル・ブレーキ・ハンドル操作に介入 レベル3:  限定的な条件下ですべての運転をシステムが担う レベル4:  ドライバーが運転に復帰する体勢を常に取っておく必要性から開放 レベル5:  ドライバーを必要としない完全な自動運転 レベル4も一部実用化されていて、米アリゾナ州で2018年12月、セーフティドライバーを同乗するかたちで有償の自動運転タクシーサービスが始まり、2019年にはセーフティドライバーが乗車しない完全無人化を達成し、名実ともにレベル4を達成しています。国内では、福井県永平寺町で観光客らを乗せて永平寺近くの町道を走る小型車両のレベル4自動運転サービスが、2023年5月に始まっています。同年10月に自転車との接触事故を起こしたためサービスを一度中止していましたが、AIカメラの認識能力を向上させるなどして、2024年3月からサービスを再開させています。 出典:東洋経済オンライン 「世界初「自動運転レベル3」に見るホンダの本音」    自動運転ラボ「 自動運転とは?(2024年版) レベル別の実用化・開発状況・業界動向まとめ 」    日本経済新聞「 自動運転レベル4運行再開 昨年に事故、福井・永平寺 」 自動運転を実現するためには、以下のような分野のAIが活用されています。 AIによる映像解析 自動運転において重要な要素の一つが、カメラから取得した映像の解析です。ドライバーが道路や標識、信号を見て運転をするのと同様に、AIも映像を認識して運転に反映する技術が用いられます。 映像は、カメラを通して得られた段階では、AIはそこに映っている人やモノを認識しません。輪郭や色を分析し、それぞれの名前をラベリングして映っているものと名前の対応付けをすることで初めて、AIが映像の中に映っているものを認識できるようになります。 AIによる運転判断 映像などからクルマの周囲の状況(環境と言います)を把握できれば、次はどんな運転をするかの判断を行います。AIがすることは基本的にドライバーと同じであり、信号の色や通行人の有無といった環境に合わせて発信や停車、ウインカーを出して右折・左折するなど、適切な運転をします。 環境の中には、交通状況を鑑みた予測も含まれます。ドライバーは常に交通状況を見て一定の予測をしています。例えば、路上駐車をしている車両によって死角があれば、歩行者が飛び出してくるかもしれないと注意します。こうした予測も、特にレベル5の自動運転においてはAIが担うことになります。 人間のドライバーと同じ、あるいはそれを超える判断をするために、瞬時に正確な判断ができるAIの開発が続けられています。 設計・検査フェーズでの活用 「自動車×AI」をテーマにすると自動運転だけが脚光を浴びがちですが、自動車業界におけるAI活用はそれだけではありません。設計や検査でもAI技術が活躍しはじめています。 ボンネット設計でのAI活用 AIは自動車の設計段階でも活用されています。例えば、本田技術研究所では、歩行者の安全を確保するためのボンネットデザインの設計にAIを役立てています。 現状、交通事故による死亡事故は歩行者が被害になるケースが多く、頭をボンネットに強打することが少なくない割合で原因になっています。歩行者への衝撃を最小限にするためにはボンネットを柔らかくすることも考えられますが、一方でボンネットはエンジンを保護する役割も持っています。また、ボンネットに改良を施すということは、緻密な最適化計算に基づいて設計された自動車全体のデザインやスタイル、構造から再設計することになり一筋縄ではいきません。 そこで同社では、全体の構造を勘案した上で最適な形状を予測することを目指したAI、ディープラーニング技術の活用に取り組んでいます。 出典:IDAJ「 歩行者保護性能評価業務の効率化とさらなる技術深耕のためにAIコンサルティング・サービスをご活用 」 検査フェーズへのAI活用 AIの中でも機械学習、ディープラーニングが得意とするジャンルの一つが画像認識です。画像認識技術の進化により、製造業ではAIによる検査システムが次々と開発・導入されています。 自動車の製造においても、良品の画像や不良箇所の画像を学習させることでAIに良品と不良品の判別をさせ、品質検査にかかる時間を短縮し、かつ人の目視確認以上の高い精度で検査作業を行うといった活用例が生まれています。 自動車販売へのAI活用 自動運転や設計・検査だけではなく、自動車販売店でもAIが活用されています。 電通と電通デジタルは、日本語AIの自然対話サービス「Kiku-Hana(キクハナ)」とナビタイムジャパンのカーナビアプリを組み合わせた独自システムを開発。これまで営業スタッフが同乗して行っていた試乗ルート案内や車のセールスポイント紹介などの試乗中の会話を、車載スマホに実装したAIに行わせる取り組みを進めています。 このシステムにより、営業スタッフの省略化はもちろん、試乗に対して抱く心理的ハードルを下げることにつながり、気楽に試乗を楽しめるという効果が見込まれています。また、試乗に関するAIからの質問に対する利用者の回答をデータ化することで、営業スタッフがその後の商談などでその内容を活用するといったシステム構築も目指しています。 出典:株式会社電通 『 電通と電通デジタル、自動車販売店での試乗をより楽しく、自動化・効率化するAI試乗ソリューションを提供開始 』 AIの基礎知識 さて、ここでいったん、AIと呼ばれる技術がどのような技術なのかを振り返ってみます。 AI(人工知能)とは そもそもAIとは、人工知能と訳されることからわかるように、人間の知能を機械に真似させることを目指した技術の総称です。ただしSFの世界のように人間に取って代わるようなAIは空想に近く、現実的には特定の部分的な課題に対して効力を発揮する解決手段としてAIは用いられています。このように特定の目的に合わせて開発されたAIは「弱いAI」や「特化型AI」と呼ばれ、一方、実現されてはいないものの、人間のすべてを置き換えるような万能なAIは「強いAI」「汎用型AI」と呼ばれます。 強いAI、弱いAIについてはこちらもご覧ください。 「強いAI」と「弱いAI」。AIが人間を超えるかが分かる分類 機械学習(マシンラーニング) AI技術の中でも特に進化が著しい技術領域が、コンピュータ自身が学習を行い、認識・識別・推論などを行う機械学習と呼ばれる分野です。 機械学習は、マシンラーニングという名の通り、これまで人間が細かくパターンを指定しなければ実行できなかったタスクであっても、コンピューターに膨大なデータを学習させ、そのデータの傾向を分析・把握させることで、機械自身にタスクを自動化させることを目指した技術です。 機械学習が特に力を発揮している分野の一つとして、画像認識が挙げられます。例えば、赤リンゴと青リンゴを自動で判別して振り分けるといったタスクから、不良部分を学習して振り分けるといった実用的なタスクなど、さまざまな活用事例が誕生しています。自動運転技術においては、車体に搭載したカメラを通して歩行者や障害物の検知や走行環境の認識などにも、画像認識の技術が用いられています。 深層学習(ディープラーニング) ディープラーニングは、機械学習に含まれる一技術です。人間の脳にあるニューロンの構造をヒントにつくられたシステムで、機械学習では通常必要となる「特徴量の指定」を人間がしなくとも学習ができる点に特徴があります。 自動車生産現場では、例えば運転者に共通する行動と機器障害との関係性を見つけ出すなど、熟練のエンジニアや設計者でも見いだせないような傾向を発見するといった活用が期待されます。 自動運転車は人間が運転するより安全なのか? 自動運転にまつわるニュースは珍しくなくなりましたが、「自動運転車は人間が運転するクルマより本当に安全なのか」と気になる方は少なくないのではないでしょうか。 世の中全体では、自動運転の技術が発展することで人間のドライバーよりも安全な運転が可能になると考えられています。自動運転技術は、クルマから360度の視界を持ち、休みない稼働が可能、状況の変化に対する反応は一瞬で、さらに車両間でデータをやり取りすることでより高度な安全確保を実現できる可能性を持っています。一方、人間のドライバーには死角があり、疲労などにより注意力が低下することがあり、ヒューマンエラーを完全になくすことはできません。 完全自動運転がまだ実現できていない理由 現在、レベル5のドライバーを必要としない自動運転は部分的には実現できている面もありますが、実用化にはまだまだで、近い将来に実現するという有力な予測も見当たりません。実現には、技術面と法整備面の二つの課題があると言われています。 技術面:AIの画像認識技術や判断能力が未熟 前述の通り、自動運転はレベル4の実用化やレベル5の一部実現が進んでいますが、レベル5の完全な実現は、現在の技術水準では困難と見られているのが一般的です。そのため、レベル5開発を公言する企業は、イーロン・マスク率いるテスラなどに限られています。国内ではスタートアップ企業のTuring(チューリング)が、2025年までに100台生産し、その後2030年には年間1万台を量産する目標を掲げています。 出典: Turingウェブサイト 法整備面:条約、法律の改正 道路に関するルールは法律、ひいては条約によっても定められているため、自動運転を実現するためには法整備も欠かせません。現状、国際条約のジュネーブ条約では道路の運転においてドライバーの乗車が義務付けられており、日本の法律においても同様です。さらに、運転の主体がドライバーからAIに移るにつれ、事故が起きた際の責任をどうするかという面での法改正も必要となってきます。 先を見据えた法改正をすれば、技術が法規制に阻まれて伸び悩むことを防げるかもしれません。 なお、自動運転技術が発達するにはAI以外にもさまざまなテクノロジーの発展が必要で、そのうちの一つが5G通信の活用です。以下のコラムでは、5Gと自動運転を含め、5Gの普及による影響をご紹介しています。 5Gの普及は、AIに何をもたらすのか 自動運転がもたらす良い影響 自動運転技術が発展し、市場に浸透していくにつれ、道路の安全以外にどのような恩恵が得られるでしょうか。 交通渋滞の軽減 AIによる自動運転が発展することで、交通渋滞が軽減されることが期待されています。まず、交通状況をリアルタイムに取得することで最適なルートを選択できる点が挙げられます。他にも、自動運転で車間距離を一定に保つことで、高速道路の合流や坂道・トンネルにおける走行が安定し、車列が渋滞なく流れることが期待されています。 ドライバーの負担の軽減 レベル4までの自動運転ではドライバーの乗車が必要となりますが、技術が発展するに従いドライバーが担う役割は減っていきます。これにより負担が軽減され、身体障がいなどのハンディキャップがある人でもクルマを利用しやすくなります。一方、配車サービスが充実することでクルマを持たずとも移動が容易になることも期待されています。 運送業の人件費削減 自動運転の技術は、一般のドライバーより先に運送業から浸透していくと見込まれています。自動運転技術が発達すれば、長距離ドライバーの負担の軽減や人件費削減、人口の少ない地域への自動運転路線バスの展開などが期待できます。 自動車×AI、実例9選 最後に当社事例も含めて、実際のAI活用事例をご紹介します。 潜在ニーズの分析を通じた目的地のAIレコメンド【Laboro.AI】 自動車でどこかへ遊びに出掛けるとき、自分で目的地を検索することが必要です。しかし「なんとなくドライブをしたい」と思い立ったときのように行き先がはっきりしない場合、そのニーズを言語化することは難しく、結果として検索することにも限界があります。 Laboro.AIでは、大手自動車メーカーとの研究開発で、AIとの対話を通してユーザーの潜在的なニーズを分析し、その内容から目的地を提案するAIレコメンデーションシステムの開発に取り組みました。観光スポットに関するウェブ上の口コミなどのビッグデータと地図情報などもデータとして活用し、対話のフィードバックを踏まえたレコメンドをします。ユーザー自身も言語化が難しい、潜在ニーズに合わせて目的地の提案をする新たな仕組みを開発中です。 参考: プロジェクト事例 『潜在ニーズ探索によるAIレコメンド』 トヨタの自動運転開発 トヨタ自動車は「自動車をつくる会社からモビリティ・カンパニーにモデルチェンジする」ことを標榜しており、MaaS(Mobility as a Service、移動のサービス化)のプラットフォームをつくることも目標に掲げています。このプラットフォームで自動運転技術を生かしたモデルとして、多目的EV自動運転車であるe-Palette(イーパレット)の開発を進めています。現段階ではレベル4相当の無人走行が可能で、巡回型の自動運転コンビニとしての活用も見込まれています。 さらに2024年夏には、運転手不要のロボタクシー(自動運転の配車サービス)事業を念頭に、レベル4による自動運転サービスを始めることが報道されています。東京・お台場の一部を無償で運行し、2025年以降は有償で範囲を都心に広げる計画です。一般車両が走る公道での自動運転サービスは国内初となる見込みです。 車両はトヨタのミニバン「シエナ」をベースに開発し道路や周辺の状況をセンサーで集め、AIで危険を予測するシステムを搭載すると言います。完全自動運転で走行できるとしていますが、当面は、安全を踏まえて運転手を同乗させる見込みです。 出典:自動運転ラボ 「トヨタのe-Palette(イーパレット)とは?自動運転EV、東京五輪で事故」    読売新聞「 トヨタ、公道で国内初の「レベル4」自動運転サービス開始へ…今夏にもお台場で無償運行 」 テスラの自動運転車開発 米電気自動車(EV)大手テスラは、自動運転でも想起される企業の一つになりました。2022年12月に、有料オプションサービスであるFSD(Full Self-Driving、和訳すれば「完全自動運転」)のパッケージ販売が北米で累計28万5000台に到達したことを明らかにしました。FSDは「完全」の意味を持ちますが、現時点では人間による監視が必要で、運転支援レベルに留まっています。同社は、自動運転向けのマップデータを使わずに、カメラだけで環境を捉えることで完全な自動運転の実現を目指しています。 出典:自動運転ラボ 「テスラの完全自動運転ソフト、売上は累計3,000億円規模か」 ナンバープレートの読み取り 車両のナンバープレートの読み取りにAI技術を活用した事例もあります。ナンバープレート部分を撮影し画像処理を施した上で、文字認識に関する学習をさせたAIに読み取らせ、ナンバー情報を自動的に蓄積します。車両管理の他、違反車両の取り締まりなどへの活用が期待されています。 出典: AICam『画像処理を用いた自動車のナンバープレート(自動車登録番号表)の解析』 ドライブレコーダーの機能拡張 米国のスタートアップ企業・ナウト社が開発したAI搭載ドライブレコーダーには、車内側にもドライバーの行動を監視するカメラが搭載されています。運転中にカーナビやスマホの操作などでわき見をすると、ドライバーの目や体の動きをAIが検知して即時に警告する仕組みを持っています。安全確認のためにサイドミラーや後方を確認する行動については、わき見運転と区別して警告しません。一方、居眠り運転に相当する行動は検知し、警告音を鳴らします。 あおり運転を警告する機能もあります。このドラレコを搭載する車のドライバー自身によるあおり運転を抑止するために、前方を走行する車との車間距離を計測し、その取り方があおり運転とAIが判断すると、ドライバーに警告します。 出典:日経産業新聞「 「ドラレコ」視野広がる AIや360度で車内外監視 」 プレス工程での検査効率化 自動車メーカーのアウディでは、機械学習技術を活用し、プレス加工を行う際に発生する金属板の割れ目や傷などを自動で認識させるなど、工場内の量産体制を整える試みを進めています。プレス工場で加工される部品のすべてをその場で検査できるようにしており、大幅な業務効率化を実現しています。 出典: 日経XTECH ACTIVE 『アウディ、プレス工程の品質検査にAIを活用』 タクシーの需要予測とダイナミックプライシング 国土交通省は2023年7月からタクシーの価格変動制を解禁していますが、システム構築にかかるコストなどが障害になり、運用しているタクシー会社はまだありません。導入を推進することも目的に政府が実用化を目指しているのが、GPSで走行距離を記録し運賃を決める「ソフトメーター」という新規格です。走行記録から自動で日報をつくるなどドライバーの業務効率を上げられます。 ソフトメーターが実現すれば、AIによる需要予測と組み合わせて、例えば急な降雨や大型イベントの有無といった情報に応じて運賃が変わる、価格変動制(ダイナミックプライシング)を採用しやすくなりそうです。 出典:日本経済新聞「 GPSでタクシー運賃計算、乗車前に確定 政府が新規格 」 住民の交通インフラを支えるMaaS 愛知県春日井市の高蔵寺ニュータウンでは次世代移動サービスMaaS(Mobility as a Service)を住民の足として活用し始めています。病院や商業施設など高蔵寺ニュータウン内にある拠点間を結ぶ乗り合いタクシーでは、配車と走行ルートの管理はAIが担っています。 商業施設などと自宅を結ぶ交通手段には、一部で運行している「自動運転カート」があります。走行ルートをあらかじめ定めない自動運転車両の実用化は全国初と言います。現状はドライバーが必要なレベル2での運用で、将来的にはレベル4を目指すとしています。さらに、高蔵寺駅からニュータウン中心部までの約3キロメートル間には、自動運転バスの導入も検討しています。 出典:日経MJ「 ニュータウンもう一度ニューに 高齢者の足に自動運転 」 みちのりホールディングスとの取り組み【Laboro.AI】 当社では、みちのりホールディングスとの取り組みを進めています。同社の自動運転に関するプロジェクトは、国立研究開発法人新エネルギー・産業技術総合開発機構(NEDO)「グリーンイノベーション基金事業/スマートモビリティ社会の構築」と、経済産業省「無人自動運転等の CASE 対応に向けた実証・支援事業(自動運転レベル4等先進モビリティサービス研究開発・社会実証プロジェクト(RoAD to the L4)(テーマ2))」とに採択されています。 当社はこれら二つの採択プロジェクトの協働推進パートナーとして、EVバスの運転手やバスの割り当て最適化、EVバスの充電計画を含んだ運行の最適化などの実現に向けたAI技術開発ノウハウの提供のほか、プロジェクト進行に係るシナリオ作成、自動運転バスの路線導入に関わるビジネス課題整理や要件定義などの各種アドバイザリー支援を行ってきました。さらに詳しくは下記のページをご覧ください。 PR TIMES「 みちのりHDとの協働プロジェクト推進にあたり、自動運転バスの導入・EVバス運行管理などに関するアドバイザリーを実施 」 進む、自動車業界でのAI活用 自動車業界でのAI技術の活用は自動運転だけでなく、さまざまな分野で進んでおり、その技術も日々進歩しています。私たち生活者にも身近な分野であるからこそ、より現実的なレベルでAIの恩恵が受けられる日もそう遠くはなさそうです。 当社Laboro.AIでは、「すべての産業の新しい姿をつくる」をミッションに掲げ、各産業ごとの課題に合わせたカスタムAIの開発・導入を支援しています。AI導入をご検討の方は、ぜひご相談ください。 The post 自動運転だけじゃない。自動車×AIの最先端 first appeared on 株式会社Laboro.AI .
アバター
不動産×AI、「固定」資産ビジネスこそAIで柔軟に 2021.8.15公開 2024.3.19更新 概 要 不動産業界も多種多様かつそれぞれが膨大な量のデータを扱っています。AI活用の大前提となるビッグデータが既に蓄積されていると見ることもでき、業務の効率化や新しいサービスが生まれ始めています。課題も確認した上で、AIを導入するメリットや活用事例を取り上げます。 目 次 ・ 不動産業界の現状と課題  ・ 労働環境  ・ 需要の下落  ・ 膨大なデータの活用 ・ 不動産業界でAIを導入するメリット  ・ 業務効率化  ・ 新サービスの開発  ・ 不動産投資への低ハードル化 ・ 不動産業界でのAI活用事例  ・ 不動産査定AI  ・ 不動産仲介AI  ・ 一人ひとりに合った物件提案  ・ 日当たり・騒音の計測  ・ サイトでのAIチャットボット  ・ 不動産価格予測 ・ AIで不動産の新たなユーザー価値を 不動産業界の現状と課題 不動産業界は、主な産業の国内生産額において情報通信産業、商業に次ぐ3位の規模を誇ります。海外で金融引き締めが進む中、日本では超低金利が追い風になり、国内外の機関投資家が日本の不動産投資を拡大し、市況は堅調です。一方で、以下のような大きな課題があることも指摘されています。 出典:総務省「 令和4年度 ICTの経済分析に関する調査 」 東洋経済新報社『会社四季報業界地図2024年版』 労働環境 不動産業界で大きな問題とされているのが、労働環境です。不動産業界では長時間労働が常態化しており、残業時間が多いだけでなく、勤務日数も多くなっているとする調査報告もあります。OpenWorkの調査によると年々改善傾向にはあるものの、「不動産・建設」業界は月間30.5時間で、「コンサルティング」「マスコミ・広告」に次いで3番目に多い業界になっています。 労働環境が悪いために離職率も低くなく、人材流出をどう防ぐかも大きな課題となっています。厚生労働省「令和4年雇用動向調査結果の概況」によると、2022年の不動産業・物品賃貸業の離職率は13.8%で、調査対象となった全16業種中7位でした。全産業の平均離職率の15.0%を下回ってもいます。 不動産業界の中でも、大企業ではITを積極的に取り入れるなどして労働効率を改善していく動きがありますが、中小企業が少なくない不動産業界では改善に着手する余裕がなかなかないという現状もあるようです。 出典:働きがい研究所「 日本の残業時間 定点観測 」    厚生労働省「 令和4年雇用動向調査結果の概況 」 需要の下落 近年は市場規模が拡大傾向にあり、好調と見ることのできる不動産業界ですが、長期的には人口減少や少子高齢化による需要の下落も想像できます。今後縮小していく可能性が小さくない市場において、いかに新しい価値を提供できるかが大きな鍵になっています。 出典:Smart Drive Fleet「 不動産業界が抱える一番の課題『働き方改革』にはIT化が必須? 」 膨大なデータの活用 不動産業界には、物件情報や取引価格など、膨大なデータが蓄積されています。一方、これらのデータを十分に活用するには、その仕組みを構築し、現場レベルでも運用できるためのDX(デジタルトランスフォーメーション)が必要です。 膨大なデータと言うと「ビッグデータ」が思い起こされるでしょう。登場してから久しくなったこの言葉が含む意味には変化が見られています。端的に言えば「人力では全体を把握することが困難な巨大なデータ群」のことです。明確な定義はありませんが、Volume(量)、Variety(多様性)、Velocity(速度あるいは頻度)の「三つのV」を高いレベルで備えていることが特徴とされています。また近年では、これにVeracity(正確性)とValue(価値)を加えた「五つのV」とも言われています。不動産業界に蓄積されている膨大なデータを有効なビッグデータとして活用するには、DXの推進がまだまだ求められています。 出典:NECソリューションイノベータ「 ビッグデータとは?基礎知識と活用事例を解説 」 不動産業界でAIを導入するメリット 不動産業界でAI活用の推進には、以下のようなメリットが期待されます。 業務効率化 AIが得意とする領域として、バックオフィス業務をはじめとした定型業務の自動化が挙げられます。AIはあらゆる業種でさまざまなかたちで業務効率化に活用されていますが、不動産業界でも業務効率化を進め、労働環境を改善することが期待されます。 不動産会社の業務として、例えば他社の物件を仲介して物件案内図を貼り出す際に行う自社情報への「帯替え」があります。帯替えはシンプルな作業ですが、数が増えれば作業コストだけでなくミスおよびそれを補填するためのコストもかさみやすくなります。すべてを機械に代替させることは不可能ですが一部は可能であり、業務効率化につながることが期待できます。 他の例には、営業担当が不明点を確認するために使用する社内マニュアルシステムの構築もあります。営業に関するノウハウは、会社によってはマニュアル化されていないことも多く、不明点を確認するために手間を要する他、営業としての行動形式にもバラつきが生まれてしまいます。簡単な内容に限られることは否めませんが、例えばチャットボットを導入し、営業担当がいつでも質問・確認できる環境が整えれば、営業の生産性向上につながることが見込まれます。 新サービスの開発 AIを活用することでこれまでの常識を打ち破り、新しいサービスを開発できる可能性もあります。一例に、不動産仲介AIがあります。不動産仲介をAIが代行できれば、ユーザーの利便性が増すだけでなく、仲介業者が管理会社としていた複雑なやり取りも軽減され、担当者は人間にしかできない業務に集中できたり、新サービスの開発に時間を割けるようになったります。 SNS投稿の分析にも、AIがよく用いられています。投稿から投稿者の属性や好みを推定するようなAIシステムを構築できれば、顧客ニーズにより合った提案ができるようになるかもしれません。具体的には、ある場所の人流などの定量的な情報だけでなく、なぜその場所が賑わっているのか、どのような印象を持たれているかなど、定性的な情報を見いだし、各種サービスに反映させることも期待できます。 不動産投資への低ハードル化 近年は投資などを通して資産運用することが政府からも推奨されており、さまざまなタイプの金融商品への興味が高まってきています。不動産投資もその一つですが、AIの活用が進むことで、不動産投資へのハードルが下がる可能性があります。 投資家から集めた資金でオフィスビルなどの不動産物件に投資して主に賃料収入を得るファンドであるREIT(不動産投資信託)は、日本で登場してから20年以上が経ち、定着した感があります。REIT単体にAIが活用されるというよりは、AIを活用した投資信託の投資先にREITが選ばれる例が多く見られます。AIが投資先や投資金額を提案してくれるサービスが広まれば、金融商品全般の購入、ひいては不動産投資を検討する人が増え、不動産業界が活況になる可能性があります。 不動産業界でのAI活用事例 実際に不動産業界で誕生した、AI活用サービスを六つ紹介します。 不動産査定AI 不動産仲介大手の東急リバブルは中古戸建ての価格査定でAIを導入しています。過去に取引のあった1000件以上の物件データを基に、従来は最大1週間ほどかかっていた査定期間を1日に短縮しています。 特徴量としては、築年数や交通利便性だけでなく、土地の形状や公示地価、周辺環境なども採用し、売却価格を査定。一般的なAI査定による価格の誤差率は平均10%程度のところを、同社が扱うシステムは5%弱と精度を高めています。AIで即日査定できれば商談を迅速に進められ、マンションの契約率向上も見込めます。 空き家の発生数を予測するAIシステムを手掛けるマイクロベースは、空き家を売却するために適切な価格を予測するシステムを開発し、愛知県豊田市や東京都町田市と連携しています。学習データは、実際に売却された物件と売り出し中の物件を合わせて約2300軒分です。所在地や築年数、リフォーム状況などを踏まえ、販売価格に合わせた売却成功確率を弾き出します。実証実験では93%の精度で売却の成否を当てたとしています。需要の変化を数値化することで適切な価格設定を促し、空き家の発生を抑えることを狙います。 出典:日本経済新聞「 東急リバブル、戸建て売却にAI活用 即日査定が可能に 」    日本経済新聞「 空き家問題をデータで解決 ヤモリ、戸建て購入し賃貸に 」 不動産仲介AI 不動産売買の際には、売り手と買い手の間に不動産仲介業者が入ることになりますが、この不動産仲介の多くの業務を代行できる不動産仲介AIサービスが登場しています。 AIやITを駆使した仲介サービス系のプラットフォームとしては、ホテル予約サービスやデリバリーサービスなど、これまでにも多く登場しています。これらのサービスのメリットは、窓口を集約することにより、ユーザーが素早く気軽に利用できるといった点にあります。 不動産仲介の場合は、高額な取引をスムーズに進めるために仲介業者が入るのが一般的ですが、不動産仲介AIが登場することで売り手・買い手双方にとってより利用しやすいサービスになることが期待できます。例えば、賃貸物件を探しているユーザーが物件に関する質問を入力すると、AIが素早く返答、希望条件に適合した物件をAIが選定し、ユーザーにおすすめとして提案したり、ユーザーが内見の申請をしたりといったこともシステム内で完結させることが可能になります。 不動産仲介AIの活用においては、上のような事務的な業務フローはAIが代行し、実際の内見はこれまでどおり担当者が実施するといったような、業務効率化を目的とした使い道が見いだされます。 参考:JDIR「 仲介業者はAIに殺されるのか? 不動産テック最前線 」 一人ひとりに合った物件提案 不動産仲介AIの事例として、LIFULLが提供している「AIホームズくんBETA」があります。不動産・住宅情報サイト「LIFULL HOME’S」の機能の一つであり、ユーザーとの対話を通して、好みに合わせた物件をAIが提案します。 AIホームズくんBETAは、チャット形式で質問に答えていく形式で、ユーザーは気軽にサービスを利用できます。質問の中でもユーザーに合わせた補助的な質問が行われ、好みに合った「住まいのカルテ」を作成することが可能です。 同社はさらに2023年に、ChatGPTの技術を活用した、LINEでいつでも住み替え相談ができるサービス「AIホームズくんBETA LINE版」のパイロット版を提供開始しています。対面での住まい選びの相談サービスの認知はまだ低く、いきなり来店するのも心理的ハードルが高いなどの課題があります。そこで、24時間いつでも対応可能なAI技術と、生活に密接しているLINEを連携させることで、いつでも気軽に住まいに関する相談ができるサービスとして開発されました。対話をしながら条件を明確にしていく体験を身近にし、住まい探しの第一歩を踏み出しやすくすることを目的としています。 出典:LIFULL HOME’S PRESS「 AIがあなたにピッタリの家を提案? 住まい探しにおけるAI活用の現在地 」 PR TIMES「 【国内不動産ポータルサイト初※】「ChatGPT」の技術を活用した「AIホームズくんBETA LINE版」を提供開始 」    ※LIFULL調べ(2023年4月27日時点) 日当たり・騒音の計測 物件情報の透明性を高める施策の一つとして、不動産物件の販売サイト「FLIE」では室内の明るさや騒音の度合いをサイトに掲載する実証実験を行っています。明るさや騒音の計測にはコミュニケーションロボットを用い、掲載する物件の室内に設置することでリアルタイムの計測を行います。内見でも分かりにくいケースの多い情報を掲載することで、透明性を高め、物件購入の後押しになることが期待されています。 出典:日本経済新聞「 部屋探しにもロボット 物件の日当たり騒音24時間計測 」 サイトでのAIチャットボット 不動産業界に限ったものではありませんが、AIによるチャットボットの活用も期待されています。チャットボットとは、ウェブブラウザの端などに出現するチャットスペースを指します。ユーザーは質問文や関心のある単語を入力することで、回答や関連する情報を得られたり、入力から推測・提案される質問文案を基に質問と回答を進められたりできます。 近年はこのチャットボットをAIで運用するケースが増えてきており、人間を介さずAIだけで質問や問題の解決ができるのも珍しいことではなくなりました。 チャットボットを導入することで、ユーザーには「膨大な情報の中から自分に合った不動産情報を見つけやすくなる」というメリットがあります。また、24時間いつでも問い合わせできる他、担当者ごとの対応の差も生まれにくいと言えます。 企業側には「人員を削減しつつユーザーからの問い合わせを受けることができる」というメリットがあります。より複雑な問い合わせには人間のオペレーターが対応できるようにすれば、さまざまなニーズに応えやすくなるでしょう。また、チャットボット経由でユーザー情報を収集できるというメリットもあります。 参考:Chat Dealer「 不動産業界で注目される「チャットボット」の秘密|導入事例をご紹介! 」 不動産価格予測 不動産投資におけるAI活用として、未来の不動産価格を予測するというソリューションが登場しています。現状、不動産の価格を知る方法としては「今売るといくらになるか」に留まるケースが多いかもしれません。しかしAIを活用して数年後の不動産価格を予測し、資産形成・運用に役立てられる可能性も出てきました。 AIによる需要予測に関しては、以下のコラムもあわせてご覧ください。 需要予測AIよ、需要は予測するものでなく作るものだ。 参考:PR TIMES「 日本初、マンションの将来の担保価値(最低資産価値)をAIが予測する検索サービス『OlivviA』のベータ版提供を開始 」    マネーポスト「 AIが算出「10年後の不動産の資産価値」池袋と秋葉原に大差がついた理由 」 AIで不動産の新たなユーザー価値を 近年は活況が続いていると言われながらも、将来的には人口減などから需要の下落が見込まれている不動産業界。労働環境の悪さという長年にわたる課題の解決も迫られています。それぞれの不動産企業にとってみれば、競合がひしめく中、いかに新しいサービス開発し、新たなユーザー価値を提供していくかも重要な視点です。AIがこれらのすべてを解決するのは難しいかもしれませんが、AI活用を試みる価値があるタスクは多くあるかもしれません。不動産という固定資産を扱うビジネスといえども、アイデアや問題解決の方法は「固定」させすぎずに、AIを活用するなど柔軟に考えるのが吉でしょう。 The post 不動産×AI、「固定」資産ビジネスこそAIで柔軟に first appeared on 株式会社Laboro.AI .
アバター
「生命線」としてのデータ。ヘルスケア&医療×AI 活用事例 2022.6.21公開 2024.3.15更新 概 要 ウェアラブルデバイスをはじめとしたセンシング技術の高度化、そしてAI技術の発達によって、近年、ヘルスケアに関するデータを非侵襲で収集し、またそのデータの分析を通して新たな体に関する法則を発見するといったことが可能になってきています。いまヘルスケア・医療はこうしたデータ取得・解析の技術進化を背景に、身体管理の未来に向けた大きな転換期に入っています。ヘルスケア・医療分野でのAI活用事例を紹介します。 目 次 ・ ヘルスケア・医療でAIはどう使われているか ・ ヘルスケアでのAI活用事例  ・ 栄養バランスなどの食事アドバイス  ・ パーソナルAIトレーナーによるレコメンド  ・ ウェアラブル端末による心拍数の計測  ・ 睡眠の質の計測 ・ 病気の発見・治療・介護でのAI活用事例  ・ AI画像診断  ・ 新薬の開発  ・ 介護施設のモニタリング  ・ ケアプラン作成支援 ・ “AI活用”は、AIだけでは実現できない ヘルスケア・医療でAIはどう使われているか 国内のAI利活用状況をまとめた『AI白書 2022』によれば、AIを導入あるいは検討している企業は実に40%を超え、多様な業種・業界でAIの活用が進められています。中でもヘルスケアの領域ではウェアラブルデバイスを始めとしたセンシング技術の高度化によって、これまで未取得であったデータの収集が進んでおり、より簡単に、そして日常的・継続的に自分の体に関する情報を可視化できるような環境が整いつつあります。 また、これまでそのセンシティブさから活用が控えめであった医療現場でもAIを導入する動きが多く見られるようになっています。例えば、CTスキャンやMRIなどで取得された画像データをAIに学習させて同様の症状を検出するためのシステムを構築する例や、マテリアルズ・インフォマティクスの見地から新薬開発や創薬にAI技術を活用する例など、多方面で新たなデータを活用した取り組みが進められています。 ヘルスケア領域でのAI活用事例 ここからは分野ごとのAI活用事例について紹介していきます。まず、日々の健康管理・維持や病気予防のための活動として位置付けられるヘルスケア領域でのAI活用事例を見ていきましょう。 栄養バランスなどの食事アドバイス 健康維持のための重要な要素である食事についてAIがアドバイスをくれるサービス「カロママ プラス」は、食事を入力することによるカロリー計算はもちろん、その栄養バランスの評価、日々の食事に関するアドバイス、運動内容の管理など、食事にまつわるさまざまな機能を持ったアプリです。カロママプラスでは約1万人の管理栄養士のネットワークを活かした運営をしている他、科学的なエビデンスに基づいたアルゴリズムによって、2億通り以上のアドバイスを行えるとしています。 また当社Laboro.AIでは、味の素様が展開するパーソナライズ献立提案アプリ『勝ち飯®AI』の開発を支援しました。このアプリは、味の素様が保有するノウハウから必要な栄養計算をアルゴリズム化し、計算された栄養素を満たす献立を機械学習で提案するというもので、一般的な献立AIでは事前に用意された内容を用いるケースが多い一方、今般のアプリでは献立というユーザーが毎日参照するものであること、ユーザーによって嗜好性が異なるものであることを踏まえて、大量のレシピの組合せからパーソナライズされた最適な献立提案を行うことを実現しています。 参考:プロジェクト事例「 パーソナライズ献立提案『勝ち飯®AI』 」    Laboro.AIコラム「 新・食体験に挑む。食品AIの可能性 」 出典: カロママ プラス パーソナルAIトレーナーによるレコメンド 健康維持の観点では、食事だけでなく運動も重要な要素です。運動に関してAIを活用している事例として、ヘルスケアプラットフォームアプリとしてリリースされている「FiNC」があります。FiNCは、パーソナルAIトレーナーが内蔵されたアプリで、AIがダイエットやフィットネスをサポートします。体重や歩数、睡眠、食事などをまとめて記録することができ、AIトレーナーが一人ひとりに合った提案をしてくれます。また、実際の栄養士やトレーナー、アスリートなどが発信するエクササイズメニュー、ヘルシーレシピなどに関する動画コンテンツも用意されている点を特徴としています。 出典: FiNC Technologies ウェアラブル端末による心拍数の計測 センシング技術の高度化により、時計機能に留まらないさまざまな機能を搭載したスマートウォッチが多く登場しています。スマートウォッチはウェアラブル端末の代表的なもので、その機能としては心拍数計測がよく知られるところです。スマートウォッチの代表格であるApple Watchにも心拍数機能が搭載されており、AIによる解析を通して心拍数の上昇を通知してくれるなどの機能が搭載されています。このように人間の状態をデータ化して収集するウェアラブル端末は、IoB(Internet of Bodies / Behaviors)と呼ばれ、近年、さまざまなデバイスが誕生しています。 参考:Laboro.AIコラム「 IoBが拓く、身体とネットの新結合 」 睡眠の質の計測 睡眠時の動きを加速度センサーで読み取ったり、呼吸の音などを分析したりすることで睡眠の質を計測するといったAIの活用も進んでいます。大阪大学の福井研究グループは、睡眠中の生体活動(体動、いびき、歯ぎしり)の音などを計測することにより、睡眠パターンを可視化し、さらに睡眠の良否を判定できるAI技術を開発しています。それぞれの音に対応する事象の特徴ベクトルを得て、それらの集合を入力としてニューラルネットワーク学習により睡眠パターンを可視化できるとしています。さらに時系列データを基にして、機械学習により睡眠の良否判別モデルを構築しています。 出典:大阪大学「 パーソナル睡眠管理AI:睡眠環境音で簡便に睡眠の質を判定 」 病気の発見・治療のためのAI活用事例 日常的な健康管理や予防を目的としたヘルスケア領域だけでなく、病気が発症した後の対策として位置付けられる医療分野でもAIの活用が進んでいます。ここでは医療の中でもとくに病気の早期発見や治療、そして介護を目的としたAI活用事例を見ていきましょう。 AI画像診断 AI画像診断は医療分野でもとくにその重要性が高く、AIの技術進化が進んでいる分野の一つです。MRI画像やCT画像などから病気を診断することは、熟練の医師でも見落としや間違いが少なからず存在するため、スキルと経験が必要とされる難易度の高いタスクです。しかし逆に、人間を超える精度を獲得しつつあるAIがとくに力を発揮しやすい領域の一つでもあります。 例えば、米国のスタートアップ企業Enliticが開発したAIシステムは、MRI画像やCT画像、X線などの画像診断を高い精度で処理するもので、がんについては放射線専門医より50%近くの正確性をもって診断できるとしています。他にも、同じく米国のスタートアップ企業Arterysが開発した3DのMRI映像システムは、通常は静止画として表示されるMRI画像をAI技術を用いて3Dアニメーション化し、心臓の動きや血流をリアルに表示、医師による画像診断をサポートすることに一役買っています。 さらに、MRI画像からアルツハイマーの発症予測をする研究成果も近年報告されており、2022年6月、UKにあるNIHR(National Institute for Health and Care Research Center)は、400名のアルツハイマー患者のデータを用いて学習させたアルゴリズムを用いて、約98%の精度で症状の有無を検出し、約79%の精度で早期・末期のステージ予測に成功したことを報告しています。 出典:総務省「 平成28年版 情報通信白書 」    DAIC “ 6 Takeaways in Cardiac and Vascular Imaging at RSNA 2021 “    News-Medical “ MRI-based machine learning approach can accurately predict Alzheimer’s disease “ 新薬の開発 画像診断のようにフィジカルなシーンだけでなく、製薬・創薬でAIを活用する取組みも進んでおり、とくに近年、元素レベルでの素材の組合せを導き出すマテリアルズ・インフォマティクス(MI)が注目を集めています。その特性から難易度が高い領域である上、治験などの手続きも必要であるため、その活用は慎重にならざるを得ませんが、今後ますますの活用が期待される分野の一つとして期待されています。 参考:Laboro.AIコラム「 化学のような、AIと産業の融合。MIの新価値 」 2023年9月には、武田薬品工業とキッセイ薬品工業、エーザイ、杏林製薬、日本新薬の計5社が、京都大学に設置した中央サーバーと各社のローカルサーバーと結び、化合物とたんぱく質の結合を予測するAIの連合学習(複数の企業や団体が社外秘のデータを共有することなくAIを共同開発する手法)に成功したとしています。今後は創薬AIの取り組みをプロジェクトに参加する17社全体に広げ、薬物の人体内での振る舞いや、毒性を予測するAIなどを順次開発し、2025年度には本格運用を始める方針です。 出典:日本経済新聞「 武田やエーザイが創薬AI データ共有しない「連合学習」で 」 介護施設のモニタリング 術後のリハビリや介護も重要な医療分野の一つです。介護施設にいる入居者が安全に過ごせているかをモニタリングするためにAIを活用するといった取組みも多く検討されていますが、プライバシーの問題から室内にカメラを設置することができないケースが少なくありません。そのため、人感センサーや赤外線センサーをはじめとした画像に頼らないセンシング技術を活用して入居者の状態を感知し、プライバシーを保護した上で必要なデータを得るといった手法も増えてきています。こうした新規の技術を用いて入居者の睡眠の質やトイレのタイミング予測、起床時間、転倒などを検知し、離れた場所からのモニタリングを実現するサービスも登場しています。 出典:日経クロステック「 介護現場の判断をセンサーやデータで支援、ベンチャーのツールがじわり浸透 」 ケアプラン作成支援 介護職員の重要でありながらも負担の多い業務の一つとして、ケアプランの作成が挙げられます。AIの活用によって、入力した内容に応じたケアプランを予測・生成し、介護職員の負担を軽減することが期待されています。さらに、被介護者の将来の状態予測をすることでケアプランの内容に新たな気づきを与えるといった効果も期待されており、実際にこうした作成支援ツールも登場しています。 SOMPOホールディングス傘下で介護事業を手掛けるSOMPOケアは、AIを搭載し、介護記録をデジタルデータとして蓄積して可視化し、施設入居者への支援業務を効率化するサービスの提供を始めています。食事や運動、体調など記録に基づいて3カ月後の健康状態を予測でき、これまで職員の経験と勘に頼っていた介護の変革を目指しています。 出典:日経産業新聞「 SOMPOケア、介護の可視化ノウハウ提供 環境改善促す 」 なお、ケアプラン作成支援など、介護現場におけるAI活用については以下のコラムでもご紹介しています。 参考:Laboro.AIコラム「 その課題はやはり過大。見えてきた、介護AIの可能性 」 “AI活用”はAIだけでは実現できない 今回はヘルスケア・医療でのさまざまなAIの活用例を紹介してきました。多くの領域で活躍するAIではありますが、上記の事例からも見えてくるように、AI技術単体が何かしらの革新を起こしている訳では決してなく、とくに各種のセンシング技術との両輪の進化が近年のイノベーションをもたらしています。MRIといった画像データの取得、ウェアラブルデバイスを通した健康に関わるデータの取得、人感センサーによる行動データの取得、これまでは未知だったデータを活用できるようになっている背景には、さまざまなセンシング技術の高度化が背景にあります。 近年、ビジネスワードとして「両利きの経営」という考え方が注目されています。つまり、既存のビジネスを改善していく「深化」と、新たなビジネス領域を模索する「探索」、この両面で事業を発展させていくべきという考え方ですが、データにも同様のことが言えるように思います。既存に保有しているデータを活用する「深化的なアプローチ」と、先端技術を活用して新たなデータを取得してく「探索的なアプローチ」があるとすれば、こと近年は後者のアプローチによって革新が起きているということです。 AI技術は確かに有望なテクノロジーではありますが、実際、その範囲は与えられたデータに何かしらの処理を施すことに留まります。“AIを活用する”ということを考えるにあたっては、AIや機械学習という一領域の技術についてのみ想像をめぐらせるだけでは足りず、その前工程にあたる“データの取得”、そして後工程にあたる“出力結果の現場反映”までにも気を配る必要があります。それぞれの工程の関連領域で起きているさまざまな技術進化を追いかけること、とくにデータの深化・探索に関わる技術キャッチアップはAI活用の生命線であり、とても大切なことなのです。 The post 「生命線」としてのデータ。ヘルスケア&医療×AI 活用事例 first appeared on 株式会社Laboro.AI .
アバター
ミラーワールドへようこそ。「デジタルツイン」とAI 2022.1.17公開 2024.3.12更新 株式会社Laboro.AI 執行役員 マーケティング部長 和田 崇 概 要 製造業を中心に注目を集め始め、内閣府が推進するSociety 5.0においても重要な技術とされる「デジタルツイン」。ミラーワールドさながらサイバー空間上でリアルワールドを再現することを目指すデジタルツインが、なぜ注目を集めているのか、事例を交えて紹介します。 目 次 ・ デジタルツインとは  ・ Society 5.0との関係  ・ デジタルツインとシミュレーション ・ デジタルツインが注目される理由 ・ デジタルツインのメリット  ・ 試作・試験を繰り返すことによる品質向上  ・ リスク低減 & コスト低減  ・ サービス品質向上 & 新ビジネス展開 ・ デジタルツインの活用業界と事例  ・ 製造業  ・ 建設業  ・ スマートシティ ・ デジタルツインとAI、そして文化 デジタルツインとは デジタルツインとは、現実の物理空間をサイバー空間上に再現する技術やコンセプトを表す言葉です。現実世界の双子(ツイン)あるいは、鏡に映ったミラードワールドのような環境をデジタル空間上に再現することからそのように呼ばれています。よく知られている仮想現実(VR)とは異なり、物理空間に起きうる事象をリアルタイムに再現し、実世界に起こる現象を予測するためなどに用いられます。 デジタルツインを構築するためには、IoT(Internet of Things)デバイスや各種センサーなどを用いて物理空間の情報を収集し、拡張現実(AR)技術などを用いてサイバー空間で再現します。デジタルツインではリアルタイム性が重要であり、こうした高度な分析予測を可能にするため、AIは欠かせない要素技術として位置付けられます。 Society 5.0との関係 内閣府が提唱・推進する「Society 5.0」は、「サイバー空間(仮想空間)とフィジカル空間(現実空間)を高度に融合させたシステムにより、経済発展と社会的課題の解決を両立する、人間中心の社会(Society)」と定義されるもので、デジタルツインはまさにこのような高度な社会を実現するために不可欠な技術だと言えます。 出典: 内閣府「Society 5.0」 デジタルツインとシミュレーション “物理空間をサイバー空間に再現して、実世界で起こりうる現象を予測する”、こうしたデジタルツインのコンセプトから連想されるのが「シミュレーション」という言葉です。シミュレーションは、ある事象や挙動を対象に、実世界とは切り離された別の環境・場所で再現しその内容を確認するものと捉えられます。一方デジタルツインは、現実世界をサイバー空間に再現するという点でシミュレーションの一種だと言えますが、現実世界とリアルタイムに連動し、現実世界へ有用なフィードバックを行う点に違いがあります。 デジタルツインが注目される理由 デジタルツインの有用性が認められ注目度が増してきた背景としては、センサーやAI技術などを活用した情報取得と分析・予測技術が進化してきたことが挙げられます。そして、これを支える重要な技術の総称とも言えるのが、IoTです。 2010年代にディープラーニングの台頭によって開花したAI技術により、画像AIをはじめとして多くの産業活用が進み、これまでは取得が難しかったデータの収集・分析が進んでいます。さらに、RFIDや赤外線をはじめとするセンサー技術も高度化、実世界で新たなデータ収集を行う取り組みが次々と進められています。また5Gや6Gなど、通信技術・品質も進化し、収集されたデータをリアルタイムに伝達する環境も整いつつあります。 さまざまなモノがインターネットにつながることを意味するIoT。そこに含まれる様々な要素技術が進化・高度化したことにより、リアルタイムなミラーワールドを構築するデジタルツインの実現が現実味を帯びてきていることが、昨今注目を集める背景になっているようです。 デジタルツインのメリット では、デジタルツインの環境が構築されることで、どのようなメリットがもたらされるのでしょうか。 試作・試験を繰り返すことによる品質向上 例えば、インフラとして位置付けられる電気や水道、通信、鉄道などは、社会や暮らしとの繋がりが密接であることから、その需給がダイレクトに生活へと影響します。そのため、配給・提供量の管理・統制が非常に重要である一方、ある意味一発勝負で実行しなければなりません。 デジタルツイン環境では、実世界に近い状況でこれらの配給・運行試験の試行錯誤を繰り返すことができ、適切な需給量の決定に貢献し、結果としてサービス・製品の品質向上へとつながっていくことが見込まれます。 また、このような将来予測だけでなく、実世界と連携しているデジタルツインならではのメリットとして、新たなデータ取得による改善が挙げられます。提供する商品やサービスにデータ収集を行う仕組みが備わっていれば、最新の生活者の行動データや利用状況などを把握でき、常にデジタルツイン環境をアップデートすることにもつながっていくはずです。 リスク低減 & コスト低減 製造業やメーカーの場合であれば、新製品開発におけるリスク低減がデジタルツインのメリットとして期待できます。新製品開発では、想定されるリスクをできる限り減らすため、本来、さまざまな製品テストを行う必要がある一方、販売価格を抑えるために重大なリスクのみを想定したテストに限定して実施されることも実際です。 シミュレーション環境でも言えることですが、サイバー空間上で比較的に安価にこうした試験が実施できる環境が整っていれば、これまで以上のリスク回避、あるいは想定外のリスク発見に至ることも期待されます。 サービス品質向上 & 新ビジネス展開 デジタルツインの最大の特徴は、現実世界と連動している点にあります。そのため、例えば消費者に販売・提供した商品サービスの状態をIoTの活用によって常時把握できる仕組みが整っていれば、顧客ごとの利用状況の把握はもちろんのこと、故障などのトラブルが発生した際のフォローやメンテナンス提案などが、よりしやすくなることが考えられます。 加えて、これまで製品製造のみに特化していたメーカーにとっては、こうしたアフターサービス提供を前提とした新たなメンテナンスビジネスへの進出可能性が生まれてきます。 デジタルツインの活用業界と事例 現段階では発展途中であり限定的な例が多い状況ですが、デジタルツインの進行状況を把握するため、いくつかの事例を紹介していきたいと思います。 製造業 デジタルツインが最も活用されている業界の一つが、製造業です。モノを作る製造業においてはデジタルツインによって得られる恩恵が多く、サイバー空間に各種の工程を再現することで効率化や製品品質の向上などが期待できます。 デジタルツインを活用した事例としては、中国のカラーフィルターメーカー「上海儀電」の事例が挙げられます。上海儀電では、工場内の設備や機器をデジタルツインによってすべてデジタル化し、稼働状況や消費電力、機器のコンディションなどをリアルタイムに監視できるようにしています。これにより、工場内で異常が発生したときにすぐさま場所や異常の内容を察知し、対処できるなどのメリットを享受しているとのことです。 横河電機は実在のプラントにデジタルツインを活用して30分後の稼働状況を予測する技術を開発しています。東京湾に面する東京ガスの扇島LNG基地に導入され、1000個単位で配備されたセンサーからは圧力や温度、流量など都市ガスの製造過程で得られるデータをリアルタイムで収集し、デジタルツインに反映させています。横河電機では他に、2022〜2023年に実施したとの共同実験では、強化学習によるAIが約1年にわたって化学プラントを自律制御できることを確認、安定稼働させる世界初のシステムを実現したとしています。 製造業でのAI活用については、以下のコラムでもご紹介しています。 Laboroコラム: 「『製造DX』は幻想か。AI導入の今と展望」 出典: FUJITSU JOURNAL「製造業の最新活用事例にみる『デジタルツイン』とは?」       日経産業新聞「日本流DXで製造業変革 横河電機など、人と機械が協働」     横河電機「【ENEOSマテリアル/横河電機】世界初 強化学習AIが化学プラントに正式採用」 建設業 建設業界においても、建設現場をデジタルツインで再現することでさまざまな効率化や品質向上につなげる取り組みが進められています。その例として、大規模複合施設「HANEDA INNOVATION CITY」に適用された現場管理システム「3D K-Field」が挙げられます。 大手建設会社の鹿島建設が開発した3D K-Fieldでは、施設内のロボットや施設をつなぐ自律走行バス、スタッフの位置やバイタル情報などがデジタルツイン上に再現され、現場の状況を遠隔から正確に把握できるような仕組みが構築されています。 東京大学発スタートアップのDeepXと橋梁メーカーのオリエンタル白石は、地下調整池などの建設に使用するシステムの自動運転システムの開発を進めています。デジタルツインは掘削する地面の状況を把握するのに活用しており、複数のセンサーを使ってリアルタイムに地形を測量し、地上のモニターに3次元で表示する仕組みを構築しています。この測量値を基に、ショベルを精度良く自動操縦できるとしています。 建設業でのAI活用については、以下のコラムでもご紹介しています。 Laboroコラム: 「変わる建設、変えるAI。建設DXの今とこれから」 出典:鹿島建設 「リアルタイム現場管理システム『3D K-Field』をスマートシティに初適用」      日経産業新聞 「DeepX、デジタルツインで縦穴掘削 建機を自動運転」 スマートシティ デジタルツイン活用の最高峰として位置付けられるのが、スマートシティの実現です。国内ではトヨタ自動車が推進する実証都市「Woven City(ウーブン・シティ)」が知られていますが、ウーブン・シティは静岡県裾野市の工場跡地を再利用して建設が進められている都市で、人々が実際に住んで生活を営む空間においてさまざまな先進技術を取り入れ、コミュニティの成長や幸福を目指すヒト中心の街です。この都市における実証で重要となるのがデジタルツインであり、都市を取り巻くあらゆるデータを集め、現状や未来の変化をシミュレーションすることが目指されています。 シンガポールは「プンゴル・デジタル・ディストリクト(PDD)」と呼ばれる50ヘクタールの土地をデジタル化の重点地区として開発しています。西部のジュロン地区に続くイノベーションの拠点として位置づけ、企業や大学、商業施設などを集積し、各施設は2024年以降に順次稼働する予定です。PDDにはテクノロジー企業も参画してさまざまな実証実験を進める予定でもあり、その中の一つに、地区内のエレベーターや冷暖房、人の混み具合などさまざまなデータを集め、ビルなどの構造物を3Dで再現したデジタルツインに連動させる計画もあります。 出典: TOYOTA WOVEN CITY    accenture 「都市の『デジタルツイン』の構想と可能性」 日経ヴェリタス 「シンガポール、街をデジタル技術の実験場に」 デジタルツインとAI、そして文化 実世界を再現したミラーワールドをサイバー空間上に構築する、デジタルツイン。AIはデジタルツインを実現するために用いられる要素技術の一つでしかありませんが、画像AIによる人々の行動データの取得、自然言語処理によるSNS投稿内容の解析、ある機械に搭載されたセンサーから取得された時系列データの分析など、実世界データの取得手法としてはもちろん、それらを活用した予測にも用いられることが想定されます。さらにはそれらのデータをもとにしたエアコンなどの機械制御や、電力供給などの配給量統制など、その用途はさまざまに考えられます。 とはいえ、取得、分析、制御といったタスクを一律に、ある意味で自動的に実行するAIモデルやAIシステムは存在しません。一つひとつのタスクに対して個別にAIの仕組みを開発する必要があり、そしてそれらをシステムとして連携させる必要があることを考えると、スマートシティのような大掛かりなデジタルツイン環境を構築することは、一筋縄ではいかないはずです。 リアルとサイバーが連動するデジタルツインの未来は、確かにSFの世界を飛び出し、実現へと向かいつつあります。しかし、Society 5.0の実現は、最新の技術さえあれば達成されるというものではなく、それらの仕組みを検討し、要件として落とし込み、個々に開発することが必要であるのに加え、それを利用する人たちにオペレーションとして浸透・定着させる必要があります。デジタルツインは、技術の進化によってのみ構築されるものではなく、ある意味で文化を変革することによってもたらされるものでもあるのです。 The post ミラーワールドへようこそ。「デジタルツイン」とAI first appeared on 株式会社Laboro.AI .
アバター
「生成」と「創造」の差。最高のアニメを生み出すのはAIか、人間か。 2024.3.9 監 修 株式会社Laboro.AI 執行役員 マーケティング部長 和田 崇 概 要 AIが人間に取って代わる可能性の懸念の1つは雇用について、そしてもう1つは人間のクリエイティブな表現が侵食されるのではないかということです。 「AIの創造的思考は人間に匹敵する」という研究結果も発表され危機感が高まっていますが、一方で創造性あふれるアニメ制作現場では生成AIの活用が積極的に進められており、世界レベルのアニメ映画が今後3年以内にかつての1割の時間と労力で作れるようになるという予測も聞かれます。あるいは生成AIを活用した制作エンジンを使用して、小さなチームでインディーズアニメシリーズが制作できるAIスタジオも出てきています。 今回は、生成AIがデジタルクリエイティブに浸透し始めている現状を掘り下げ、人が創造し表現することが果たしてAIに置き換えられてしまうのかどうか、考えてみたいと思います。 目 次 ・ 複雑さを増す、アニメ制作  ・ アニメ市場規模は史上最高を更新  ・ 一瞬で 1,000 個のゴミ箱を描き出す ・ AIでは実現できないことを認める  ・ 肝心な部分は人の手で  ・ AIに携わるキャリアへの不安 ・ AIは絵筆と同じくらいの脅威  ・ 最高のアニメに平均的なものはない  ・ AIの創造的思考は人間の平均 ・ アニメ制作への参入障壁が下がる  ・ アニメのインディーズ市場を活性化する ・ 創造するためにAIでゆとりを作る  ・ 1週間で30分しか家に帰れない制作現場  ・ このままではアニメ業界は10年もたない ・ 動画はリアルから想像の世界へ  ・ 創造することは「マラソン」に近い  ・ 作り手になってわかる「創造」の価値 複雑さを増す、アニメ制作 アニメ市場規模は史上最高を更新 史上最高を更新し、国内 3兆円 、世界では約 61兆7千億円 (2024年2月現在)と評価されるアニメ市場が、 生成AIの出現を目の当たりにしています。昨年公開されたピクサーのアニメ映画『 マイ・エレメント 』では、主人公の体に複雑にゆらめく炎のエフェクトを作成するためにAIが活用 されました 。そして日本でも、Netflixの過去のアニメ作品で学習した画像生成AIを用いて制作が進められている短編アニメ『 犬と少年 』が注目を集めています。 「古き良き時代、世界クラスのアニメーション映画を作るには 500 人のアーティストで5年かかりました」 そう語るドリームワークス・アニメーションの元CEOジェフリー・カッツェンバーグ氏は、こうしたAIの活用によって今後3年以内に、アニメーション映画の制作には当時必要だった時間や労力の10%もかけずに済むようになると予測 しています 。 アニメ制作に画像生成AIが積極的に使用され始めているのには、膨らむ需要と裏腹に、作り手不足が一刻を争うほど深刻化している制作現場の現状を考えなければなりません。 CGを始めとするテクノロジーの発展によりアニメ制作はスピードアップしてきましたが、そのたびにより複雑さを増し、アニメの表現に求められる期待はますます大きくなっています。宮崎駿監督もアニメ制作の肉体労働の量の多さに打ちのめされると 語っていた ことがありましたが、制作工程には多くの人の献身的な労働が必要となっています。 事実、60年ほど前の手塚治虫がプロダクションを設立した頃のアニメを見てみると、背景にあるビルが人の想像力なくしてはまるでビルには見えない、ただの四角い枠線でしかありません。対して、例えば Netflix短編アニメ『犬と少年』の背景画は、AIと人の手によって描かれた非常に手の込んだ繊細なラインによる、温もりある色彩豊かな自然風景が表現されています。 一瞬で 1,000 個のゴミ箱を描き出す 生成AIを使用しているある海外のアニメ業界関係者は、次のようにその利便性を語っています。 「例えば部屋の隅にゴミ箱の絵が必要な時、生成AIツールを使用して1,000個のゴミ箱を生成し、その中から 1 つを選んで使用 します 」 確かに、一瞬で1,000種類のアートワークを描けるAIアシスタントがいれば、その中から一番希望に近いものを選びながら調整を加えていくことで、アニメ制作に携わる人間の負担を減らすことができます。それは、質を落とさずに多数の作品を作り続ける上で最も現実的な解決策と言えるでしょう。一方で次のような声があるのも事実です。 「生成 AIから高水準の出力を迅速に取得できるかもしれませんが、それを微調整して希望どおりにするのは非常に難しいプロセス です 」 前出の短編アニメ『犬と少年』でもAIが作ったものでそのまま利用しているものはほとんどないそうですが、Business Insiderの インタビュー によると、 AIによって半分くらいに省力化できた分、より手のかかるところの質を上げる作業に時間を使うことできたということです。 AIでは実現できないことを認める 肝心な部分は人の手で このように、 生成AIによってアニメ制作が促進すると認められつつあることは事実です。しかし同時に、動きの繊細さや、態度、性格、特異性といった、アニメーターによって描かれるキャラクターをより個性豊かなものにする感情的な創造性を生成AIで実現するのが難しいこともまた、実感として認められつつあるといってもいいのかもしれません。 AIに携わるキャリアへの不安 一般的にAIが人間に取って代わる可能性についての懸念の1つは雇用について、そしてもう1つは、人間の創造性が侵食されるのではないかということです。 アニメ業界も例外ではなく、イギリス最大のアニメフェス、マンチェスター・アニメーション・フェスティバルが実施したAIに関する調査でも、調査対象となった専門家の85%がAIはクリエイティブ業界に対する脅威であると考えていることが わかっています 。 将来テクノロジーに関わる仕事を夢見る大学生の間にも懸念はあるようで、人を陥れるような未来に手を貸すことになるのではないかと次のような声も 聞こえてきます 。 「コンピューターサイエンスと数学を学ぶ学生として、テクノロジー業界にできあがってしまった暗黙の害悪に加担するキャリアへと吸い込まれてしまう不安があります」 AIは絵筆と同じくらいの脅威 最高のアニメに平均的なものはない では実際に創作に励む制作現場の人々にとってAIがどのような脅威かというと、「カメラや絵筆と同じくらいの脅威」であるというような意見が少なからず 聞かれます 。 NHK Eテレの人気アニメ『ひつじのショーン』などのアニメで知られるアニメーションスタジオ、アードマン・アニメーションズも、より多くの制作を同時に進めるためのツールの一つとしてAIを活用しているそうです。そこでシニアプロデューサーを務めるリチャード・ビーク氏は、AIの描けるものにそれほどアニメに肝心なものはないとして、次のように 言います 。 「私はAIが知性であるという考えに悩まされています。 AIは平均的なものを照合して見つけているように思うのです。最高の映画やテレビは平均的なものではありません」 AIの創造的思考は人間の平均 AIが創造的か平均的かという問いに関連して、AIと人間を戦わせることで創造的思考を評価した研究があります。この研究で用いられたAIチャットボットは結果的に、ほとんどの人間の参加者に匹敵する創造性を発揮しました。 しかし特筆すべきは、人間のトップレベルのパフォーマンスが常にチャットボットを上回っていたことです。 アニメーションにおいても、アニメの中で泣き笑い、生き生きと動き成長していくキャラクターを魅力的にするのは、アニメーター自身の人生経験、人間や動物の観察、参考資料の研究から生まれるインスピレーションによる ものです 。アニメ制作の中でAIによってスピードアップし、効率化される部分があるとしても、深い創造性を求められる表現は、AIではとても再現が難しい領域なのです。 アニメ制作への参入障壁が下がる アニメのインディーズ市場を活性化する 業界全体のビジネス動向はと言うと、作り込まれた表現を維持しながら多作を求められるアニメ制作現場は、膨れ上がるコストによって収益化に大きな課題を抱えており、昨今のエンターテイメントの流れと同様、業界内での統合が進むのではないかという懸念が 高まっています 。 そこで、描画などの技術的スキルが障壁となってアニメーションに手を出せなかった想像力豊かなストーリーテラーに、生成AIがアニメーション業界への参入を手助けするツールとなり、業界に新しい風をもたらすと 期待されています 。 ChatGPTの生みの親であるOpenAIは、テキストから動画を作成するサービス「 Sora 」の市場導入を進めており、ほかにもAIを使って、数回クリックするだけで、日常のビデオをアニメや3D漫画に変換できるアプリなどがさまざま登場 しています 。 例えば、自分がスキーをしているビデオをアップロードし、プロンプトとして「スキーをする女の子」と入力し、ビデオの長さと強度レベルを選択すると、自分のスキーの動画がアニメーションビデオに変わるといった具合です。 デジタルクリエイター向けのAIスタジオも登場し、AIを活用した制作エンジンを使用して、低コストなインディーズ・アニメーションをAIスタジオと共同制作できるようになりつつ あるようです 。 雇用の面では、企業に所属する人という意味では減るかもしれませんが、インフルエンサーとされるクリエイターの経済規模は2023年に3 兆円超と 評価されており 、コンテンツを作成する個人が増えるとともに市場は拡大し 続けています 。 ただ、消費者にとっては、たくさんの選択肢からクリック一つで見たいものを好きな時に見られるようになればなるほど、コンテンツの消費が簡単なものとなり、作品の創作価値に対する意識は昔と比べて低下してきている部分はあるのかもしれません。 創造するためにAIでゆとりを作る 1週間で30分しか家に帰れない制作現場 創造性は人間の本質であって、そもそもAIによって奪われるようなものではないはずです。ですが、こうした恐れは、インターネット上に日々生まれるコンテンツが膨大になるにつれ、創作物に対する敬意が 失われていき 、その結果「AIが創造性を奪う」という不安を掻き立てて生まれた感情なのかもしれません。 昨今の日本のアニメ制作本数はなんと、年間310本にも上るそうです。「家に帰りたい」「寝たい」「休みが欲しい」という日本のアニメ制作に携わる人々の訴えは切実で、日本アニメーター・演出協会がアニメ制作に関わる人を対象に行った2023年の調査でも、回答者の17%がうつ病などの心の病気か、その可能性があることが わかりました 。キャラクターなどを描いているという回答者の女性の話では、締め切りに間に合わせるために泊まり込みで作業を行うことは珍しくなく、帰宅時間が1週間で30分ほどしかないこともあるということです。 人手不足によって疲弊してきたアニメーターが生成AIを使うことで作業の負担が軽減された場合、それは果たして創造性を奪うことになるのでしょうか。むしろ、アニメに重要なシーンやキャラクター表現に注力する時間的・精神的ゆとりが生まれ、より積極的に表現力や想像力を発揮できる場面が増え、創造性を高めることができるのではないかと思われます。 このままではアニメ業界は10年もたない 日本のアニメ業界を『280億ドル(約4兆1,300億円)の搾取工場』というタイトルでまとめた外国の YouTube動画 は、150万視聴数を稼ぎ出しており、その中で繰り返し登場するのが帝国データバンクの 2022年の調査発表の中にある次のような 文面 です。 「人的、質的な制作能力を日本アニメ制作業界全体で維持できなければ、早ければ10年以内に日本アニメ自体が地盤沈下する可能性も出ている」 寝る間を惜しんで人々が従事し続けなければ制作ができないならば、昨今の労務コンプライアンス的にも業界の存続は難しく、アニメーターが創造性を発揮する場さえも失われてしまうはずです。 リアルから想像の世界へ 創造することは「マラソン」に近い 生成AIを活用するこれからのアニメーターは、何十年にもわたるアニメ制作の恩恵を受け、その肩の上に立って新しい世界を見渡し、トライ&エラーを繰り返し、今日私たちが知っているものとは異なる作品を創作していくことになります。 その作品の価値を低くするのか、高いものとするのかについては、“作り手の視点” に立てる人が増えること次第なのかもしれません。ChatGPTにしても、無料のお試し感覚で限られた目的に使われているうちはアウトプットを消費するにすぎませんが、一方で粘り強くプロンプトの入力を繰り返し、それが本当に正しい回答なのか検証して修正を重ね、未知の回答を引き出せる域に達することで、はじめてその技術の限界を知るとともに、創造という人間の所業による本来的な価値に気付くことができます。 きっとAIを使ってアニメを作るにしても、こうした試行錯誤が、爪痕を残すような作品を生み出すことの難しさと素晴らしさを、私たちに気付かせてくれるはずです。 作り手になってわかる「創作」の価値 ピクサー共同創業者のエド・キャットムルはその著書『 ピクサー流 創造するちから――小さな可能性から、大きな価値を生み出す方法 』の中で、創造に何かロマンティックな幻想を抱いている人は多いが彼の見てきたものは全く違うとして次のように述べていました。 「経験から言えば、創造的な人々は、長年の献身的な努力を通じてビジョンを見出し、実現している。その意味で言うと、創造性は短距離走よりマラソンに近い」 AIによる省力化を進めつつ、人は人で目の前のことをただこなすよりも、自分の道を一歩一歩、足を前に出し続ける…そんな働き方になっていくことを願うばかりです。 TikTokをはじめSNS上には現実とリンクしたものがまだまだ圧倒的に多い状況ですが、今後AIによって個人でもアニメーションを作れるようになっていくと、心に思い描く未来や架空の世界を描き出す創造性あふれるコンテンツも増えていくはずです。休日には学校や仕事から距離を置き、生成AIをアシスタントにアニメを作るというライフスタイルが出てきてもなんら不思議ではありません。 AIは、いつの間にか現実社会の効率に縛られるようになった現代の人々に、自分の中にある想像の世界を描き出す扉を開きます。「平均的なものではなく、最高のものをつくりたい」という人間の創造性の素晴らしさが再認識されるような、新たな時代の、新たな制作のカタチを、作り手と共に私たちも踏み固めて行きたいと思います。 The post 「生成」と「創造」の差。最高のアニメを生み出すのはAIか、人間か。 first appeared on 株式会社Laboro.AI .
アバター
「Web3.0」じゃないWeb3と、AIの関係性 2022.12.13公開 2024.3.8更新 株式会社Laboro.AI リードマーケター 熊谷勇一 概 要 先日公開したコラム「 AI導入企業の初の過半数越え。高品質AIモデルを支えるデータセントリックとは 」では、文字通り-centric(〜を中心とする)を話題にしましたが、今回はその反対のdecentric、「非中心の、非中央集権の」の話題を取り上げます。実は、Web3でdecentricがキーワードになっているのです。ここを押さえることにより、Web3にAIがどう関わり、どのような相乗効果を生んでいき、AIの重要性がさらに増すことが分かります。 目 次 ・ インターネットの歴史と発展  ・ Web1.0  ・ Web2.0 ・ そして、Web3とは ・ Web3のメリット  ・ 個人情報を自由に管理できる  ・ 国を超えたアクセスが自由にできる  ・ 仲介組織を通す必要がなくなる  ・ セキュリティレベルが向上する ・ Web3にはAI活用が欠かせない  ・ ブロックチェーン技術内の活用  ・ メタバースにおける活用 ・ Web3でのAI活用事例  ・ 熱量の高いファンを可視化する  ・ 日本刀のアート作品を制作 ・ Web3とAIと社会は高まり合う インターネットの歴史と発展 そもそもインターネットは、どのように発展してきたのでしょうか。 次に訪れるとされているWeb3という概念があるということは、その前に2と1があったということです。 Web1.0 インターネットが登場し、家庭でも使われるようになったのは1990年代後半のことであり、それからの時代をWeb1.0と呼びます。マイクロソフトによるOS(基本ソフト)「Windows 95」がその名の通り1995年に発売されたことなどがきっかけとなり、家庭用のパソコンとインターネットが急速に広がり始めました。 Web1.0の特徴は一言で言えば「一方通行」です。インターネット上に公開されたウェブサイトの利用方法のほとんどは「読むだけ」でした。メールや掲示板などの例外を除き、作成者が公開してユーザーが読むだけの時代だと言えます。 Web2.0 2000年ごろからスタートしたとされているのが、「リード・ライト型」とも言われるWeb2.0です。Web2.0ではインタラクティブ(双方向的)に情報がやり取りされるようになります。 具体例としてはまずブログが挙げられます。ユーザーはプログラミングの知見を必要とせずに気軽にブログを開設でき、情報を発信できるようになりました。その後、各種SNS(交流サイト)やYouTubeなどの動画配信サイトも普及しました。クラウドコンピューティングも生まれ、ファイルの共有や共同編集が容易になったのも大きな特徴です。今や、誰もが大容量・高品質の情報やコンテンツを発信し、それを基にコミュニケーションができる環境が整っています。 一方で、無料で使えるこのような便利なサービスはGAFAMを始めとする管理者が情報を収集することで成り立っています。管理者であるGoogleやFacebook(Meta)は、巨額の広告収入で経営が成り立っています。近年はこのような中央集権型のインターネットに反発する雰囲気も生まれ、人々は自身の情報やコンテンツを自らコントロールしたいと思うようになっています。 そこで登場しようとしているのがWeb3です。「Web3.0」と表記しないのは、Web3.0はもともと1990年代後半に「セマンティックウェブに基づくインターネット」の意味で使われており、現在言われているWeb3とは意味が異なるからです。ちなみにセマンティックウェブとは、ウェブページに記載してある文字列以上の意味を持たせることで、効率良く情報にアクセスできる在り方のことです。 Web3が発展することで、既存の仕組みは分散型の新たなサービスに移行するシナリオがあります。 出典:大植択真『Web3時代のAI戦略』 そして、Web3とは Web3とは一言で言えば、分散型のインターネットであり、中央に管理者はおらず、ユーザーは自分のデータを自分で管理し、ブロックチェーンが重要な役割を果たす在り方のことです。2022年10月3日の岸田文雄首相による所信表明演説でも触れられ、いや応なく進展していくことになりそうです。Web3の具体的なサービスに共通している特徴がdecentric、「非中心の、非央集権の」なのです。 Web1.0、Web2.0という現在までのインターネットは中央集権型と捉えられています。GAFAM(Google、Amazon、Facebook (Meta)、Apple、Microsoft)をはじめとした大手IT(情報技術)企業が管理者として存在し、ユーザーはそのサービスを利用しているかたちです。別の言い方をすれば、ユーザーは個人情報やアクセスログが大手 IT企業にどのように使われているか把握することは難しく、不正利用されていないことを信じてサービスを利用することになります。 一方、Web3は、GAFAMのような管理者がおらず、情報はユーザ一人ひとりによって管理される在り方です。この実現の鍵となるのが、ブロックチェーンの技術です。ブロックチェーンは情報取引における記録技術のことを指し、取引情報は暗号化され、ユーザー間で分散するかたちで保存されます。ですから、ブロックチェーンでは中央集権的な管理者を必要としません。 参考:phemex「 Web 3.0: 未来の分散型インターネット 」    リテールガイド「 Web3.0とは?Web1.0、2.0との違いやメリット、サービス・技術の事例などを紹介 」    coindesk JAPAN「 「ウェブ3」を10分で理解する【基礎知識】 」    SELECK「 【最新事例も】「Web3(Web3.0)」とは何か? ブロックチェーンが実現する「次世代インターネット」徹底解説 」 Web3のメリット インターネットがWeb3へ発展すると、以下のようなメリットが得られると言われています。 個人情報をより適切に管理できる Web3ではブロックチェーンにより情報が分散して保存され、原則として保有者以外が手を加えることができません。そのため各人が個人情報を思う通りに管理でき、どの企業・サービスに使ってもらうかをコントロールできるようになります。例えば、個人情報を提供することで対価として報酬やサービスを受け取るなど、自由な取引が実現されるサービスが出てくる可能性があります。 国を超えたアクセスが自由にできる インターネット上のコンテンツは、世界中からアクセスできるというイメージがあるのではないでしょうか。しかし実際には国ごとの法律や規制などがあり、どこにいても同じページやサービスを利用できるというわけではありません。グローバルに展開しているサービスでも、国や言語によって内容を変えているケースは珍しくありません。 Web3ではサーバーが存在しないため、このような国ごとの制限や違いも取り払われ、どこからでも同じサービスを享受できるようになります。 仲介組織を通す必要がなくなる Web3では、現在「管理者」として存在しているGAFAMのような大手テック企業に限らず、あらゆる仲介組織が必要なくなり、サービス提供者と受給者が1対1で直接取引をします。これにより、仲介手数料がなくなったり、仲介組織の誘導の影響を受けずにより主体的に製品やサービスを選択できるようになったりするなどのメリットが生まれるかもしれません。 セキュリティーレベルが向上する セキュリティーレベルの大幅な向上も期待されます。ブロックチェーンの技術では情報が暗号化され、さらに分散して保存されるため、理論上は情報の改ざんが不可能と言われています。サイバー攻撃を仕掛けて改ざんしようとしても、分散された情報が生きているため、すぐに照合され攻撃されたことが分かるという仕組みです。 中央集権型のWeb2.0では、サーバーに情報が蓄積される仕組み上、サーバーが攻撃者の標的となります。現状、情報漏洩のニュースは珍しいものではなく、セキュリティーは完全なものだとは言えません。Web3に移行することで、現状起きているような大規模な情報漏洩などは起きない可能性が見いだされています。 参考:リテールガイド「 Web3.0とは?Web1.0、2.0との違いやメリット、サービス・技術の事例などを紹介 」 Web3にはAI活用が欠かせない Web3ではこれまでになかったようなサービスが多数登場し、より一人ひとりにカスタマイズされたサービスも生まれていくと考えられています。そうした中で欠かせないのが、AIの技術です。 ブロックチェーン技術内での活用 Web3の根幹となるブロックチェーンは、AIを活用することで新たな価値がもたらされると考えられます。 例えば健康の分野では、大量のデータを集めることでAIを学習させ、診療や生活習慣指導の質を高めることが期待できます。しかし患者や情報提供者のプライバシーの問題が付きまとうのが現実です。ブロックチェーンでは個人情報は個人によって管理されるため、プライバシーを保護した上で質の高いデータを集め、治療法などを発展させていくことが可能になると期待できるでしょう。 その上、AIの高度な応用においては、企業や国をまたいだ無数のソースからのビッグデータを用いることもあります。しかしそのようなデータの使用には、ノイズやバイアス、誤ったデータや改ざんされたデータに汚染されるリスクがあります。ブロックチェーンは、AIが学習で使うためのデータを管理し、トレーサビリティーを担保することで、データの信頼性を確保することができます。ブロックチェーンではさらに、ネットワーク上の管理された学習データに誰もがアクセスできるようにもなります。 加えてプライバシーや「非中央集権」と関連した新しい機械学習の在り方として、連合学習(Federated Learning)も出てきています。これは、個々のデバイスやサーバーのデータを共有することなく、それらデバイスやサーバにまたがってモデルを学習していく機械学習の手法です。 連合学習は従来の機械学習と違ってデータを共有しない性質を持つので、データプライバシー、データセキュリティ、データアクセス権、異種データの活用など、企業や社会が考慮すべき重要な問題に対処しつつ、機械学習・深層学習の恩恵をもたらすことができます。 出典:デロイトトーマツ「 AIとブロックチェーンのシナジーで、安全と信頼を生み出す 」    森正弥「 Federated Learning (連合学習):エッジコンピューティングを支え、またブロックチェーンとシナジーする、分散型機械学習 」 メタバースにおける活用 Web3ではメタバースがより発展し、身近になっていくと予想されます。 メタバースとは、インターネット上に作られた仮想空間のことです。人々は自由に選択したアバターを使用し、現実と同じように交流や生活、仕事をします。 企業の従業員は同じオフィスに集まる必要がなくなり、メタバース上でコミュニケーションやプロジェクトの推進を行うことが可能です。また、日常的な買い物もメタバース上で行えるようになっていくでしょう。 このようなメタバースにおいても、AIは重要な技術となります。例えば、メタバースが人々の生活で重要性を増すためには24時間365日の絶え間ない管理が必要となります。そこでAIによる自動管理が実現の鍵になるでしょう。 また、メタバースひいてはWeb3において、より一人ひとりに合ったサービス、パーソナライゼーションが求められるようになり、そこでもAIが活用されるでしょう。メタバース上の行動は、基本的にすべてデータで表現・取得できると言えるからです。例えば、現在も行われている商取引の実績のデータだけではなく、消費者がなぜ買ったか、もしくはなぜ買わなかったかが、その前後の行動データと結び付けて分析できるようになるでしょう。 パーソナライゼーションについてはこちらもご覧ください。 当社コラム「 パーソナライゼーション【ビジネス成長のためのAI用語】 」 当社プロジェクト事例「 パーソナライズ献立提案「勝ち飯®AI」 」 参考:IBM「 ブロックチェーンと人工知能(AI) 」    モリカトロンAIラボ「 Web3.0を担うメタバースにおけるAIの役割とは? 」 Web3でのAI活用事例 熱量の高いファンを可視化する Web3技術を基盤とする非代替性トークン(NFT)とAIを組み合わせた広告商品が実現しています。収録済みの映像をAIを使って解析し、カメラの動きや背景、露出時間なども考慮し、映像に広告画像を違和感なく「後付け」できるとしています。その上でNFTを配布することにより、従来は広告を見て終わりだったところを、NFTを取得した消費者にはプレゼントを提供したり、抽選への参加を促したりすることができるようにしています。そうしたメリットを享受した消費者はある程度熱量の高いファンだと考えられ、可視化できるのはメリットの一つと言えるしょう。 出典:日経XTREND「 目指せ「嫌われない広告」 映像内にポスター、NFTも活用 」 日本刀のアート作品を制作 400年以上の伝統を引き継ぐ刀鍛治職人の技術とAI、Web3が融合した日本刀のアート作品が発表されています。機械学習とクラウドコンピューティングをコア技術とする「ジェネレーティブデザイン」という3Dモデリング手法を導入し、快適なグリップ、強度の最大化、などを特徴量としてAIが学習し、3Dデータを生成します。このデザインプロセスから最終3Dデザインデータまでは、Web3のプラットフォーム上で統合管理されています。さらに、ブロックチェーンなどによるWeb3テクノロジーを生かし、デザインやデジタルファブリケーション(デジタルデータを基に創造物を制作する技術)における真正性(それが何であるかの記述や主張の通り、本物であること)やオーナーシップ(所有権)などの課題を解決しているとしています。 出典:PR TIMES「 AIとWeb3、400年の技を継承する現代刀匠の技術と融合した日本刀「TACHI」を発表 」 Web3とAIと社会は高まり合う Web3によって、人々の行動がさらにデジタルデータで表現・取得できるようになり、それを学習データとしてAIがさらに進化し、より良いサービスが生まれ、利用者が増え、さらに取得できるデータが増え…という具合に、Web3とAI、そして私たちの社会は正の連鎖を生み出せる可能性があります。あらゆる産業でのWeb3とAIの活用も見込めます。自社が置かれている産業でのAI活用のコンサルティングや、自社事業のためにカスタムメイドしたAIである「カスタムAI」を強みとするLaboro.AIにぜひご相談ください。 Web3の前提の一つとなるAIとIoTについてはこちらをご覧ください。 AIとIoT、その密接な関係を知る The post 「Web3.0」じゃないWeb3と、AIの関係性 first appeared on 株式会社Laboro.AI .
アバター
エッジAIの活用に必要な、二つのデザイン 2022.3.20公開 2024.3.6更新 概 要 さまざまな産業での導入が活発になっているAI。ニュースや日常シーンでもその言葉を耳にする機会が多くなりました。AIの新たな在り方の一つとして近年注目が集まっているのが、デバイス側にAI機能を搭載した「エッジAI」です。このエッジAIをうまく導入・活用するためには、「二つのデザイン」ができるかが重要なポイントになります。エッジAIの概要やメリット・デメリット、活用事例の紹介をしつつ、二つのデザインについて考えていきます。 目 次 ・ エッジAIとは  ・ オンプレミスとは  ・ クラウドとは ・ エッジAIのメリット  ・ リアルタイム性  ・ 通信費など固定費のコストカット  ・ セキュリティリスクの軽減 ・ エッジAIのデメリット  ・ 大規模データの処理ができない  ・ システムと業務オペレーションが複雑化する ・ エッジAIの活用事例  ・ 自動運転車  ・ 製造現場・製造工程でのセンシング  ・ 農業での作業支援  ・ 遭難者や事故車両発見に役立つ通信装置 ・ テクノロジーとビジネスをデザインする エッジAIとは 「端」を意味する言葉「エッジ」が頭についた「エッジAI(Edge AI)」とは、ビジネスシーンの末端、つまりよりユーザーに近い場所に設置されるデバイスに搭載されたAIを指します。これまでAIが導入される多くの場合には、システムの中でも中枢にあるサーバー上でその処理を動作させることが主流でした。一方、エッジAIではデバイスそのものが得たデータをそのデバイス内で処理し、インターネット通信を介さずとも、その場で特定の認識処理、分析処理、フィードバック処理を行うことが目的とされています。 エッジAIを搭載したデバイスの例には、スマートフォンや自動車、小売店に設置されたAIカメラなどが挙げられます。例えば、自動運転車は車体に搭載された各種センサーで周囲の状況をデータとして収集し、その情報を処理し、前進や停止などの物理的な操作につなげていきます。 もしAIの処理環境を「料理をする環境」に例えると、エッジAIはキャンプ場のようなもので、キャンプ場での限られた設備・道具を用いてカレーライスのような限定された料理のみが調理可能な状況に例えられます。つまり、計算能力や処理内容にかなり制限・限度が設けられた仕組みなのです。 オンプレミスとは キャンプ場的なエッジAIと異なり、自宅の使い慣れたキッチンと道具で、じっくり時間をかけてたくさんのメニューを調理できるような環境が、「オンプレミス(on Premise)」です。つまり、AIの処理に必要なサーバーといったハードウェアやソフトウェアを自社内に構築する方法がオンプレミス(略して「オンプレ」とも呼ばれる)です。環境構築のための初期費用の高さやセキュリティ対策、メンテナンスの手間ひまなどのコストがかかるデメリットがある一方、システムの柔軟性の高さや情報漏洩などのリスクが低いことがメリットとして挙げられます。 クラウドとは 自宅キッチンではなく、キッチンスタジオを借りて料理をするような場合、つまり外部のプラットフォーマーが提供するクラウド上の環境を借りてAI処理を回すようなシステム環境が「クラウドコンピューティング(Cloud Computing)」(略して「クラウド」と呼ばれる)です。店内カメラで画像撮影をして、そのデータをインターネット上に上げて処理、その結果をまたインターネットを介して端末側に送り返すといった使い方が主流で、ITジャイアントであるGoogle(GCP: Google Cloud Platform)、Amazon(AWS: Amazon Web Service)、Microsoft(Microsoft Azure)がこうしたクラウドサービスを展開しており、三大プラットフォーマーとも呼ばれています。 クラウドのメリットは、自宅にわざわざ豪華なシステムキッチンを作らなくて済むことと同じように、外部環境を借りるため初期費用が低く済むことや、膨大・大量のデータ処理も行えるような充実した処理環境を確保できることなどが挙げられます。しかし、リアルタイム性という点ではエッジAIに劣ること、複雑なタスクをAIに実施させようとするとやはり結果として高コストになってしまうこと、さらには、基本的に万全な環境ではあるものの社外に情報を送信するという点でどうしても情報漏洩のリスクと隣り合わせにあること、などがデメリットとして挙げられます。 エッジAIのメリット キャンプ場での料理のような、言ってしまえば制限のある貧弱なエッジAIが、なぜ注目を集めているのでしょうか。その背景には、次のようなエッジAIの長所が発揮される期待があるからです。 リアルタイム性 エッジAIのメリットの一つが、リアルタイム性です。AIの処理環境として主流であるクラウドAIでは、通信のためのタイムラグが発生するため、即応性を高めるには限界があります。例えば、自動運転車に搭載されたセンサで道路に飛び出した人を認識したものの、その判定に何分・何時間もの時間がかかってしまっては意味がありません。エッジAIのようにデバイスそのものに処理機能が搭載されていれば、リアルタイムでの処理性能を高められるわけです。その他、身近な例ではデジタルカメラのスマイルシャッター機能も分かりやすい例かもしれません。瞬間的に現れる人の笑顔を捉えるためには、やはりリアルタイム性が鍵になります。 通信費など固定費のコストカット コストカットも特にクラウドと比べてのメリットと言えます。クラウドAIサービスは従量課金制であることがほとんどで、こうした通信費をはじめとする固定費がコストとして大きくのしかかることが課題となり得ます。もちろんエッジAIでもそのシステム次第では外部サーバーにデータを送信することも考えられますが、エッジAIそのものは基本的にデバイス内で認識・推論処理を完結するため、こうしたコストカットにつながりやすいと言われています。 一方で、AI機能搭載のセンサやカメラなどのエッジデバイスの開発あるいは購入・導入には当然ながら費用がかかります。開発・購入、そして運用にかかるコストを見比べながら、最適な推論環境を選択することが肝要であることは間違いありません。 セキュリティリスクの軽減 クラウドであろうとオンプレであろうと、インターネット上にデータを送信することにはやはり情報漏洩のリスクが伴います。例えば、小売店内の顧客分析のために店内防犯カメラの映像データを送信する場合、映像内に映った顧客の顔の画像は個人情報に当たり、こうした情報が漏洩した場合は企業の信頼を大きく損なうことにつながります。 エッジデバイス上でこうした顔情報を削除してからデータ送信する仕組みを搭載して、データ送信を行うことも可能になっています。しかし、やはり外部のインタネット上にデータを持ち出さずにエッジAI内で処理を完結できた方が、セキュリティリスクは低くなります。とはいえ、エッジAIのセキュリティリスクがゼロというわけではもちろんありません。デバイスそのものが物理的に盗難されることもあり得るなど、エッジAIなりのセキュリティリスク管理を実現する現場運用が必要になってきます。 エッジAIのデメリット オンプレ、クラウド、エッジAIは、どれが優れているかという話ではなく、「目的に合わせて最適な環境を選択・構築する」という観点によって選ばれるべきです。そうした意味で、エッジAIのデメリットもしっかりと押さえておく必要があります。 大規模データの処理ができない コンピュータールームに置かれているような大規模なサーバーの大きさとの比較を想像すれば明らかですが、基本的にエッジAIはモノとしては小さく、計算処理するためのモジュールを搭載する物理的なスペースも限られるため、どうしてもその処理性能に限界があります。 近年、センサーチップの機能向上などもあり、エッジAIの性能も高度になってきています。しかしエッジAIは基本的に、データを用いた学習は別環境で行い、学習済みのAIモデルを搭載・活用するために用いられます。また大量のデータ分析、あるいは複数のタスク処理を同時にさせるような場合には、クラウドあるいはオンプレ環境を採用することが一般的です。 システムと業務オペレーションが複雑化する これはエッジAIそのものというよりも、「何のためにエッジAIを導入するのか」という人の見定めの部分と言えます。「とにかく流行っているから」という理由でエッジAIの導入をすれば、かえってシステム全体が複雑化してしまいます。 また、こうした新たなシステムを導入する場合、通常、現場の業務オペレーションを組み直す必要が生まれてきます。例えば、店内の陳列棚の状況をAIカメラで認識し、その情報をリアルタイムに店内スタッフに通知する「リアルタイム在庫把握システム」を導入するケースを考えてみます。通知を受けて補充に走る役割はどのスタッフに任せるのか、また、さすがに全商品の把握は困難であることを前提とすると従来の補充運用とどう並列してオペレーションを組むのか、さらに、店内で調理している惣菜にそのシステムを導入する場合、調理時間を考えると通知をどのタイミングで発するのがベストなのかなど、目的や活用内容に応じて必ず業務オペレーションの変更が発生します。 新しい技術を用いることの魅力はもちろんありますが、「何に、どう使うのか」という点を事前に検討しておかなければ、やはり宝の持ち腐れになってしまいます。 エッジAIの活用事例 最後に近年のエッジAIの活用例を紹介します。 自動運転車 前述の通り、エッジAIの活用が最も期待されている分野の一つに自動運転車があります。クルマを自動で運転させるに当たっては、周囲の状況を把握してから運転の制御を行うまでにタイムラグがあってはならず、人間による運転と同等かそれ以上の安全性や快適性を確保する必要があります。 自動運転技術は着実に発展してきており、AI技術やセンシング技術の発達により、運転の主体がドライバーからシステムへと変わる「レベル4」の実現が見えてきたと言われています。自動運転の実用化を盛り込んだ改正道路交通法が2023年4月に施行され、そこでは新たな交通主体・分類として「特定自動運行」や「遠隔操作型小型車」が定義されています。特定自動運行はドライバーが車内にいない、いわゆる自動運転レベル4を想定したもので、遠隔操作型小型車は歩道を走行する自動配送ロボットなどを想定したものです。 自動車メーカー各社もそれぞれの動きを見せています。日産自動車は2027年度に国内で自動運転サービスを始めると発表。オンデマンド型の乗り合いサービスを想定し、まず2024年度に横浜市で走行の実証実験を始め、将来的には特定条件下で運転を完全自動化するレベル4への対応も視野に入れるとしています。ホンダは米国のゼネラル・モーターズと組み、2026年から都心で無人タクシーサービスを始める計画で、両社が共同開発する、運転席がない自動運転の専用車両「クルーズ・オリジン」を使い、レベル4に対応するとしています。トヨタ自動車は、ソフトバンクと共同出資するモネ・テクノロジーズが2024年7月にレベル2の自動運転サービスの実証実験を始める予定で、将来的にはレベル4などの高度な自動運転の実現を目指すとしています。 出典:自動運転ラボ 「ついに4月「自動運転レベル4」解禁!進化した道交法、要点は?」    日本経済新聞 「日産、27年度に自動運転サービス レベル4も視野に」 当社では、みちのりホールディングスとの取り組みを進めています。同社の自動運転に関するプロジェクトは、国立研究開発法人新エネルギー・産業技術総合開発機構(NEDO)「グリーンイノベーション基金事業/スマートモビリティ社会の構築」と、経済産業省「無人自動運転等の CASE 対応に向けた実証・支援事業(自動運転レベル4等先進モビリティサービス研究開発・社会実証プロジェクト(RoAD to the L4)(テーマ2))」とに採択されています。当社はこれら二つの採択プロジェクトの協働推進パートナーとして、EVバスの運転手やバスの割り当て最適化、EVバスの充電計画を含んだ運行の最適化などの実現に向けたAI技術開発ノウハウの提供のほか、プロジェクト進行に係るシナリオ作成、自動運転バスの路線導入に関わるビジネス課題整理や要件定義などの各種アドバイザリー支援を行ってきました。さらに詳しくはこちらのページをご覧ください。 参考:PR TIMES 「みちのりHDとの協働プロジェクト推進にあたり、自動運転バスの導入・EVバス運行管理などに関するアドバイザリーを実施」 製造現場・製造工程でのセンシング 多くの危険が伴う製造現場で、安全管理のためにエッジAIを用いたシステムが導入されるケースが増えています。立入危険区域への作業員の侵入や、製造機械の暴走・故障など、作業員の安全を確保するためにはこうした特定のシーンをリアルタイム性に検出する必要があります。また、不良品選別など製造過程での異常検知・検出においてもエッジAIを活用する例が増えています。ヒューマンエラーを完全になくすことは難しいものの、比較的簡単な一定の異常をリアルタイムで検出可能にすることで、ダウンタイムの影響を少なくし、また人的なリソースをルーチン作業から解放させることに期待が寄せられます。 参考:Laboro.AIコラム 「『製造DX』は幻想か。AI導入の今と展望」 農業での作業支援 就業者不足が深刻であり、作業の効率化や無人化の実現が期待される農業においても、エッジAIが大きな役割を担っています。完全無人化は難しいとしても、トラクターなどの農業用車両を自動運転で制御する構想が描かれるほか、農薬の自動散布や農場の保守のためにドローンの活用が進められているなど、多くのシーンでエッジデバイス・エッジAIの活用素地が整いつつあります。 参考:Laboro.AIコラム 「 守れ、農業。AIが描く第一次産業の進化像」 遭難者や事故車両発見に役立つ通信装置 シャープは早くて2024年度に、高速通信規格「ローカル5G」対応の通信装置を発売する計画です。半径200〜300メートルほどの範囲に5Gの通信環境を整備でき、救助隊のカメラ付きドローンとの連携を想定しています。4K画質の映像をリアルタイムで確認できる通信環境をつくり、より広範囲の災害現場を早く探索できるようにするだけでなく、エッジAIを搭載することによって遭難者や事故車両を自動検知する機能も実現しているとしています。 出典:日本経済新聞 「シャープ、防災起点で新規事業 数年内に水循環の洗濯機」 テクノロジーとビジネスをデザインする 富士キメラ総研が行った調査によると、2018年には110億円と見込まれていたエッジAIの市場は、2030年には664億円にまでなると予測されています。今後、益々の技術進化とビジネス活用が見込まれるエッジAIですが、調理の例えで触れたように「何に、どう使うか」を検討した上で、オンプレ、クラウド、エッジAIから最適な環境を選択することが重要です。 また近年では、オンプレとクラウドの良いところを組み合わせた「ハイブリッドクラウド」といった概念も登場しています。それぞれを異なる物として捉えるのではなく、組み合わせることで生まれる価値にも目を向けることも、こうしたAI処理環境を検討するに当たっては大切な視点です。 ただ、いずれにしても重要な点は、これらの新しいデバイスを活用したり、システム環境を構築したりするのに、技術面の設計だけでは完成しないということです。新たなテクノロジーやシステムを導入するためには、その活用に合わせてビジネス側・業務オペレーション側も設計し直すプロセスが必ず発生します。テクノロジーとビジネスの両側面を照らし合わせながら、これら二つをデザインするプロセスを当社では「ソリューションデザイン」と呼んでその重要性を提唱しています。このソリューションデザインが精緻に達成できて初めて、エッジAIを初めとする新技術の活用素地が生まれてくるのです。 The post エッジAIの活用に必要な、二つのデザイン first appeared on 株式会社Laboro.AI .
アバター