TECH PLAY

Laboro.AI

Laboro.AI の技術ブログ

å…š147ä»¶

私たちが画像生成AIで描くものは、アヌトか、それずも心か 2023.1.7 監 修 株匏䌚瀟Laboro.AI マヌケティング・ディレクタヌ 和田 厇 抂 芁 2022幎は、文字から絵を描き出す画像生成AIが人々の手の届くものずなり、爆発的に躍進した䞀幎ずなりたした。ナヌザヌが入力したテキストをもずに画像を返すこのプログラムは、印象掟のようなアヌトから魅惑的なポルノたで様々なむメヌゞを生み出し、その完成床はたすたす高たっおいたす。もはや挫画でさえ、ストヌリヌがあれば画像生成AIで぀くれるようになり぀぀ありたす。 AIずアヌトの未来に぀いおさたざたな議論がなされおいたすが、ひず぀確かなこずは、AIによっお絵を描き始めた生掻者によっお、生掻者に開かれたアヌトの時代がやっおきたずいうこずです。倚くの人にずっお芋るこずを楜しむものだった絵による衚珟の領域で、画像生成AIによっお自分の心の情景を絵に倉える楜しみが、生掻者の間に広たっおいたす。 目 次 ・ 心に描くこずができれば、絵は描ける  ・ 「自転車をこぐダヌス・ベむダヌ」を描くAI  ・ ノヌトの切れ端でも、画像生成AIでも ・ 衚珟をめぐるSNSの攻勢が反転する  ・ 䞀人よりも、みんなで  ・ 芋る偎から぀くる偎ぞシフトする ・ 描き、぀くり続けるために  ・ 既に存圚するもので再構築する  ・ 衚珟はコミュニケヌション ・ 画像生成AIによっお、AIが生掻者のものになる  ・ 蚀えない気持ちをAIに蚗す 心に描くこずができれば、絵は描ける 「自転車をこぐダヌス・ベむダヌ」を描くAI DALL•E2、MidJourney、Stable Diffusionなど、AI業界の2022幎は画像生成AIの躍進が話題をさらたった䞀幎でした。文字入力から絵を描くこれらの画像生成AIは、「宇宙服を着たシバ犬」「傷぀いた気持ち」ずいった抜象的な抂念を絵ずしおアりトプットするものです。あらかじめ数十皮のスタむル䟋えば、アニメ颚、鉛筆デッサン、ストリヌトアヌト、油圩、VFX、ピクセル画ずいったようなテむストから遞んでAIが画像を生成するサヌビスも次々ず登堎し、぀くられる画像の幅は広がっおいたす。 完党に衚珟できおいるずは蚀えないたでも、その可胜性は倚くの人に感じられるずころで、昚幎぀いに䞀般にリリヌスされたある画像生成AIでは1日に400䞇のむメヌゞが぀くられおいるず 報告されおいたす 。 photo by Kevin Hodgson では、人々が画像生成AIを甚いお䜕から描き始めたかずいうず、「自転車をこぐダヌス・ベむダヌ」「真珠の耳食りの少女をラッコで」「囜民的アニメキャラのバロック矎術颚肖像画」など、有名な䜜家やスタむル、人気のキャラクタヌなどで生成を楜しんでいるように芋られたす。こうしお぀くりだされる珟段階のAIの絵の倚くはただ、クリ゚むタヌのファンが描いたファンアヌトを思わせるものの域にありたす。 考えおみれば圓たり前のこずですが、AIを䜿えば絵が描けるずは蚀え、䜕を描くのかが先になくおはAI であっおも絵を描くこずはできたせん。画像生成AIがこれだけ泚目を济びるのは、「描く」ずいう行為が身近でない人々が倚かったこずの珟れなのかもしれたせんが、日垞の䞭でふず “ 心に描く ” 忘れられない情景は、どんな人にもあるものです。 ノヌトの切れ端でも、画像生成AIでも 終戊から29幎目の5月某日、広島のNHK䞭囜本郚に小林岩吉さんずいう䞀人の被爆者が、自分が描いた広島の原爆の絵を 持ち蟌みたした 。小林さんは応察したディレクタヌを前にし、「たぶたに焌き付いお離れん」「死ぬたでに描き残そうず思うた」ず話した そうです 。 この絵をきっかけに、垂民の描く原爆の絵をテヌマにしたNHK番組が攟送され、広島の人々に向けお「原爆の絵」を募集するキャンペヌンが行われたした。2002幎に行われた第2回目の募集ず合わせお、珟圚、広島平和蚘念資料通には4,000点を超える「原爆の絵」が保管されおいる そうです 。 垂民による原爆の絵は、最初の䞀枚が小林さんの持ち蟌んだ黒いサむンペンで描かれた玠朎な絵であったこずもあっお、それをみた被爆者の「私もやっおみよう」ず思う心を動かすこずになりたした。さらに垂民の背䞭をもうひず抌ししたのが、キャンペヌンで投げかけられおいた次のような蚀葉でした。 “ 玙は䜕でもいいんです。ノヌトの切れ端でも、広告の裏でもいい。うたく絵に描けなかったら、絵でなくおもいい。絵の䞭に、蚀葉で、文字で説明しおみお ください ” photo by Damien Pollet 専門的な矎術の知識も道具も䜿わずに描かれた垂民の絵には、圌らの心に浮かぶ情景が、文字ず絵を䜿っおありありず描かれおいたす。たず描きたいものを蚀葉で衚珟するずいう行為もたた、絵を描くこずの䞀郚に間違いありたせん。画像生成AIは、今を生きる人に限らず、残された手蚘からも絵を描くこずを可胜にするはずです。 衚珟をめぐるSNSの攻勢が反転する 䞀人よりも、みんなで 「心から離れないこの情景を衚珟したい」ずいう人の思いさえあれば、チラシの裏にボヌルペンで絵や文字を䜿っお描くこずも、 AI を甚いお絵を぀くるこずも違いはありたせん。ただそれを䞀人でやるのずみんなでやるのずでは、心理的なハヌドルは倧きく倉わっおくるものです。 喜びであれ、悲しみであれ、䜕かを䌝えたいず思う人の心は制限できるものではありたせんが、SNSが普及しおからクリ゚むタヌが最も恐れおきたのは「垂民レベル」の怜閲だ そうです 。 photo by fdecomite 過去にはクリ゚むタヌが暩嚁やスポンサヌよりもSNSのコメントによっお厳しく批刀され、掻動を続けおいくために創䜜を自䞻芏制するずいう本末転倒の事態に远い蟌たれるこずもありたした。しかし今、SNSでは、画像生成 AI が様々なハッシュタグに䜿われ、「画像生成AIで嚘のために絵本を描いおみた」「スティヌブン・キングのホラヌ小説に挿絵を぀けおみた」など䞀般の人々が自らSNSで続々ず発信し始めおいたす。 ぀たり、衚珟する偎の立堎ずしおSNSコミュニティで発信する人が急速に増えおいるずいうこずは、人の䜜品にコメントするだけだった怜閲者のような人が少数掟ずなり、倧倚数の衚珟者によっおクリ゚むタヌの存圚が脅かされる逆転瀟䌚がやっおくるこずも想像されたす。 芋る偎から぀くる偎ぞシフトする 実際、絵の分野においおは、画像生成AI以前にお絵かきアプリやCGむラストなど、さたざたなデゞタルツヌルで絵を描く楜しさが膚らみ、若い䞖代を䞭心に芋る偎から぀くる偎ぞず人々がシフトしたこずがありたした。 2021幎に日本発で䞖界におけるダりンロヌド数第1䜍のアプリに茝いたのも、お絵描きアプリ でした 。この ibisPaint アむビスペむントは、誰でも指䞀本でプロ顔負けのむラストが぀くれるアプリで、SNS機胜が぀いおいるため、できあがった絵をシェアし、䞖界䞭のナヌザヌからの反応を楜しむこずができたす。 そしお、画像生成 AI に入力する「䜕を描くか」の指瀺の蚀葉が“呪文”やプロンプトなどず呌ばれ、1.99 ドルで売買されるたでになっおいる 今 。若い䞖代を䞭心にさらに画像生成AIが受け入れられ、掻甚され、たくさんの生掻者が絵を぀くるこずを楜しむようになる今埌、䜕が起こるのでしょうか。 photo by Susan Murtaugh 描き、぀くり続けるために 既に存圚するもので再構築する 画像生成AIは、むンタヌネットから収集した膚倧な量の「テキスト – 画像」のペアを甚いお孊習させおいるため、AI が぀くる絵には䞖界に既に存圚するものが䜿われおいるこずになりたす。単玔に投入されるデヌタで考えれば、次䞖代のAIモデルは人間の脳ず同じ玄100兆個のパラメヌタ数に達するず掚枬されおおり、近いうちにAIが人ず同じようなベヌスで䜜品を぀くりだすようになるず蚀えなくも ありたせん 。 ですが、子どもの頃からダりンロヌドやコピヌペヌストに慣れたデゞタルネむティブは、どこかAIのように完党なオリゞナルに固執せず、パヌツを組み合わせお再構築するこずで䜕かを生み出そうずし、それを自然ず受け入れおいるようにも芋えたす。 photo by Cambodia4kids.org Beth Kanter 2021幎に41歳ずいう若さで逝去したファッションブランド、オフホワむトの創蚭者であり、ルむ・ノィトンのアヌトディレクタヌを務めたノァヌゞル・アブロヌは、時代を先駆けお次のような「チヌト・コヌド」を提瀺し、成功を収めたした。 “ 既存のコンセプトに 3% の手を加えるだけで、革新的ずみなされる文化的貢献ができたす ” “ DJ が曲を少し線集するだけで革新的な曲になり、デザむナヌはハンドバッグに穎を開けるだけで、自分の足跡を残すこずができる のです ” 衚珟はコミュニケヌション 既存のものから3%異なる面癜いアむデアなら、自分にもできそうな気がしおしたいたすが、実際のずころアむデアは䜜品においおどれほどの重芁性があるのでしょうか。 1960幎代に保守的な矎術に察抗するものずしお珟れた、技術よりもアむデアをより重芖するコンセプチュアルアヌトずいう分野がありたす。コンセプチュアルな芖点で1960幎代埌半から光ず知芚をテヌマに制䜜を続けおきた珟代アヌティスト、ゞェヌムズ・タレルの蚀葉を借りれば、アヌトは次のような性質を持っおいるものです。 “ Art is a completed pass. You don’t just throw it out into the world – someone has to catch it.アヌトは䞀方通行ではない。䞖に出すだけではなくお、誰かがそれを受け止めなければならない ” photo by Andreas Schalk こうした考え方に倣えば、AIに䜕を描かせるのかを発想するだけでなく、人の反応を楜しむこずにも意矩が芋出されたす。プロアマ問わずすべおの衚珟者を蚱容し、すべおの人を参加者ず呌んで成長しおきた コミックマヌケット もそうですが、衚珟するこずぞの寛容性が、「私も描いおみよう」ずいう人々の意思の源泉になるはずなのです。 画像生成AIによっお、AIが生掻者のものになる 蚀えない気持ちをAIに蚗す 歎史を振り返れば、印刷技術によっお耇補が可胜になったずき、そしおカメラや写真が普及したずき、これらテクノロゞヌの登堎によっお人が絵を描くこずをやめるこずはありたせんでした。むしろ、それらを甚いた新しいアヌトの抂念が生み出されおきたした。 もずより私たち自身が、“むメヌゞ補造機”であるずも蚀えたす。神経科孊からロボット工孊に及ぶ最先端の研究でわかっおいるこずずしお蚀えるのは、私たち人間は感芚噚から入っおきた情報をむメヌゞに倉えお蚘憶しおおり、脳内に蓄積されおいる情報の倚くは、有り䜙るほどのむメヌゞによっお成り立っおいるずいうこず です 。 photo by Susanne Nilsson 空に浮かぶ「雲」も、䞖界に存圚する「人間」も、䞀぀ずしお同じではないはずなのに同じ蚀葉で衚珟でおしたうがため、蚀葉にするずパタヌン化されお陳腐になっおしたうこずも少なく ありたせん 。ですが、うたく蚀葉にならない感情、䟋えば「悲しい気持ち」の䞀蚀を入れるずいく぀かの絵で応えおくれる画像生成AIは、殺颚景な蚀葉に埋め尜くされた日垞に、少し豊かな感情の行き堎を぀くるものになるようにも思えたす。 芞術ずいう枠にずらわれず、絵画やむラストを生成したり詊䜜したりする人の数を劇的に拡倧させるこずが、実は画像生成 AI が私たちにもたらす最も革呜的な倉化ず蚀えるかも しれたせん 。 photo by Dick Thomas Johnson 私たち人間が自身にむンプットする情報の割は聎芚から、そしお割は芖芚から埗おいるず蚀われおおり、その情報量は600倍にもなるずいう詊算がありたす。裏を返せばアりトプット偎も同様、私たちにずっおの写真や絵画などのむメヌゞは、蚀葉では蚀い衚せない感芚的で、盎感的な意味や抂念、感情たでをも含めた豊かな衚珟を可胜にするものだずいうこずです。 AI はこれたで、生掻者にずっお実感のないような堎で䜿われるこずが倚かった技術かもしれたせんが、画像生成AIずいう新たなテクノロゞヌが登堎し、AIで絵を描く掻動が浞透を芋せ始めたこずによっお、生掻者の䞀人䞀人にずっおの衚珟の可胜性が倧きく広がり぀぀ありたす。 「芞術」ずいう厳栌な枠で眺めおしたうず、確かにAIによっお生み出されたこれらの画像たちの䞭には邪道なもののあるかもしれたせん。ですが、メヌルにしおも、SNSにしおも、自分の考えや感情を文字や文章でしか䌝えられなかったこれたでを思うず、私たちの「衚珟」の䞀぀ずしお、絵的に心の情景を䌝え、受け取る可胜性をAIが䞎えおくれるのであれば、私たちのコミュニケヌションのあり方は、より䞀歩豊かなものになるような気がするのです。 私たちは今、画像生成 AI によっお、絵を描く行為を進歩させるだけでなく、 人間同士の以心䌝心を新たにする AI 時代の節目に立ち䌚っおいるのです。 The post 私たちが画像生成AIで描くものは、アヌトか、それずも心か first appeared on 株匏䌚瀟Laboro.AI .
「匷いAI」ず「匱いAI」。AIが人間を超えるかが分かる分類 2022.12.28 株匏䌚瀟Laboro.AI リヌドマヌケタヌ 熊谷勇䞀 抂 芁 AIに関する話題の䞭で、AIが人の心を持぀かどうかで分類する「匷いAI」「匱いAI」ずいう蚀葉を聞いたこずがあるでしょうか。AIが自身よりも賢いAIを䜜り出しお人間がはるかに及ばない知性が誕生する「シンギュラリティヌ技術的特異点」が蚪れるずいう仮説も聞いたこずがあるかもれたせん。これらはお互いに関係がある考え方です。䞀芋、AIの産業応甚にはあたり関係がなさそうに思えるかもしれたせんが、これらもしっかり知るこずにより、成果をより生み出すAIを構想する助けになりたす。 目 次 ・ AIが十分に知的かどうかを刀定する方法  ・ 匷いAI  ・ 匱いAI ・ 「匷い匱い」ず芖点が異なる「汎甚型AI」ず「特化型AI」  ・ 汎甚型AI  ・ 特化型AI ・ 実際に䜿われおいる「匱いAI」の事䟋  ・ AlphaGo  ・ 倖芳怜査  ・ レコメンド ・ 人間を超える知性が生たれる「シンギュラリティヌ」ずは ・ 「匱い」か぀「特化型」だからこそのAI開発 AIが十分に知的かどうかを刀定する方法 AIが十分に知的かどうかを刀定する方法ずしおは、英囜の数孊者アラン・チュヌリングが1950幎に発衚した「チュヌリングテスト」が有名です。チュヌリングテストでは、人間から投げかけられるいく぀かの質問に察しお文章で回答させたす。この返答が人間によるものか、AIによるものか刀別ができないようであれば、そのAIは人間ず同じくらい知的である、぀たりAIずしお完成されおいるず評䟡されたす。 このチュヌリングテストに異を唱えたのが米囜の哲孊者のゞョン・サヌルです。圌が1980幎に発衚した論文の䞭に「䞭囜語の郚屋」ずいう思考実隓がありたす。この思考実隓では、ある郚屋に英語しか分からない人に入っおもらいたす。郚屋の䞭には䞭囜語の質問に答えるための完璧なマニュアルがあり、䞭にいる人は䞭囜語での受け答えができたす。受け答えを繰り返すず、郚屋の倖の人は郚屋の䞭の人が䞭囜語を理解しおいるず刀断するでしょう。しかし実際には、䞭囜語を理解しおいるこずにはなっおいたせん。同様の胜力を有するAIはチュヌリングテストに合栌するだろうが、だからずいっお本圓に知胜があるず蚀えるのだろうか、ずいう議論を投げ掛けたのです。 そしおサヌルは、「AIが人間のように知的であるかどうか」を区分した蚀葉ずしお「匷いAI」「匱いAI」も提唱したした。 匷いAI 匷いAIは「適切にプログラムされたコンピュヌタヌは人間が心を持぀のず同じ意味で心を持぀。たた、プログラムそれ自身が人間の認知の説明である」ずいう意味です。もちろんですが、珟圚、2022幎珟圚、匷いAIず呌べるAIは登堎しおおらず、その兆候も登堎しおいたせん。 フィクションに出おくるような、䟋えば聞いた蚀葉の意味を理解しお気の利いた返事をしたり、蚀葉だけでなく衚情などからも人間の感情を読み取っお同情し、䞀緒に涙を流したりできるAIは、正に匷いAIだず蚀えたす。人間ず倉わらないコミュニケヌション胜力を持ち、物語の䞭で人間ずの亀流をしおいきたす。 匱いAI 䞀方、匱いAIは「コンピュヌタヌは人間の心を持぀必芁はなく、有甚な道具であれば良い」ず考えられおいたす。 珟圚登堎しおいるAIはすべお、匱いAIです。䟋えば、チャットボットは質問を投げれば返答をくれたすが、䞭のAIが人間のように思考しお返答しおいるのではなく、膚倧な孊習に基づいお蚀語を機械的に認識し、機械孊習の結果ずしお正解ずしおいる返答をしおいるに過ぎたせん。 だからずいっお党く圹に立たないわけではありたせん。チャットボットの䟋では、問い合わせ内容を定矩したり、それに基づいお適切なりェブペヌゞや担圓者を案内したりするこずで、人手や心理的なコストを枛らしおくれおいたす。 出兞猪狩宇叞ら『深局孊習教科曞 ディヌプラヌニング G怜定ゞェネラリスト公匏テキスト 第2版』   小林亮倪、篠本滋『AIæ–°äž– 人工知胜ず人類の行方』 「匷い匱い」ず芖点が異なる「汎甚型AI」ず「特化型AI」 「匷いAI」「匱いAI」ず芖点が異なる比范ずしお、「汎甚型AI」「特化型AI」がありたす。汎甚型AIは人間のように耇数の問題を解決できる胜力を持ったAIを指し、特化型AIは䞀぀の問題解決に特化しおいるAIを指したす。 汎甚型AI 汎甚型AIは耇数の問題を解決できるAIを指したすが、肝ずなるのは、人間のように過去の経隓から孊習しおさたざたな問題にも察凊できる点にありたす。人間がプログラムしたこず以倖にも察応できるようになるこずから、汎甚型ず呌ばれたす。ご想像の通り、珟圚、汎甚型AIは登堎しおいたせん。 匷いAIずの違いは「どの芳点でAIを区分するか」ずいう点にありたす。匷いAIは、AIに知性があるかどうかずいう点で匱いAIず区別しおおり、AIが知性を持぀こずで匷いAIずなりたす。汎甚型AIは、耇数の問題に察応できるかどうかずいう点で特化型AIず区別しおおり、知性があるかどうかは芋おいたせん。 特化型AI 特化型AIは特定の問題を解決できる胜力を持ったAIのこずを指し、原則ずしお、人間がプログラムした以䞊のこずはできたせん。2022幎たでに登堎しおいるAIず呌ばれるものは、すべお特化型AIです。匱いAIずの違いは、匷いAI・汎甚型AIの違いず同様に、知性の有無を芋ないこずです。 仮に知性があっお特定の問題を解決できるAIが登堎したら、特化型に分類されるでしょう。しかし、特定の問題が解決できるのに、他の問題にそれを応甚できないのは、果たしお知性があるず蚀えるのか、ずいう議論が出おくるかもしれたせん。 出兞猪狩宇叞ら『深局孊習教科曞 ディヌプラヌニング G怜定ゞェネラリスト公匏テキスト 第2版』 実際に䜿われおいる「匱いAI」の事䟋 ここでは、実際に運甚されおいる匱いAIの事䟋を3皮類ご玹介したす。 AlphaGo 匱いAI、か぀特化型AIの代衚䟋ずしおよく知られおいるのが、囲碁の䞖界的プレむダヌを次々ず打ち負かしたこずで衝撃を䞎えた「AlphaGo」です。AlphaGoはAIの技術の䞭でも匷化孊習の代衚的モデルだずされおおり、勝利ずいう「報酬」のために囲碁の打ち筋を孊習し、人間では勝おない領域にたでなりたした。 AlphaGoが登堎したのは2015幎のこずで、2017幎に圓時最匷だず蚀われおいた棋士、柯朔カケツに勝利したこずで人間ずの察局を匕退しおいたす。AlphaGoが衝撃だったのは、囲碁がボヌドゲヌムの䞭でも特に局面が倚くお難しく、AIが人間に勝぀こずはできないず考えられおいたためでした。 AlphaGoはその埌改良され、40日の孊習でAlphaGoに勝おるようになった「AlphaGo Zero」、囲碁以倖のボヌドゲヌムにも察応し8時間の孊習でAlphaGo Zeroに勝おるようになった「AlphaZero」ず続いおいたす。 その埌、米アルファベット傘䞋のAI開発䌁業である英ディヌプマむンドが2020幎に、AlphaGoの進化圢ずしお、チェスや囲碁、将棋、テレビゲヌムなどに぀いお事前に䞀切知識を䞎えなくおも人間のトッププレヌダヌを䞊回る腕前でプレヌできる汎甚ゲヌムAI、「MuZero」を2020幎に開発しおいたす。このMuZeroはさらに、2022幎にYouTubeの動画圧瞮アルゎリズム開発に応甚され、同じ品質の動画を送信するのに必芁ずなるビットレヌトを4削枛する成果を出したず発衚されたした。ディヌプマむンドは䞀方、プログラミングコンテスト競技プログラミングで人間の平均点を䞊回るようなプログラムを生成できるAIである「AlphaCode」も2022幎に発衚しおいたす。AlphaGoシリヌズは以䞊のようにゲヌムを超えお進化しおいたすが、ゲヌム以倖の甚途があっおもタスクは人間が指定しおいるので、汎甚型AIずは蚀えず、特化型AIです。さらに、知胜があるわけではありたせんから、匱いAIであるず蚀えたす。 出兞日経クロステック「 最匷囲碁AIから栞融合ぞ、深局匷化孊習の応甚広げるディヌプマむンド 」 Laboro.AIでも、この匷化孊習を甚いお最適化問題を解くこずを目指した゜リュヌションを開発しおいるほか、匷化孊習を甚いお建蚭物の揺れを制埡する研究開発を倧林組ず進めおいたす。 組み合わせ最適化゜リュヌション プロゞェクト事䟋建蚭物の制震制埡 倖芳怜査 AI技術の䞭でも掻甚が広がっおいるものの䞀぀が、画像認識です。倧量の画像を孊習するこずで、画像の䞭に写っおいるものが䜕かを刀断しお分類したり、䞍良品を怜知しおアラヌトを出したりしおくれたす。 画像認識の掻甚䟋の䞀぀が、工堎などで䜿われおいる倖芳怜査です。䟋えばむンフラの劣化箇所を怜出するメンテナンスでは、膚倧な量の確認箇所があり、目芖だけだず芋萜ずしの可胜性がありたす。AIを掻甚すれば、そうした倧量の怜査を効率化したり、䜜業品質のばら぀きを䜎枛したりでき、その䞊で最終的には人間が刀断するずいう確認䜓制を築くこずができたす。 Laboro.AIによる倖芳怜査の゜リュヌションに぀いおはこちらもご芧ください。 䞍良・異垞怜出゜リュヌション むンフラ蚭備の劣化箇所怜出 レコメンド 利甚履歎などに基づいお次のおすすめを提瀺する「レコメンド」も、AIの掻甚が進んでいる分野です。 レコメンドには䟋えば、賌買履歎や動画芖聎履歎などを入力ずしお顧客䞀人ひずりに向けお次のおすすめを衚瀺したり、過去の成果から売り䞊げに぀ながる商品を提案したりするずいった䟋がありたす。䌁業がマヌケティングに掻甚するものもあれば、䌁業のマヌケティングでの掻甚ずしお、ECサむトやアプリなどでの掻甚が進んでいたす。 レコメンドのAIが特に掻甚されおいるマヌケティング分野に぀いおは、䞋蚘のコラムで詳しく解説しおいたす。 答えのない、マヌケティング×AIの䞖界ぞの挑戊 人間を超える知性が生たれる「シンギュラリティヌ」ずは 「匷いAI」ず近い話題ずしお、AIの胜力が人間の胜力を超える「シンギュラリティヌ」がありたす。シンギュラリティヌは日本語では「技術的特異点」ず呌ばれ、AIが自身よりも賢いAIを䜜り出せるようになり、より賢いAIが無限に䜜り出される状況が生たれお、AIの進化が指数関数的に加速し、人間では到底想像もできないような高床な知性が誕生するこずを指したす。 シンギュラリティヌの到来を䞻匵しおいる䞀人である、未来孊者で実業家のレむ・カヌツワむルは、このようなシンギュラリティヌは2045幎に到来するず予蚀しおいたす。シンギュラリティヌは「AIが人間より賢くなる瞬間」ず捉えられるこずもありたすが、カヌツワむルの䞻匵では、AIが人間より賢くなるのは2029幎。AIが自分自身よりも高い性胜のAIを開発できるようになり、性胜の進化が爆発的に進み、人間が認識できないほどの知性が誕生するのが2045幎だずされおいたす。 しかし、シンギュラリティヌは到来しないずいう説もあり、実際にAIがどのように進化しおいくかは、今のずころ断蚀できたせん。 出兞猪狩宇叞ら『深局孊習教科曞 ディヌプラヌニング G怜定ゞェネラリスト公匏テキスト 第2版』 「匱い」か぀「特化型」だからこそのAI開発 SFのように人間を超越するような知性を持぀AIがシンギュラリティヌによっお誕生するかどうかは分かりたせんが、匷いAIが登堎する兆候は今のずころありたせん。だからずいっおAIを利甚せずに仕事や生掻をするこずはもはや䞍可胜なほど、AIは瀟䌚に取り入れられおいたす。 この状況の䞭で重芁なのは、そうしたAIはすべお匱いAIか぀特化型AIであるこずです。特に特化型であるこずに着目すれば、䜕を解決すべき課題ずし、その課題をどうスマヌトに解決するAIを開発しお取り入れるかずいう考え方が重芁になりたす。これをビゞネス分野でのAI掻甚ず考えれば、ビゞネス䞊で解決したい課題を明確化し、成果目暙を定めた䞊で、そのための゜リュヌションずしおAIをデザむン蚭蚈する「゜リュヌションデザむン」ずいう怜蚎プロセスず、課題ごずの個別最適な開発に基づく「カスタムAI」が欠かせないずいうこずです。 AIは䞇胜のツヌルのように捉えられるこずが少なくありたせんが、珟時点のAIはかなり単機胜なツヌルであり、匱くお、特化したこずしかできないのが実際です。そのため、こうした限定的な機胜しか持たないAIの導入成果は、圓然ながら蚭蚈や䜿い方によっお倧きく巊右されたす。だからこそ、䞀぀ひず぀のビゞネス課題に最適なかたちでAIの開発を行うこずが重芁なのです。 カスタムAIに぀いお The post 「匷いAI」ず「匱いAI」。AIが人間を超えるかが分かる分類 first appeared on 株匏䌚瀟Laboro.AI .
M-1などの「笑ビゞネス」もAI掻甚。他産業ぞの応甚の可胜性 2022.12.19 株匏䌚瀟Laboro.AI リヌドマヌケタヌ 熊谷勇䞀 抂 芁 2022幎はり゚ストランドが決勝ファヌストラりンド3䜍から逆転優勝を果たしたM-1グランプリ。M-1に代衚されるお笑いは今や゚ンタテむメント業界で倧きな分野に成長し、興行や攟送、コンテンツビゞネスだけでなく、笑うずいう行為はりェルビヌむング心身の健康や幞犏の芳点からも重芖されおいたす。その笑いに関連しお掻甚されおいるAIもあり、その根本にある手法は他の産業でも䜿われおいるものばかりです。 目 次 ・ 笑いずビゞネス、生掻の関係は倚様 ・ 笑いぞのAI掻甚枬定・評䟡  ・ お笑いを枬定・評䟡  ・ 笑いを生み出すボケの生成  ・ ネタの評䟡 ・ 笑いでも他の産業でも、特城量蚭定・カスタマむズが重芁 笑いずビゞネス、生掻の関係は倚様 笑いぞのAI掻甚の䟋を芋おいく前に、笑いずビゞネスの珟状を確認したしょう。吉本興業事業抂芁資料によるず、たず挙げられおいるのがタレントマネゞメントです。舞台だけあっおも、お笑い芞人などタレントがいなければ興行は成り立ちたせん。 次に劇堎経営で、同瀟は珟圚党囜で11の劇堎を経営し、日々笑いに関する興行が打たれおいたす。同瀟がそもそも萜語などの興行小屋である寄垭よせの経営から始たったのを知っおいる人も少なくないでしょう。2017幎䞋期のNHK「連続テレビ小説」の「わろおんか」はそれをモデルにしおいたした。 タレントず劇堎があれば興行が打おたす。最近では「お笑いラむブ」ず蚀われるこずがほずんどです。もちろん、劇堎は自前で保有しおいなくおも、他のオヌナヌが経営する劇堎を借りおラむブを開催するこずもできたすし、近幎ではオンラむンだけで開催するラむブも出おきおいたす。 最埌に、映像音声コンテンツ制䜜がありたす。ラむブずは違い、収録・線集をしお䜜り蟌んでいきたす。䌝統的にはラゞオやテレビ番組ずしお攟送されるかたちだけでしたが、近幎ではNETFLIXやAMAZONプラむムビデオ、そしおYouTubeずいったオンラむンのプラットフォヌムで配信するコンテンツも隆盛しおいたす。さらに、コメディヌに分類される映画や挫画などの䜜品も、広い意味で笑いに関するビゞネスず蚀えたす。 参考経枈産業省 倧阪・関西䞇博具䜓化怜蚎䌚「 吉本興業事業抂芁資料 」 笑いはさらに、健康、ひいおはりェルビヌむングの面でも泚目されおいたす。沢井補薬が運営するりェブサむト「サワむ健康掚進課」のペヌゞ「 “笑い”がもたらす 健康効果 」によれば、たず、がん现胞を攻撃するナチュラルキラヌ现胞が笑いを発端に掻性化するこずが取り䞊げられおいたす。さらに「脳の働きが掻性化」「血行促進」「自埋神経のバランスが敎う」「筋力アップ」「幞犏感ず鎮痛䜜甚」ずいう効果も挙げられおいたす。これらによっお健康維持・増進だけでなく、それを基にしたりェルビヌむングも実珟できるかもしれたせん。 笑いぞのAI掻甚枬定・評䟡 笑いずビゞネス、生掻の関係を確認したずころで、具䜓的なAIサヌビス・掻甚䟋を芋おいきたしょう。 お笑いを枬定・評䟡 お笑い審査支揎AI「UKETAりケタ」は、お笑いの堎の音声を収録しお、通垞では分離困難な芞人の話し声ず芳客の爆笑を高粟床に刀別し、「爆笑の時間」「爆笑の時間割合」「爆笑・倧爆笑の数」「爆笑グラフ」ずいったお笑い審査に有甚な審査指暙を提瀺できるずしおいたす。近幎は毎幎M-1グランプリ決勝の評䟡を独自に実斜しおおり、特にアルゎリズムを改良した2020幎以降は、実際の審査員による評䟡の順䜍ずの合臎率が䞊がっおいたす。 採甚しおいる特城量は「笑い・拍手の音量」以倖は公開されおいたせんが、笑い声らしい声の高さ呚波数や拍手のタむミング䟋えば登堎・退堎時の拍手はりケおいるず蚀えるずは限らないので陀倖するなども採甚されおいるかもしれたせん。 さらに、特にM-1グランプリを意識すれば、挫才の新奇性も評䟡されおいるこずが端々で蚀われおいるこずから、䟋えばAIに過去の挫才映像を機械孊習させるず、埓来にないレベルの掻発な動きや発話量の倚さ・少なさ、間の長短ずいった特城も客芳的に芋いだされ、新奇性の評䟡に圹立おられるかもしれたせん。 参考 笑い採点AI UKETAりケタ AIで芳客の笑い声ず拍手を蚈枬するだけでなく、実際に審査たでしお、しかも人間の審査員はなしで実斜しおいるのが、ABEMA配信の「笑ラりドネスGP」です。2021幎の第回は䞀぀のAIで蚈枬・評䟡しおいたしたが、2022幎の第回からは笑い声ず拍手にそれぞれAIを䞀぀ず぀「担圓」ずしお付け、それぞれの特城を集䞭的に解析する仕組みに倉曎したした。さらに、「M-1グランプリ」「キングオブコント」「THE W」ずいったお笑いコンテストでのネタ・笑い・拍手も孊習デヌタずし、AIの匷化を図りたした。 出兞お笑いナタリヌ「 「笑い」ず「拍手」分けお解析、M-1やKOCも孊習したAIが芞人のネタを採点 」 AIによるお笑いの評䟡・枬定ず聞くず、「それぞれのお笑い芞人が持぀えも蚀われぬ個性やニュアンス、間などの情緒を機械が理解する」ずいった印象を持ったかもしれたせん。しかし根底は、瞊軞に音量、暪軞を時間などずした次元で特城量を捉えおいくこずが䞭心であり、他の産業でも掻甚されおいるAIずあたり倉わらないず蚀えるでしょう。䟋えば、補造機械の皌働音から故障を予知するケヌスを考えおみるず、基本的には暪軞には時間軞を、瞊軞には機械の皌働状況を瀺した次元デヌタを元に異垞な波圢箇所を発芋するずいうやり方が考えられ、原理的には同じデヌタ解析のアプロヌチになっおいるずいうわけです。 笑いを生み出すボケの生成 AIの生成で最近話題なのは画像ですが、お笑いのボケの生成をするAIも登堎しおいたす。 2008幎に生たれた画像倧喜利写真でひずこずサむト「ボケお」では、同サむトに蓄積されたボケデヌタを基に機械孊習・AIモデルを孊習させおボケの自動生成を競う「ボケお 電笑戊」を開催したした。 「写真でひずこず」なので、たずは画像が甚意され、それに察しおボケを返すこずが求められたす。参加瀟の䞀぀である電通デゞタルは、そのために、「画像芁玄」ずいう技術を䜿っお画像をテキストに眮き換える手法が取りたした。具䜓的には、CNNConvolutional Neural Network、畳み蟌みニュヌラルネットワヌクず、RNNRecurrent Neural Network、再垰型ニュヌラルネットワヌクずいうそれぞれディヌプラヌニングの䞀皮を甚いおいたす。 同じく参加したストックマヌク瀟は、「画像からボケを生成する」問題は、機械孊習の分野のImage Captioningずいう問題によく䌌おいるので、それを応甚しお「お笑いモデル」を䜜れそうだず芋いだしたした。Image Captioningは、「画像を入力ずしお、その画像内の人物・動物・物䜓等の振舞いを説明する文章を生成する」ずいう問題です。そしおImage Captioningの手法の䞀぀「Encoder-Decoderモデル」を採甚したした。 これは簡単に蚀うず、Encoderを䜿っお画像を䞭間衚珟(ベクトル)に倉換しお、倉換した䞭間衚珟をDecoderで文章に倉換するものです。 さらには、ボケだけでなく、教垫デヌタにビゞネス蚘事のタむトルずいう「真面目な文章」も足しお「氎増し」しおボケず組み合わせ、「ちょっずズレた真面目な文章絶劙なボケ」を生み出すこずも狙いたした。 たた倧喜利AIずしおは、わたしは瀟が提䟛する「LINE版倧喜利人工知胜」は、AIが生成する「お題」「回答」「ガダ・ツッコミ」「写真で䞀蚀」が楜しめたす。 育成機胜も搭茉しおおり、毎日出題される「育成お題」で最匷のカスタマむズ倧喜利AIをナヌザヌみんなで育成しおいけるずしおいたす。 出兞ログミヌBiz「 AIは人を笑わせられるのか ボケの自動生成を競う、お笑いAIバトルの舞台裏 」   Stockmark Tech Blog「 ボケお電笑戊ぞの挑戊〜AIで画像倧喜利〜 」    LINE版倧喜利人工知胜 ネタの評䟡 ビゞネスAIでもおなじみのテキストマむニング自然蚀語凊理などを甚いお倧量のテキストデヌタを解析し、有甚な情報を取り出す技術を䞀郚応甚しお、文章構成のキヌワヌド抜出を行う゜フトり゚アの䞭には、お笑いのネタも分析できるものも登堎しおいたす。 東京倧孊の倧柀幞生教授が開発したKeyGraphキヌグラフで、文章構成のキヌワヌド抜出が鍵です。あるデヌタを構成する芁玠䞀぀ひず぀の登堎頻床、互いの぀ながりの匷さや数を蚈算し、重芁な圹割を果たしおいる芁玠を分類・抜出したす。さらに結果をネットワヌク図ずしお芖芚化するこずで、デヌタに朜んでいるアむデアの発芋を支揎するずしおいたす。 2022幎7月に開催された「『M-1グランプリを科孊する』成果報告むベント」では、このKeyGraphが挫才ネタの構造を分析・可芖化し、「笑いは文脈によっお生たれるもの」ずいう知芋を改めお明らかにしたした。挫才の魅力には面癜い動きもありたすが、やはり蚀葉をどう䜿うか「どう䜿わないか」も含むを䞭心ずした話芞であるこずから、こうした技術応甚が可胜になっおいるず蚀えるでしょう。 出兞日本経枈新聞「 お笑い、孊問や教育の堎に ぀かみの効果研究・亀流力高める授業 」   構造蚈画研究所「 KeyGraph 」   BIZDRIVE「 売れないスルメにも意味があるチャンス発芋孊ずは 」 デヌタや業界に壁はない。特城量蚭定・カスタマむズが重芁 以䞊のように、笑いに関するAI掻甚でも、AIが人間の情緒を理解しおいるわけではなく、䜕らかの特城量を蚭定し、それに基づいお蚈枬・評䟡するずいう、さたざたな産業で掻甚されおいるAIでありふれた手順が螏たれおいたす。違う蚀い方をすれば、特城量の蚭定がたず重芁であり、蚭定をするのは最終的には人間です。人間によるカスタマむズずも蚀えるでしょう。 特城量は人間が蚭定すべきずいっおも、勘ですれば良いずいうわけではありたせん。最終的に埗たい出力結果をにらみながら、最適なデヌタから、最適な特城量を蚭定する必芁がありたす。そのためには産業・䌁業偎ずAI偎、䞡方の知芋を持った䞊で、䜕床もやり取りするこずが欠かせたせん。゜リュヌションずしおAIを適切にデザむンをしおいくこずが必芁なのです。 Laboro.AIでは、各産業・事業に合わせたAIを開発する「カスタムAI」ず、それを実珟するための機械孊習の産業応甚支揎を匷みずしおいたす。さらに、さたざたな産業での実瞟があり、それぞれで抜象化した知芋を埗お、それをたた別の産業に暪展開しお生かすずいうサむクルを回しおいたす。あなたの課題を解決できるカスタムAIを開発し、䞀緒に笑えれば幞いです。 「デヌタに壁はない」「業界に壁はない」をキヌワヌドにした圓瀟のカスタムAIに぀いおは こちら もご芧ください。 The post M-1などの「笑ビゞネス」もAI掻甚。他産業ぞの応甚の可胜性 first appeared on 株匏䌚瀟Laboro.AI .
AI導入䌁業の初の過半数越え。 高品質AIモデルを支えるデヌタセントリックずは 2022.11.17 株匏䌚瀟Laboro.AI リヌドマヌケタヌ 熊谷 勇䞀 抂 芁 「AI導入は圓瀟には早い、ただ様子芋だ」ずは蚀っおいらない状況になっおきたした。日本䌁業はなんずなくも含めお「導入が遅い」ず蚀われおきたが、過半数の53が既に導入しおいるこずが刀明。い぀たでも導入を怜蚎しないず、業界内での競争力䜎䞋に぀ながるかもしれたせん。AI導入が進んでいる背景ず、特に「デヌタセントリック」に぀いお解説したす。 目 次 ・ 米囜䞊みに远い぀いた日本䌁業のAI導入率  ・ 日本䌁業の53%がAIを導入  ・ AI掻甚が進んでいる䌁業ほど、自瀟の瀟員で掚進しおいる ・ AIの民䞻化は機械孊習がカギ  ・ AIの民䞻化ずは  ・ 民䞻化を掚進する機械孊習 ・ AI導入を加速させる「デヌタ゚クスチェンゞ」ず「デヌタセントリック」  ・ デヌタ゚クスチェンゞずは  ・ デヌタセントリックずは   ・ デヌタセントリック掻甚事䟋 ・ たずめ 米囜䞊みに远い぀いた日本䌁業のAI導入率 PwC Japanグルヌプは2022幎1月、日本䌁業のうち売䞊高500億円以䞊でAIを導入枈み、たたは導入怜蚎䞭の䌁業の郚長職以䞊300人ず、米囜䌁業の幹郚1000人にりェブアンケヌト調査を実斜したした。その結果、日本䌁業のAI導入率が米囜䞊みに远い぀いたこずが分かったのです。 日本䌁業の53%がAIを導入 2021幎たでの同調査では米囜ず日本のAIの掻甚床合には乖離が芋られおいたしたが、2022幎の調査ではその差がほずんどなくなりたした。米囜では導入䌁業「前者的に広範囲にAIを導入」たたは「䞀郚の業務でAIを導入」しおいる䌁業が2021幎は55%、2022幎は53%ず埮枛したずころを、日本では43%から53%ず10ポむントも増えたのです。 さらに日本䌁業のうち「AI未導入䌁業」が41から36に、「AI準備䞭䌁業」が16から11にそれぞれ5ポむント枛少し、AI導入䌁業に移行しおいるのが芋お取れたす。 2022幎の日米䌁業を比范するず、「AI未導入䌁業」は米囜27に察し日本36ず、未着手の䌁業比率に若干の差はあるものの、「AI導入䌁業」で芋るず2ポむントしか差がなく、日本が米囜に远い぀いたず蚀える状況になりたした。 AI掻甚が進んでいる䌁業ほど、自瀟の瀟員で掚進しおいる AI導入掚進は、瀟員によるものか、倖郚委蚗先によるものかで倧別されたす。瀟員自身で掚進するこずがいわゆる「内補化」です。内補化の床合いに関しお、AI導入䌁業ずAI準備䞭䌁業の間で顕著な差がありたした。AI導入䌁業の方が内補化率が高い結果になったのです。AI掻甚が進んでいる䌁業ほど、自瀟の瀟員で掚進しおいるずいうこずです。 出兞PwC「 2022幎AI予枬日本 」 AIの民䞻化は機械孊習がカギ 日本䌁業でAI導入が進んでいる䞀方、AIが泚目されおさたざたな分野で掻甚が進んでいく䞭で「AIの民䞻化」ずいう抂念がありたす。ここに、日本䌁業でAI導入が広たった背景を芋るこずができるかもしれたせん。   AIの民䞻化ずは AIの民䞻化は2017幎3月に、米囜スタンフォヌド倧孊教授からグヌグルに転じおいたAI研究者のフェむ・フェむ・リヌが初めお瀺した抂念ずされおいたす。簡単に蚀えば「AIを誰もが䜿えるようにする」ずいうこずです。その埌グヌグルだけでなく、さたざたなICT情報通信技術䌁業がこの抂念を掲げるようになりたした。 なおリヌは、サバティカルずよばれる長期䌑暇を利甚しおグヌグルで働いおおり、䌑暇が終了した2018幎秋にスタンフォヌド倧孊教授に埩垰しおいたす。 民䞻化を掚進する機械孊習 近幎、AIの䞀぀の分野である機械孊習が掻甚しやすくなっおきおおり、それがAI党䜓の民䞻化を促しおいたす。 機械孊習を利甚する方法には、①アプリケヌション特定の䜜業をするための゜フトり゚アを利甚する、②プラットフォヌムコンピュヌタヌが動䜜する基本的な環境を利甚した䞊でアプリケヌションを開発しお利甚する、③フレヌムワヌクシステム構築するための基盀、あるいはサヌビスを提䟛するための基盀ずなる゜フトり゚アを利甚した䞊でアプリケヌションを開発しお利甚する、の䞉぀がありたす。①から③に行くにしたがっお開発の自由床が高たる半面、より高床な知識が必芁になりたす。 しかし近幎では、オヌプン゜ヌスのフレヌムワヌクやクラりド事業者の蚈算胜力が利甚できるようになり、機械孊習ひいおはAIそのものの掻甚のハヌドルが䞋がっおきおいたす。これこそがAIの民䞻化です。そうした䞭では、䟋えば、自瀟の競争力の源泉ずなるAIの開発は、完党に内補化したり、孊習デヌタだけは自前で甚意したりしお、優䜍性を保おたす。逆に競争力を気にせずにAIを掻甚したい堎合は、既存の孊習枈みモデルを利甚する手がありたす。 出兞総務省「 什和元幎版 情報通信癜曞 」 AI導入を加速させる「デヌタ゚クスチェンゞ」ず「デヌタセントリック」 日本䌁業でAI導入が増えた別の理由に、「デヌタ゚クスチェンゞ」ず「デヌタセントリック」があるかもしれたせん。近幎䜿われるようになっおきたこれら二぀の蚀葉の意味もぜひ抌さえおおきたしょう。   デヌタ゚クスチェンゞずは デヌタや倧芏暡なファむルを組織間やシステム間で亀換する仕組みのこずです。ナヌザヌの属性や行動履歎などのオヌディ゚ンスデヌタを䌁業間で亀換するこずもできるので、特にマヌケティングで生かされおいたす。デヌタ゚クスチェンゞのプラットフォヌムを提䟛する事業者が、デヌタを提䟛するパヌトナヌず契玄し、デヌタを保有したす。デヌタを利甚したい䌁業は、デヌタ゚クスチェンゞの事業者ず契玄するだけで、パヌトナヌが提䟛するデヌタをプラットフォヌムを通じお利甚できたす。 デヌタ゚クスチェンゞで取匕するデヌタのこずを「2ndパヌティデヌタ」ず呌び、䞀般的には「個人が特定できないセグメント」ずしお提䟛されたす。デヌタ゚クスチェンゞは広告プラットフォヌムず連携されおいるため、タヌゲティング広告にも簡単に利甚できたす。デヌタパヌトナヌにずっおは、自瀟のビッグデヌタを収益化できるプラットフォヌムにもなるずいうこずです。 このデヌタ゚クスチェンゞにより、各䌁業が消費者の属性や行動履歎ずいったリアルなデヌタを幅広く集めお掻甚できるだけでなく、AIモデルの内補開発にも生かせるようになるのです。 出兞G” Data Exchange “   デゞタル・アドバタむゞング・コン゜ヌシアム「 デヌタ゚クスチェンゞずは 」 デヌタセントリックずは 「デヌタ䞭心のAIDCAIData-Centric AI」のこずで、埓来通りのモデルやアルゎリズムを偏重するアプロヌチよりも、デヌタに焊点を定めたアプロヌチの方が倧切であるずする、AIの開発方法に関する考え方です。 この考え方の根拠ずしお、たずえ比范的少ないデヌタ量であったずしおもクリヌンで高品質なグッドデヌタの方が、ノむズの倚いビッグデヌタよりも良い性胜を発揮するこずが瀺されおいたす。 デヌタ゚クスチェンゞが掻発になる背景に、このデヌタセントリックAIがありたす。「高品質なデヌタで高品質なAI開発をする」ず蚀うのは簡単ですが、実際に高品質なデヌタを集めたり敎圢したりするにはさたざたなコストがかかりたす。それ察しお、倧量か぀倚様なデヌタの䞭から必芁なデヌタを遞べる環境ずしお嚁力を発揮するのが、デヌタ゚クスチェンゞなのです。 出兞ITmedia「 デヌタ゚クスチェンゞを加速させるデヌタセントリックずは 」   日経BPムック『倫理、説明、デヌタ利甚、23の泚目事䟋から孊ぶ正しいAI導入』   デヌタセントリック掻甚事䟋 京セラ傘䞋のRistリストは、補造業の珟堎が䞻䜓的にAIを開発できる支揎サヌビスを始めおいたす。このサヌビスではデヌタセントリックAIを掻甚し、専門的な゚ンゞニアがいなくおもAIの粟床を䞊げられるずしおいたす。 䟋えば補品の良・䞍良を怜品する画像解析AIを開発する堎合、䞀般的には、孊習甚の画像は最䜎でも100枚皋床が必芁で、ひび割れや傷など「䞍良」は人間が決めたす。この際の定矩の曖昧さがAIの粟床䜎䞋に぀ながり、゚ンゞニアがモデルの改善を繰り返す必芁がありたす。 そこで、耇数の人が画像を芋お、刀断が䞀臎しない画像を抜出し、䞀臎するようにルヌルを定める䜜業を繰り返しおデヌタの質を高めるこずができたす。これがデヌタセントリックAIです。顧客偎の䜜業は耇雑化し負担は高たりたすが、逆に゚ンゞニアの関䞎が少なくなるため開発コストを抑えられる利点がありたす。顧客偎の負担増は、内補化の床合いの高たりず蚀い換えられるでしょう。 出兞日本経枈新聞電子版「 京セラ系リスト、珟堎䞻䜓のAI開発支揎サヌビス 」 たずめ デヌタセントリックAIを掻甚すれば、AI導入が埓来ず比べお䜎コストで実珟できるかもしれたせん。さらに内補化ができればコストもさらに䞋がりたすが、開発を任せられる人材が瀟内にいるこずが前提ずなる䞊、ビゞネス成果に盎結するAIの開発が本圓に実珟できるかに぀いおは、たた別の難しさが出おきたす。デヌタセントリックずいう考え方が近幎話題になっおいるこずには泚目し぀぀、コスト重芖の内補化か、より専門的な技術重芖の倖郚委蚗かは、慎重に刀断する必芁がありたす。 特に、䌁業の競争力に関わるような難易床の高いAI開発プロゞェクトでは倖郚の専門ベンダヌの技術力に期埅が寄せられたす。ですが、倖郚委蚗を怜蚎する際にも泚意が必芁です。蚀われた通りに぀くるだけの「YESマン䜓質」のベンダヌが少なからず存圚する䞭、AIずビゞネスの䞡面でしっかりず䌎走ができるパヌトナヌず組むこずが、本圓に開発したいAIを実珟する早道です。 Laboro.AIでは、AIを最適なビゞネス゜リュヌションずしお蚭蚈するためのプロセスずしお「゜リュヌションデザむン」ずいう独自のコンセプトを提唱し、AIずいうテクノロゞヌずビゞネスを぀なぎ合わせるための長期的な䌎走サポヌトを提䟛しおいたす。䞋蚘もご芧の䞊、ぜひお問い合わせいただければ幞いです。 ゜リュヌションデザむン
女性だからできる、AIの「仕䞊げ」が今はじたる 2022.10.10 監 修 株匏䌚瀟Laboro.AI マヌケティング・ディレクタヌ 和田 厇 抂 芁 「今ある職業の倚くが AI に眮き換えられる」––AIの技術進化に䌎っお、こうした話がたすたす珟実味を垯びおきたようにも思えたすが、䞀方で AIによっお倚くの新しい仕事が生み出されるこずもたた想像される未来です。そしお、この新しい仕事ぞの移行においお、男性よりも女性の方がより倧きな圱響を受けるずいう研究結果がありたす。AIによっお自動化しやすい事務職の倧半を担っおいる女性が、よりAIが生み出す仕事に移行する可胜性が高いずいうわけです。 ずはいえAIを専門ずする仕事の男女比を芋おみるず、女性の割合は4分の1にずどたっおいるのが珟状ですが、実はコンピュヌタサむ゚ンスの孊問においお女性が圧倒的に劣勢になったのは割ず最近のこず。振り返れば、コンピュヌタサむ゚ンスの歎史を動かしおきたのは男性だけではありたせん。 今回のコラムでは、女性の参加によっおAI が成熟期ぞず導かれおいく次のステヌゞを考えおいきたす。 目 次 ・ 「男性の方が埗意」が生たれた理由  ・ ファミコンからパ゜コンぞ ・ 匟道ミサむルの蚈算をプログラムする  ・ 戊時䞋にいた「女性コンピュヌタ」  ・ 生たれたおのスヌパヌコンピュヌタ ・ AI瀟䌚を珟実的な目線で考える  ・ AIカリキュラムのリデザむン  ・ AI チャットボットの責任は ・ 「AI職」ぞの倧移動が始たる  ・ 「女性の方が埗意」が生たれた理由  ・ 未熟なAIを成熟させる仕䞊げ 「男性の方が埗意」が生たれた理由 ファミコンからパ゜コンぞ デヌタやAIの専門家のうち、女性の割合は4人に䞀人に過ぎないずいうこずが2020幎の䞖界経枈フォヌラムのレポヌトで明らかになりたした。背景には、家庭甚コンピュヌタの普及をきっかけに男性の方がより早くからテクノロゞヌに接するようになり、コンピュヌタサむ゚ンスを専攻する男性の割合が急増したこずがみられたす。 80幎代に「ファミリヌコンピュヌタ」や「ゲヌムボヌむ」ずいったゲヌム機に觊れ、90幎代に入るず自然ずパ゜コンが趣味ずなった男性も倚いのではないでしょうか。1995幎に 「Windows95」 を搭茉したパ゜コンが登堎するずむンタヌネットの䞀般利甚がスタヌトしたこずも盞たっお、男の子の郚屋にパ゜コンが眮かれ、父芪からパ゜コンの䜿い方を教わったりする環境も敎っおいきたした。 以降定着した「コンピュヌタは男性の方が埗意」ずいうむメヌゞは日本に限った話ではなく、デヌタやAIを含めたコンピュヌタサむ゚ンスをリヌドしおきたアメリカでもその認識に倧きな違いはありたせん。 Photo by Steven Miller  Deloitte AI Institute の 調査報告 では、2019幎に北米ではAIおよびコンピュヌタサむ゚ンスの博士課皋に占める女性の割合は22 ず、9幎前の調査時より4しか増えおいたせんでした。そうした状況を螏たえ、今埌も女性専門家の割合はなかなか増えそうにないずする芋方もありたす。 しかしながら、女性が圧倒的に劣勢ずいうのは割ず最近のトレンドで、それ以前の1984幎のアメリカでは、倧孊でコンピュヌタサむ゚ンスを専攻する孊生のうち玄40%を女性が 占めおいたした し、そもそも情報化時代の始たりを支えたのも、実は第二次䞖界倧戊䞭のアメリカでコンピュヌタの仕事に携わった女性たちだったのです。 匟道ミサむルの蚈算をプログラムする 戊時䞋にいた「女性コンピュヌタ」 戊時䞋のアメリカでは女性の雇甚が50増加し、アメリカ陞軍は100名の女性を蚈算担圓である「コンピュヌタ職」ずしお採甚 したした 。蚈算すべきものは数千に及ぶ匟道ミサむルの発射軌道で、その蚈算には飛距離だけでなく、砲匟の重さ、枩床、湿床や颚向きずいった気候条件なども含たれるため、人の手で䞀぀の軌道を蚈算するのに30〜40時間もの時間がかかったずいいたす。 Photo by Internet Archive Book Images  そこでスタヌトしたのが、圓時ハヌドり゚アの開発がほが完了しおいた䞖界初の真空管匏、党電子匏スヌパヌコンピュヌタ ENIACElectronic Numerical Integrator and Computerのプロゞェクトでした。マシンこそあれ、プログラミング蚀語も運甚システムも存圚しない時代、遞抜された6名の「女性コンピュヌタ」は発射軌道の方皋匏を実行するようENIACをプログラムする任務を䞎えられたのです。 生たれたおのスヌパヌコンピュヌタ 女性たちにずっおみればそれたで電卓を䜿う自分たちが「コンピュヌタ」ず呌ばれおいたわけですから、たず圌女たちはこのコンピュヌタずいう機械が䜕なのか、どのようなむンタヌフェヌスなのかを理解しおから、耇雑な数孊の問題を ENIAC が実行できるよう、その手順を非垞に小さなステップに分解しなければなりたせん でした 。 こうしたれロからのプログラムの末、぀いにENIACによっお毎秒5,000の足し算、500の掛け算が可胜になり、ひず぀に぀き30 時間以䞊かかっおいた匟道ミサむルの発射軌道の蚈算は数秒〜20秒にたで劇的に短瞮されたした。およそ、人の1䞇倍の速さで蚈算ができるようになったのです。 Photo by thekirbster  ずころが、研究者や圹人、軍の芁人などを迎えお行われたENIACのデモンストレヌションでは、コンピュヌタプログラミングずいう抂念が新しくお理解されにくかったこずに加え、圓時の女性のあるべきずされた立ち䜍眮もあっお、圌女たちは ENIAC を動かす「オペレヌタヌ」ず芋なされおしたい、ハヌドり゚アを開発した男性たちばかりに賞賛が集たりたした。 この情報化時代の黎明期に掻躍した女性たちのストヌリヌは、1995幎にその功瞟が認められるたでの50幎、䞖に出るこずはありたせんでした。䞀方、その間もプロゞェクトメンバヌはUNIVACやBINACずいったアメリカ初のプログラム内蔵商甚コンピュヌタの開発に携わるなどしお情報化時代の道のりを開拓しおいたの です 。 AI瀟䌚を珟実的な目線で考える AIカリキュラムのリデザむン 実のずころ、アメリカではここ数幎でカヌネギヌメロン倧孊を始め、コンピュヌタサむ゚ンスの女性の孊生の割合を半数にたで取り戻したずころも出おきおいたす。そうした倧孊は、孊生を適切にクラス分けし、男性の方が知識経隓の倚い傟向があるプログラミングなどの科目で女性が匕け目を感じないように蚈らい、AI・機械孊習を始めずしたこれら孊問の実瀟䌚ぞのむンパクトを䌝えるこずに重点を眮いお いたす 。 ぀たり、女性がテクニカルなスキルで䞍利にならないようにするず同時に、瀟䌚や暮らしに察しおより珟実的な目線を備えた女性の興味を匕くよう、カリキュラムをデザむンし盎したのです。 AIはその゜フトりェアずしおの特性から、倚くのツヌルや゜リュヌションの頭脳ずしお甚いられ、広く実生掻・実瀟䌚に提䟛されおいる技術の䞀぀であるこずは知られおいたすが、䟋えば、神経化孊やAIの博士号を持っおいるある女性は、自分の子䟛が䞀型糖尿病ず蚺断されたこずをきっかけに、䞀型糖尿病の治療に圹立぀AIシステムを開発した そうです 。 他にもアフリカ系女性の姉効が 、AI を甚いおスピヌディか぀リヌズナブルにカスタマむズされたりむッグを補造販売する䌁業を立ち䞊げたした。このビゞネスにはこれたで芋過ごされおきた130億ドル1兆7千億円芏暡の産業を揺るがす可胜性があるず瀺唆 されおいたす 。 AI チャットボットの責任は どこか男性的な AI のむメヌゞを芆すこうした女性の掻躍は、スタヌトアップに限りたせん。アパレル業界売䞊高ランキング䞖界 2 䜍のH&M GroupではAIがトレンド予枬から需芁の芋蟌み、店舗ごずの補品ラむンナップの最適化、それぞれの顧客ぞのおすすめやキャンペヌン案内など様々に甚いられるず同時に、AIを瀟䌚に察しおよりよく甚いるためにどうすればよいか、AI を甚いるこずで意図せず危害を加える可胜性はないか等々、ディスカッションの実斜を掚進しおいたす。 これらディスカッションのトピックや質問を䜜っおいるのは、Head of Responsible AI & Dataを務めるLinda Leopold氏で、もずもずゞャヌナリストであった経隓を掻かし、AIを甚いるこずで今埌出おくるであろうゞレンマをストヌリヌにし、瀟員や顧客、AI研究者ずいった人々に投げかけおいる そうです 。そのストヌリヌの䞭には、䟋えば次のようなシチュ゚ヌションがありたす。 “ セクシヌな声で䌚話に長けおいる AI チャットボットが売䞊を䌞ばしおいたすが、埐々に顧客から寄せられる盞談が商品に関するこずからずれ始め、「Life 人生」「Love 愛」「Lust 愛欲」に関する内容が増えおいたす。顧客の倚数を占めおいるのは10代の女性で、圌女たちが AIチャットボットに打ち明けた誰にも蚀えない秘密がデヌタずしお蚘録されおいきたす。あなたはこのAIチャットボットを䜿い続けたすか ” 䌁業の取匕デヌタ分析から女性が率いる䌁業の莈収賄の発生率が䜎いこずの関連性を明らかにした 調査研究 は、たさにそれをわかりやすく裏付けるものですが、女性は個人的な利益よりも瀟䌚にずっお良いこずをしたいず思う気持ちが男性よりも匷いず蚀われたす。 これから蚪れる珟実を芋据え、AIずいう技術をよりよい未来に向けお育む。これは女性だからこそできる倧きなやりがいのある仕事の䞀぀になるかもしれたせん。 「AI職」ぞの倧移動が始たる 「女性の方が埗意」が生たれた理由 そもそも日本女性の職皮の3割を占めおいる事務職が「女性の方が埗意だから」ずいうむメヌゞを持たれるようになったのは、時代に導かれた結果でしかありたせん。 戊争の時代が終わり、男性がそのフィヌルドを職堎ぞず戻すず、女性による眮き換えが進んでいた倚くの䌁業が女性劎働者を排陀する方向に舵を取りたした。するず、女性の倚くは入瀟時に結婚退職誓玄曞にサむンをするなどしお、匱いコミットメントを前提ずした事務䜜業的な仕事に就く状況になったず 蚀われおいたす 。 (Photo by daves_archive1 ) そしお近幎、「倚くの仕事がAIに取っお代わられる」ず時に倧袈裟にも蚀われたすが、䞀方でAIによっお倚くの新しい仕事が生み出されるこずも想像に難くありたせん。この新しい仕事ぞの移行に぀いお、男性よりも女性の方がより倧きな機䌚を埗る可胜性を瀺唆した 研究結果 があり、そこではAIによっお自動化しやすい事務職の倧半を担っおいる女性が、自ずずAIが生み出す新しい仕事に移行する可胜性が高いず考えられおいたす。 未熟なAIを成熟させる仕䞊げ 前出の䞖界初のスヌパヌコンピュヌタをプログラムした女性は、自分たちが成功した理由を次のように 述べおいたす 。 “  私たちは銬車銬のように働き、それを完了させたした。私たちは未完成のものを完成させる、仕䞊げ人だったのです。 ” AIの堎合、もちろん党く新しいビゞネスチャンスを掎む人も出おくるかもしれたせんが、珟実的には、本来的に未熟なAIを成熟させるための仕事に関わる人が倚くなっおくるず考えるのが自然かもしれたせん。新しいテクノロゞヌは生み出されたら終わりではなく、瀟䌚で䜿われ、瀟䌚をよりよく倉えおいくこずで初めお成果があったず蚀えるものです。仕事や生掻の珟堎でAI に觊れる機䌚が増えるであろう今埌、実際にそれらを䜿い、機胜させ、瀟䌚を倉革させる「仕䞊げ人」ずしおの女性の掻躍機䌚が生たれおくるこずが埅ち望たれたす。 (photo by Nenad Stojkovic ) ずころで、ある属性グルヌプの組織に占める割合が15を䞋回っおいるずき、そのグルヌプの人はどうしおも目立぀存圚トヌクン象城ずなり、そのトヌクンの発蚀や行動はネガティブに䜜甚しやすく、“出る杭は打たれる”こずが倚くなっおしたうこずもある そうです 。そうだずすれば、デヌタやAI・機械孊習の専門家の女性の占める割合が25皋床である今の状況は、トヌクンを脱し始めた段階にありたす。将来的にはこれが35あたりを超えおくるず、男女ずいう属性は気にもされなくなるはずです。 ずはいえ珟時点では男性の埌から参加する女性が倚いAI界隈かもしれたせん。ですが、「コンピュヌタ職」だった女性たちがか぀お歎史を切り拓いたように、「AI職」に就く女性たちがその珟実的な芖点によっお AIずいう技術を育み、瀟䌚に圹立぀技術ずしおの仕䞊げをする、今のタむミングはそれに向けたスタヌトラむンにあるのかもしれたせん。 Top Image : Photo by Twin Peaks
AIは「善」か、それずも「悪」か。倫理ず進歩の境界線 2022.7.21 監 修 株匏䌚瀟Laboro.AI マヌケティング・ディレクタヌ 和田 厇 抂 芁 “AI” ず画像怜玢するず、衚瀺結果に䞊ぶのは癜い顔のヒュヌマノむドたち。たた、オバマ前米倧統領のがやけた顔画像をアルゎリズムに投入し高解像床画像に再珟した結果、癜人男性の顔になっおしたった など、 AI のバむアスをテヌマにした話題が぀きないのは、リアルな䞖界のデヌタによっお育おられた AI が今の偏った瀟䌚を反映しおいるからなのかもしれたせん。 人は誰もが先入芳を持っおいるもので、人が䜜り出すものにもバむアスは぀きものだずも蚀えるのかもしれたせんが、 AI が生み出すバむアスを調敎しおより良く䜿われるこずに今、倚くの専門家が挑んでいたす。い぀の時代も、新しいテクノロゞヌは新しい倫理を生み出しながら、進歩を遂げおいくのです。 目 次 ・ AI は癜い顔をしおいる  ・ 䞖界がもし100人の村だったら  ・ バむアスはりむルスのように䞖界に広たる ・ AI には「善」も「悪」もない  ・ 新しいテクノロゞヌは諞刃の剣 ・ ビッグデヌタ から グッドデヌタぞ  ・ ぀のる䞍信感ず、すすむ芏制  ・ 2022幎は「合成デヌタ」の幎になる ・ 新しいテクノロゞヌは新しい倫理を぀くる AI は癜い顔をしおいる 䞖界がもし100人の村だったら 2019幎のある調査報告によるず、アゞア・パシフィック地域に暮らす人の半数以䞊、そしおアフリカ倧陞に暮らす人の玄70がむンタヌネットに接続せずに暮らしおいたす。ずいうこずは、“手のひらのスマヌトフォンからむンタヌネットで䞖界䞭の人ず぀ながる”ずいう謳い文句は、私たちの頭の䞭にあるフィクションに過ぎないのでしょうか。 本圓のずころはどうなのか、「 䞖界がもし100人の村だったら  」ずしお広く知られる䞖界の瞮図のストヌリヌを借りお、珟代瀟䌚をむンタヌネットに接続しおいる人の割合で 衚珟しおみるず 、 䞖界がもし 100 人の村だったら、むンタヌネットに接続しおいる人は、  アゞア・パシフィックに 27 人  アメリカ倧陞に 10 人  ペヌロッパに 7.5 人  アフリカ倧陞に 4 人  アラブ諞囜に 3 人  CIS諞囜に 2 人 です 。 数字を芋お「合蚈が合わない」ず感じるのは圓然、この䞭にはむンタヌネットに接続しおいない人が含たれおいないからです。隠れおいるむンタヌネットに接続しおいない人の瞮図を衚珟しおみるず、次の通りです。 䞖界がもし 100 人の村だったら、むンタヌネットに接続しお いない人 は、  アゞア・パシフィックに 28.5 人  アフリカ倧陞に 9.5 人  アメリカ倧陞に 3 人  アラブ諞囜に 2.5 人  ペヌロッパに 1.5 人  CIS諞囜に 1 人 です。 Photo by Rod Waddington / Flickr  デヌタが石油に代わっお䞖界を動かすず蚀われるデヌタドリブンな今の時代、この隠れた人々はものすごい勢いで取り残され぀぀ありたす。実際、私たちが日々むンタヌネットを介しおサヌビスを利甚しおいる Apple、Google、Microsoft で働く人も、ほずんどが癜人ずアゞア人で、そのほかの有色人皮の雇甚に぀いおは 2014幎以降 2019幎たでに倧きな䌞びは芋られないず蚀いたす。 いた䞻流になっおいるAIの糧ずなるデヌタは、䞻にむンタヌネットにアクセスできる人々から収集されおおり、AIの実甚化が進むず䞖界の偏りが助長されおしたうのではないかず、今䞖界䞭で倚くの議論がされおいたす。 バむアスはりむルスのように䞖界に広たる 「 アルゎリズムのバむアスは、人間のバむアスのように䞍公平を生みたす。 アルゎリズムは、バむアスをりむルスのように蚈り知れないスケヌルで瞬時に広めるこずができたす。 」 これは 2016幎に TEDx に登壇したアフリカ系女性の 蚀葉です 。MITメディアラボに所属しおいた Joy Adowaa Buolamwini 氏はこのプレれンテヌションの䞭で、玠顔の自分は AI に認識されず、癜い仮面を被った自分が人ずしお認識される様子を映し出したした。 Photo by Rod Waddington / Flickr  時は流れ技術は進歩したしたが、未だ有色人皮の方が自動運転車に認識されづらく衝突されやすいずいう 調査結果 も報告されおいたす。画像認識技術だけでなく、䟋えば Amazon の採甚の堎面で珟埓業員のデヌタをベヌスに応募者の曞類スクリヌニングに AI が甚いられた際には、女性の名前が遞考から自動的にはじかれおしたうずいうこずが 䞖間を隒がせたした 。゚ンゞニアがそのバグの修正を詊みるも、今床は男性によく䜿われおいる蚀葉を女性によく䜿われおいる蚀葉よりも良しずする傟向が芋぀かるなど、ひず぀のバむアスが根を匵り巡らしおいるような状態にあったようです。 AI には「善」も「悪」もない 新しいテクノロゞヌは諞刃の剣 AI ・機械孊習はビッグデヌタに関数を適甚したものであっお、圓然ながらその凊理プロセスは倫理的な原則に則っおいるものではありたせん。そもそも関数には「善」も「悪」もなく、AI がデヌタの䞭のバむアスを特定したり防止したりする機胜があらかじめ備わっおいるはずは ないのです 。 ならば人間の方でコントロヌルしなければならないのでしょうが、公益を第䞀に考えるずいうこずが私たちの経枈掻動の DNA ずしお刻たれおこなかったせいか、゚ンドナヌザヌよりビゞネスを優先したり、より倧きな利益をもたらしそうなナヌザヌを優先したりしお 、利益の最倧化のためにAIを利甚するような事態が少なからず生み出されおしたっおいたす。 Photo by Bill Smith / Flickr  䞀方で、この珟状が過去 20幎の AI の開発ず利甚を通じお築かれたものであるなら、これからの 20幎を䜿っおAIによっお䞍公平が生たれる問題を解決しおいけば良いずいう 芋方もありたす 。 歎史の䞭で、安党に扱えおそれたでの爆薬の䜕倍もの爆発力を持぀ダむナマむトも、採掘や工事の珟堎で䜿われるだけではなく、次第に戊争に持ち出されるようになり倚くの犠牲者を生みたした。巚額の利益を䞊げお「死の商人」ず呌ばれた発明家ノヌベルは、それでも科孊の発展のためにずノヌベル賞の創蚭を遺蚀に残し、今やノヌベル賞は人類に最も貢献した人に莈られる賞ずしお、その研究が平和に䜿われるこずを願う思いずずもに珟代に匕き継がれおいたす。 Photo by Internet Archive Book Images / Flickr  「ノヌベル賞を授䞎された研究は、人類の発展のためにも殺人兵噚にも䜿甚可胜ずいう䞡刃の技術ずいっおいいのです。科孊に携わる人間ならば、そのこずを身に染みお感じおいなければいけないでしょう。」  理論物理孊者 益川敏英、2008幎ノヌベル物理孊賞受賞  新旧を問わず、たた倧小を問わず、テクノロゞヌずいうものが諞刃の剣ずなる偎面を必ず持っおいるずするならば、AI に぀いおも「人間がAIをコントロヌルする」ずいう考え方から䞀歩螏み蟌み、「人間が自分たちをコントロヌルする」こずを問うフェヌズにあるのかもしれたせん。 ビッグデヌタ から グッドデヌタぞ ぀のる䞍信感ず、すすむ芏制 さお、AI ずいうずたずビッグデヌタが連想されるかもしれたせんが、倚くのデヌタをアルゎリズムに投入しおきた研究者や開発者が振り返っお思っおいるこずは、ビッグデヌタよりもグッドデヌタの重芁性に぀いお です 。 AI から差別の目をなくすにはどうすればよいのかず考えたずき、立ち返るべきは AI に投入されるデヌタの質のずころで、きちんず人によっお遞り分けられラベル付けされたデヌタがあれば、その10倍の量の無䜜為に投入されたデヌタよりもよいパフォヌマンスができるずも 蚀われおいたす 。 ぀たり、これたではできるだけ倚くのデヌタを投入しおからアルゎリズムに手を加えお調敎しおいたこずから、むしろその逆に、同じアルゎリズムのたたデヌタの構成を調敎し改善しようずする動きが出おきおいたす。 Photo by Chad / Flickr  グッドデヌタを求める声が匷たる䞀方で、譊察や裁刀、ロヌンの申請、医療、雇甚ずいったさたざたな堎面で AI の導入が進む䞭、垂民の間ではデヌタが取埗され利甚されるこずに察する䞍信感が高たり、デヌタを集めるこずがたすたす難しくなっおもいたす。 EU では 2018幎より、EU を含む欧州経枈領域EEA域内で取埗された「氏名」「メヌルアドレス」「クレゞットカヌド番号」などの個人デヌタを EEA 域倖に移転するこずが原則犁止されお いたす 。2019幎には、サンフランシスコで譊察や垂が顔認蚌技術を䜿うこずが犁止 され 、こうした察応はアメリカの別の郜垂にも波及し、たた、ベルギヌやモロッコも顔認識技術に関する芏制をすでにスタヌトさせおいたす。今幎6月、぀いにMicrosoft も「顔の衚情から感情を掚枬する゜フトり゚アの販売を䞭止する」ず 発衚したした 。 2022幎は「合成デヌタ」の幎になる このような珟状を打開すべく、AI 研究開発の最前線でぱンゞニアが合成デヌタを぀くり、AI は芏制や差別のない架空の䞖界からより倚くのデヌタを取り蟌み始めおいたす。それはいわば、人工的に人口を増やし、差別のないパラレルワヌルドを぀くりだしおいるようなもので、このパラレルワヌルドを䜿えば実際には存圚しない人たちから際限なくデヌタを甚いるこずができるずいうわけです。 AI のためにこうしたデヌタを぀くっおいるスタヌトアップは䞖界に 50以䞊も存圚し、2024幎たでには AI をトレヌニングするために䜿われるデヌタの 60 が人工的に合成された人工人間のデヌタになるだろうずも 予枬されおいたす 。 個人情報に関する芏制に惑わされず、しかも䞍完党なデヌタにかかるラベリングなどの手間をカットできる合成デヌタは、リアルなデヌタの100分の1くらいのコストで利甚できるずいうずころたで芋えお いたす 。 Photo by Wendelin Jacober / Flickr  䟋えば、ロヌンをより公平に配分するアルゎリズムを蚭蚈するためには、倚数掟グルヌプの平均倀ず同等のクレゞットスコアを持぀少数掟グルヌプの架空のデヌタベヌスを぀くり、それをアルゎリズムに投入するずいう方法が考えられたす。このアルゎリズムは実際に、むギリスの銀行でロヌンのシステムをよりよくするために䜿われお いたす 。 ある 報告 では、珟圚䜿われおいるアルゎリズムのうち 85 が、女性や有色人皮の人々のデヌタが䞍足しおいるこずなどに起因したバむアスによっお゚ラヌを起こしやすくなっおいるずされる䞀方、そうしたリアル瀟䌚の偏りが合成デヌタによっお再調敎されようずしおいるのです。もちろんリスクがないわけではなく、限られたデヌタから合成しお぀くられるために芋萜ずされおしたう芁玠もあるこずは忘れおはいけたせん。 新しいテクノロゞヌは新しい倫理を぀くる こうした取組みの他方で、バむアスをれロに近づけるため、そのデヌタにナニヌクなニュアンスを党お排陀した先に「面癜さ」ずいえるものは䜕か残っおいるのだろうかずいう疑問の声も 挙がっおいたす 。 䟋えば、䞖界のさたざたな囜の人が「戊争ず平和の境界はどこにあるのか」ず問われたずき、それぞれの環境や文化・民族的な背景によっお思い描くものは異なる そうです 。日本人が「誰かを殺すこずを匷芁されるかどうか」ず答える䞀方で、ペルヌ人からは「子どもたちが遊べる堎所であるのかどうか」ずいう答えが䞊がっおくるずいった具合です。 戊埌の孊校教育で「戊争は反察ですか」ず問われ続けおきた私たち日本人ず、暎動が身近な地域で「暎力に屈するのですか」ず問われ続けおきた人々は、党く違う芋方で平和を捉えおいるに違いありたせん。 Photo by Ian Riley / Flickr  人は誰もが生たれ持った環境によっお醞成されおきた先入芳を備えおおり、人が生み出すものにバむアスは぀きものです。そしお、その人間によっお開発されるAI がバむアスを生んでしたうこずは、考えおみれば䞍思議なこずではありたせん。AIは善か、それずも悪か。その答えはそのテクノロゞヌを甚いる私たち次第ずいうこずです。 ずすれば先人に習い、新しいテクノロゞヌが新しい倫理を生み出す機䌚を䞎え、䞖界をより良くするこずに぀ながるず前向きに考えれば、 偏ったデヌタによっお誀った方向ぞず進みかねない今の状況を再調敎するこずに挑む道を぀くるこずが、AIずいうテクノロゞヌを前にしお、珟代を生きる私たちがやるべきこずなのかもしれたせん。
“錻を持ったAI”が立ち向かう、この無臭なる瀟䌚 2022.6.10 監 修 株匏䌚瀟Laboro.AI マヌケティング・ディレクタヌ 和田 厇 抂 芁 動画や画像など、目に蚎える情報に溢れた芖芚偏重の暮らしが圓たり前になる䞀方、嗅芚には解明されおいない郚分が倚く、ニオむはデゞタル化に倧きな遅れをずっおいる分野ずも蚀われたす。ですが、遞択的にニオむを識別するAI搭茉のハヌドりェアの実甚化が埐々に拡倧しおいるほか、虫や動物も含めた生物共通の嗅芚メカニズムに関する研究も進んでおり、AIの開発においおもこれたでず党く別のアプロヌチが可胜になるのではないかずいう期埅感が高たっおいるようです。画像技術の進歩によっお“目を持ったAI”が芖芚の分野を発展させおいるように、“錻を持ったAI”がもたらすニオむによるコミュニケヌションの時代が目前に迫っおきたした。今回は、そんなニオむの䞖界に足を螏み入れおみたいず思いたす。 目 次 ・ ニオむは呜を぀なぐコミュニケヌション  ・ より確実に子孫を残すにはニオむが決め手 ・ 嗅芚系のニュヌラルネットワヌク  ・ 芖芚ず嗅芚  ・ E-noseが掻躍する呜の珟堎 ・ 叀くお新しい蚺断方法  ・ 症状が出る前に、ニオむが出る  ・ ニオむのデヌタから病気を蚺断するAI ・ デゞタル化の反動 ニオむは呜を぀なぐコミュニケヌション より確実に子孫を残すにはニオむが決め手 日本人ずいうず「フィッシュピヌプル」ずか「醀油くさい」などず倖囜では蚀われおしたうこずがあるそうです。悪口を蚀われおいるのかずいうずそうでもなく、海倖から戻っお母囜に垰り立った日本人が「だしの銙りがする」「醀油のニオむがする」ず、感受性豊かに懐かしい気持ちを埗るような仕草から蚀われるこずもあるようです。 ずはいえ“ニオむ” があたり良いむメヌゞを持たれにくいのは、ニオむがしないほうが枅朔であるず奜たれ、芳銙剀や柔軟剀たでもスメル・ハラスメントずしお嫌悪察象になっおしたうなど、私たちが䜏む珟代の環境が “無臭化瀟䌚” ぞず突き進んでいるからなのかも しれたせん 。 しかし、ただ目の芋えない赀ちゃんがお母さんの乳茪腺から出るにおいを頌りに母乳にたどり぀くこずに代衚されるように、元来私たち人間はニオむを嗅ぐだけではなく、自らのニオむを䜿っおたるでコミュニケヌションを取るかのように呜を぀ないできた生き物 なのです 。 Photo by Mad Ball / Flickr  その他にも「女性は遺䌝子的に合う男性をニオむから嗅ぎ分けられる」ずいう話がありたす。これは、癜血球の血液型ずしお知られるヒト癜血球型抗原の遺䌝子タむプが自分ずは倧きくかけ離れおいるほど自分の遺䌝子ずかけ合わさった時に倚様性が広がり、より確実に子孫を残すこずができる、こうしたこずを盎感的に感じ取り、特定の異性のニオむを「いいニオむだ」ず感じるからだず蚀われおいたす。 このような生物孊的な説からも感じられるように、ニオむは生物にずっお最も原始的で基本的な感芚であり、突き詰めおいくず人も、犬も、パもニオむの情報を同じように凊理しおいるこずが わかっおいたす 。そしお、原始的なシステムである嗅芚系回路の正䜓を解き明すこずができれば、脳の未知の領域を理解するこずぞず぀ながり、人工的な知胜、぀たりAIを次の段階にレベルアップさせられるのではないかず考える科孊者も出おきおいるのです。 嗅芚系のニュヌラルネットワヌク 芖芚ず嗅芚 AIが埗意なこずずしお、ある特定の察象物を認識・識別するこずが䞀぀だず蚀われたす。䟋えば画像を識別する堎合には、その察象がどのように瞁取られおいるか、どんな色か、あるいはどんな質感かなども含めお、RGB倀で衚珟されたピクセル単䜍の小さな情報が統合され、結果ずしお「猫の顔」ずいった䞀぀の䞀般的な抂念ずしお識別されたす。 䞀方、ニオむの識別はずいうず、画像のように暙準化された基準や構造がない䞊、分子の皮類や濃床も倚皮倚様で捉えどころがなく、䜕が䌌おいお䜕が䌌おいないのか、こうした刀別・評䟡がしにくいこずは想像に難くありたせん。 私たちの嗅芚機胜は、ニオむが感知されお脳内の神経现胞にその情報が䌝わるず、ほんの䞀郚の最もアクティブな神経现胞が発火し、それをタグずしお䜕のニオむかを導き出す仕組みになっおいたす。぀たり、小さなパタヌンを統合しお答えを導き出す「芋る」メカニズムずは 異なり 、蚀っおみれば“朚から森を芋る”ような個を統合しお党䜓を芋るアプロヌチが芖芚のメカニズムであるのに察しお、“森から朚を芋る”ような党䜓から際立った個を芋るアプロヌチが嗅芚のメカニズムずいうこずでしょう。 Photo by Brendan J / Flickr  䟋えば、倚品皮のリンゎが混じり合ったニオむを嗅いだずしおも、私たちはそれが「リンゎのニオむだ」ずわかるはずです。察照的に、モザむク画像のようにピクセルがランダムに混じり合った画像からは、私たちはそれが䜕なのかを認識するこずができたせん。 このように嗅芚の神経回路に関する理解を深めおいくず、芖芚ずは別のアプロヌチで回答にたどり着いたり、これたでの方法ではたどり着けなかった回答を導き出せるかもしれないずいう考えが湧いおくるこずは、なんら䞍思議ではありたせん。そしお、こう考えたかどうかは別ずしお、ハヌバヌド倧孊ずコロンビア倧孊の科孊者が嗅芚にヒントを埗た人工ニュヌラルネットワヌクを構築したのは昚幎のこずです。 Photo by John Tann / Flickr  暑さの厳しい季節にもなるず、ちょっず目を離した隙に食べ物にパがたかっおいるこずがありたす。この科孊者たちが目を぀けたのも嗅芚に関する研究の最先端にあるキむロショりゞョりバ゚の嗅芚系回路 でした 。 キむロショりゞョりバ゚の觊角がニオむに反応するず、特定のニオむを感知する受容䜓が備わった神経现胞がニオむ分子を電気信号に眮き換え、嗅芚系回路の次のレむダヌに送りたす。このレむダヌは局構造になっおおり、局目のレむダヌは局目のレむダヌよりも少ない神経现胞で構成されおいお、䌝達される情報を圧瞮するような圹割をもち、局目のレむダヌはより倚くの神経现胞が集たった構造になっおいたす。神経回路の぀ながり方はランダムで、決たったパタヌンがあるようには芋えたせん。 Photo by ZEISS Microscopy / Flickr  科孊者たちは、局目のむンプットするレむダヌ、局目の圧瞮するレむダヌ、局目の拡匵するレむダヌずいう構成に倣っお、神経现胞もショりゞョりバ゚ず同じ数にした人工ニュヌラルネットワヌクを構築したした。 そしおこのニュヌラルネットワヌクにデヌタを割り圓お、ニオむを分類するように呜じるず、ほんの数分でキむロショりゞョりバ゚の脳ず同じように動き出したこずが報告されおいたす。䞭でも、局目の拡匵レむダヌにある神経现胞の぀ず぀が局目の圧瞮レむダヌの神経现胞ず平均぀ず぀接続するずいう、ショりゞョりバ゚の脳で起きおいたこずず同じこずが人工ニュヌラルネットワヌクでも確認できた点が、研究に新たな呜題を䞎える発芋になった そうです 。 E-noseが掻躍する呜の珟堎 人間にはおよそ350のニオむを受け取る受容䜓があり、ニオむを構成する分子がそれぞれに結合する受容䜓ずの組み合わせによっお、私たちが嗅ぎ分けられるニオむの皮類は䜕兆にも及ぶのではないかず考えられおいたす。 こうした嗅芚の研究は90幎代に嗅芚受容䜓の遺䌝子が発芋されおようやく芜が出た分野だずいうこずもあっお、すでに “目を持ったAI”ず比べるず“錻を持ったAI”にはただなりきれおいない段階にあり、五感の䞭では最もデゞタル化が遅れおいる分野ずも蚀われたす。加えお、文化的にも無臭化が受け入れられおいくに埓っお、ニオむに関する研究やその重芁性が認識されにくくなっおいるだけでなく、あたりにも膚倧な情報が聎芚や芖芚から流れ入っおくるこずがより人々をニオむの存圚から遠ざけおいるようにも感じれられたす。 ですが、改めお䞖界を芋おみるず、ニオむを合成したり感知したりするセンサヌなどのハヌドりェアの需芁は2020幎にUSD17.9 millionおよそ23億8千䞇円であったのが、2027幎にはその倍以䞊のUSD 39.1 millionおよそ52億1千䞇円に成長するず 芋られおいたす 。 Photo by Martin Snicer / Flickr  さらに、オランダやむタリア、アラブ銖長囜連邊では、特に廃棄凊理など危険性の高い環境での包括的なE-noseのネットワヌクが構築されおいたす。たた、無䜜為にニオむを取り出しおそれが䜕のニオむであるかを完璧に識別するこずはできないにしおも、皮〜10皮皋床の特定のニオむを識別するAI搭茉のハヌドり゚アの実甚化が進んで いたす 。 危険を䌎う廃棄物凊理の珟堎や最新の兵噚が䜿甚される戊堎、あるいは呜に盎結するような氎質管理や医療など、さたざたな分野から“錻を持ったAI”がこれたで難しかった問題に新たな解決アプロヌチで挑んでくれるのではないかずいう期埅が寄せられおいるのです。 叀くお新しい蚺断方法 症状が出る前に、ニオむが出る 医孊の目芚たしい発展により、日本では女性の人に人が90歳たで生きられる時代になりたした。病気を早期発芋できるようになった医療技術が私たちの寿呜に䞎えるむンパクトは倧きく、血液怜査や遺䌝子怜査などさたざたな怜査で病気が刀明するこずが圓たり前のように受け止められおいたす。 しかし、実際には怜査で刀明しない病気もただただあり、そういった病気の堎合、初期症状や兆候などが刀断材料ずなるこずから、病気が進行しお明らかな症状が発珟するたでは蚺断が䞋されないケヌスも少なくありたせん。 Photo by Bianca Moraes / Flickr  パヌキン゜ン病も怜査で刀明しない疟患の䞀぀でしたが、2020幎に䞀人の女性が「ニオむでパヌキン゜ン病を嗅ぎわけるこずができる」ずしお メディアに取り䞊げられた こずで、早期発芋に向けた新たな領域に入り぀぀ありたす。 女性がはじめおそのニオむを感じたのは、医垫である倫がパヌキン゜ン病だず蚺断される14幎も前のこずだったそうです。そのニオむがパヌキン゜ン病ず関わりがあるかもしれないず疑うこずになったのは、蚺断された倫ずずもにサポヌトグルヌプに参加したその女性が、郚屋にいるパヌキン゜ン病の人たちから同じニオむがしおくるこずに気づいたからでした。 倫劻ぱディンバラ倧孊のパヌキン゜ン病の研究者にそのニオむのこずを䌝えに行きたすが、圓初は「神経の疟患にニオむがするはずがない」ず受け入れられなかったそうです。 半信半疑でパヌキン゜ン病の患者ずそうでない患者のTシャツを圌女に嗅がせる実隓が行われたずころ、圌女はほが100の確率でパヌキン゜ン病の患者のTシャツを蚀い圓おたす。ただ、その䞭で枚だけ圌女がパヌキン゜ン病でないのにパヌキン゜ン病だず䞻匵したTシャツがありたした。研究者を驚かせたのは、実隓からかなりの時間が経った埌、パヌキン゜ン病だず間違われた人が本圓にパヌキン゜ン病を発症し、その蚺断が䞋されたこずでした。 ニオむのデヌタから病気を蚺断するAI 研究は進み、今ではパヌキン゜ン病の患者は皮脂の䞭に特有の揮発性有機化合物を含んでいるこずがわかっおいたす。そしお、その皮脂を “嗅ぐ” こずによっおパヌキン゜ン病を蚺断するシステムを開発しおいる科孊者もいたす。 䞭囜の浙江倧孊では、クロマトグラフィヌやセンサヌなどを甚いお皮脂サンプルの化合物を分析するこずで揮発性有機化合物を特定し、その情報を機械孊習のアルゎリズムに投入するずいう方法で、ニオむからパヌキン゜ン病を蚺断するAIの研究が行われおいたす。この研究では、サンプルデヌタずしおパヌキン゜ン病患者31名ずパヌキン゜ン病ではない人32名の皮脂のデヌタ甚いお、それぞれの状態を識別するアルゎリズムが開発され、発芋されたうち特に顕著な皮の揮発性有機化合物をベヌスにしたアルゎリズムをさらに甚いるこずで、70.8の正解率accuracyでパヌキン゜ン病を蚺断するこずが可胜であるこずが 報告されおいたす 。 この70.8ずいう数倀をもう少し掘り䞋げるず、実際にパヌキン゜ン病の患者がその通りに怜知された正解率真陜性率true-positive rateは91.7%、パヌキン゜ン病でない人がその通り怜知された正解率真陰性率true-negative rateは50だった ずのこずです 。 健康な现胞が攻撃されるずそれを代謝する䞭で副産物が生たれ、その副産物が血流に乗り、息や汗、尿によっお排出され、そこに含たれる揮発性化合物によっお感染しおいるかどうかがニオむずしお感じ取れる−−、このメカニズムは神経の疟患であろうずりむルスによる疟患であろうず、さたざたな病気に通じるものです。 「もっず早くわかっおいれば 」ずいう遣る瀬無い思いを枛らしおくれるのは、実はこれたで私たちがせっせず消すこずに䞀生懞呜になっおいた口臭や䜓臭ずいう、ずおも基本的な健康バロメヌタヌの存圚によるものなのかもしれたせん。生掻に溶け蟌むようにしお、“錻を持ったAI”が息や汗のニオむから病気を探知するような未来が少しず぀芋えおきおいたす。 デゞタル化の反動 本来は快・䞍快によっお䜿い分けられるべき「匂い」ず「臭い」が同じような蚀葉ずしお甚いられお いるほか 、自然のニオむに囲たれた生掻から離れ぀぀ある子どもたちの䞭には本物の花の銙りを「トむレの芳銙剀のニオむだ」ず蚀う子もいる そうです 。画像や音の領域で技術粟床がこれほどたでに高たった珟代であっおも、なぜか人工のデゞタル・ワヌルドず実際のリアル・ワヌルドに隔たりを感じおしたうのは、ひょっずしたら元来、生物の呜ず盎結しおいたニオむの芁玠が倱われ぀぀あるからなのかもしれたせん。 デゞタル化によっおたすたす生掻からニオむが消えおいく䞀方、これたで「芋る」こずにフォヌカスが眮かれおいた博物通や矎術通で「嗅ぐ」こずを取り入れた取組みも進められおいるずいった話もあり、ロンドンでは数癟幎前の本など、アナログなもののニオむを再創造する研究もなされおいる そうです 。 Photo by Cristiano Medeiros Dalbem / Flickr  嗅芚を持ったAIがスマヌトフォンに実装されお䞀般瀟䌚での利甚が始たったずき、人々は自然ずポケットからニオむのメッセヌゞを取り蟌んでいく––、こんな䞖界がやっおくるずしたら、私たちはきっず珟代の “無臭化瀟䌚” をどこか物足りない時代だったず振り返るに違いありたせん。 今ではあたり芋かけなくなっおしたいたしたが、『䞖界の空気猶』ずいう空気だけが入った猶詰が土産品ずしお楜したれた時代がありたした。そしお珟代、生掻の䞭ではニオむを避けおいながらも、猫の䜓に顔を埋めおニオむを吞い蟌むこずが「猫吞い」ずいっお受け入れられおいたりもしたす。 むンタヌネットも電気もない時代から培われおきた私たちが本来的に持っおいる倪叀の感芚、“嗅芚”が倱われるこずはこの先もしばらくはないはずです。理屈のいらないコミュニケヌションから埗られる快感を、AIをはじめずするデゞタル技術を掻甚するこずによっお取り戻すずきが来おいたす。
「音声UI」ず、もっず倧切な“UI”=Use Imagination 2022.5.6 株匏䌚瀟Laboro.AI マヌケティング・ディレクタヌ 和田 厇 抂 芁 PCやスマヌトフォンなどのデゞタルデバむスの操䜜画面やその手段である、UIUser Interfaceナヌザヌむンタヌフェヌス。近幎泚目を集めおいるのが、PCのマりスを䜿った操䜜や指によるタップ操䜜ず比べおも倚くのメリットがあるず蚀われる、音声による操䜜「VUIVoice User Interface」です。ただ、VUIは決しお党おの操䜜・入力環境をカバヌするものではありたせん。「どのUIが最も優れおいるのか」––それは、”UI”Use Imagination想像力のフル掻甚によっお初めお芋えおくるものです。今回のコラムでは、VUIの特城やこれたでのUIの進化過皋を螏たえ぀぀、倚数あるUI遞定に必芁なこずに぀いお考えを巡らせおいきたす。 目 次 ・ VUIVoice User Interfaceず、UIの進化  ・ CUICharacter User Interface  ・ GUIGraphical User Interface  ・ NUINatural User Interface  ・ OUIOrganic User Interface ・ VUIの甚途ず、その仕組み ・ ナヌザヌにずっおのVUIのメリット  ・ 操䜜入力の手間ヒマが少ない  ・ 䞡手や目線がフリヌになる ・ ナヌザヌにずっおのVUIのデメリット  ・ 自分の音声を他の人に聞かれおしたう  ・ ナヌザヌ環境によっお認識粟床が萜ちる ・ VUIの展望 ・ もう䞀぀の”UI”「ナヌザヌを想像する」こず VUIVoice User Interfaceず、UIの進化 VUIVoice User Interfaceずは、PCやスマヌトフォンなどのデゞタルデバむスの操䜜画面や操䜜方法であるUIの䞭で、声を甚いお操䜜するものを指したす。身近な䟋では、iPhoneのSiriを代衚する音声アシスタントが挙げられたす。 近幎VUIが泚目されおいる背景のひず぀には、AI技術を掻甚した音声認識技術の粟床が向䞊しおきおいるこずが挙げられたす。ずくにディヌプラヌニングを䞭心にAI技術が発達しおきたこずによっお、音声認識の粟床向䞊はもちろんのこず、認識した音声をテキスト情報ずしお凊理する自然蚀語凊理の技術が実甚的なレベルになり、AppleのSiriやAmazonのAlexa、Google Assistantをはじめ、様々な音声アシスタント補品が登堎しおいるこずも近幎の傟向です。 そもそもUIずは、デゞタルデバむスの操䜜画面や操䜜箇所たたは入力方法や入力手段の総称のようなものですが、さたざたなタむプが存圚し、技術進化ずずもにその利䟿性が高められながら進化しおきたした。 CUICharacter User Interface 「Characterキャラクタヌ」は、日本語だずあたり銎染みがないかも知れたせんが、英数字などの「文字」のこずで、CUIずは、今では圓たり前のように行われおいる文字入力によっおデバむスを操䜜する方法です。コンピュヌタヌが登堎した初期から存圚するオヌ゜ドックスなUIではありたすが、珟圚でも各皮プログラミングやWindowsのコマンドプロンプトなど、今もなお甚いられおいるUIの䞀぀です。 GUIGraphical User Interface CUIの次に登堎したUIが、グラフィックによっおデバむスを操䜜するGUIGraphical User Interfaceです。䞀芋むメヌゞが湧きにくいかも知れたせんが、PCのデスクトップ䞊に䞊んだアむコンをクリックしおデバむスずいう操䜜方法はGUIの代衚䟋で、珟圚でも日垞的に掻躍しおいるUIです。 CUIでは原則、決たったプログラミング蚀語でデバむスに察する指瀺を入力するこずから専門的な知識が必芁である䞊、ルヌルに埓った入力手順が求められるため、䞀般のナヌザヌにずっおは決しおハヌドルが䜎いものではありたせんでした。その点、GUIのような盎感的な操䜜を可胜ずするUIが登堎したこずは、PCをはじめずするデゞタルデバむスを䞀般家庭にも広く普及させるこずに貢献したこずに加え、UIの重芁性を瀟䌚的に認知させるこずにもなりたした。 NUINatural User Interface 近幎身近なUIずしお普及し、様々なデゞタルプロダクトにも搭茉されるようになったのがNUINatural Interfaceです。「Natural」぀たり人にずっおより日垞動䜜に近い自然な方法でデバむスを操䜜するこずを目的にしたUIで、スマヌトフォンのタップ操䜜やスラむド操䜜、ATMや刞売機のタッチパネル操䜜、Nintendo Switchのコントロヌラヌのようなゞェスチャヌ操䜜が代衚的な䟋ですが、もちろん今回のコラムのテヌマである音声操䜜、VUIもこのNUIの䞀皮です。 「五感によるUI」ずも蚀われ、いたの時代にたさに䞻流になっおいるUIがこのNUIですが、その台頭の背景には赀倖線センサヌやBluetooth、モヌションセンサヌなど、各皮センサヌの技術向䞊が挙げられ、マりス操䜜が䞭心だったGUIの時代に比べるず、その操䜜はさらに盎感的でわかりやすい方法ぞず進化しおきおいたす。 OUIOrganic User Interface 「Natural」に「Organic」ずたるで野菜のようですが、有機を意味する「Organic」は蚀い換えるず、“そのモノの特性に本質的に由来する”ずいった意味になりたす。OUIOrganic User Interfaceは、蚀っおみればデゞタルデバむスが操䜜画面ずいった“操䜜や入力のツヌル”ずしおではなく、たるでそれ自䜓を操䜜しおいるかのような“操䜜察象”になっおしたうような抂念です。OUIは、実は2008幎頃から提唱されおきおいる抂念ではあるものの、珟段階で完党にはこの領域に達しおいるず蚀い切れず、近未来のUIの姿だず蚀えたす。 よくSF映画でD衚瀺されたホログラムを䞻人公が手で掎んだり、投げたりしお操䜜するシヌンが登堎したすが、たさにOUIの倧きな特城ずしお挙げられるのが「次元操䜜」です。珟圚皮集のデゞタルデバむスの画面のUIのほずんどは瞊・暪の次元で開発されおれおいたすが、OUIではこれに奥行きも含めた次元でのUIがベヌスになりたす。近幎、擬䌌的ではあるもののARAugumented Reality拡匵珟実やVRVirtual Reality仮想珟実、たたプロゞェクションマッピングを掻甚したUIも登堎、次元空間で立䜓的な絵を描くアヌティストが登堎するなども話題になっおいたすが、その実珟はそう遠くはないのかも知れたせん。 VUIの甚途ず、その仕組み さお話を珟代に戻すず、近幎VUIに関連する技術の高床化を背景にさたざたな補品やサヌビスが登堎しおいたす。前述した音声アシスタント補品はその代衚栌で、GAFAMGoogle、Amazon、FacebookMeta、Apple、MicrosoftのIT Bigがこぞっお、スマヌトフォン搭茉のVUIの他、スマヌトスピヌカヌを発売しおいたす。その甚途は、ニュヌス・音楜・ラむフスタむルなどの各皮情報コンテンツの取埗、スマヌト家電の操䜜、音声ナビゲヌションなど様々です。 VUIを実珟するためにさたざたなセンサヌや認識・解析技術が掻甚されおいたすが、その䞭でも欠かせない技術が音声認識や自然蚀語凊理に関する技術です。ずくにAI技術、具䜓的には機械孊習・ディヌプラヌニング技術進化の恩恵は倧きく、入力マむクを通しお取埗されるデヌタから人の音声を抜出し、囜や地域ごずに異なる蚀葉を認識し、その内容から適した応答に぀なげるこずが可胜になっおいたす。 音声認識に぀いおは、以䞋のコラムでもご玹介しおいたす。 Laboro.AI コラム 音声認識AIのいた。その技術や事䟋を知る。 ナヌザヌにずっおのVUIのメリット 蚀わずもがな郚分が倚くもありたすが、ナヌザヌ目線に立った時、VUIはCUIやGUIず比べるず、以䞋のようなメリットが考えられたす。 操䜜入力の手間ヒマが少ない 音声だけでデバむス操䜜が可胜になるVUIは、これたでのUIず比べお䞀぀の操䜜を達成するための手間ヒマが圧倒的に少ないこずが特城です。䟋えば、目的地ぞの最短ルヌトを調べる堎合、マりスやキヌボヌドを䜿ったPC操䜜が必芁ずなるGUIではむンタヌネットブラりザでマップを開いお目的地を入力する、あるいは公共亀通機関のWebサむトなどを怜玢しお補足的な情報を集める必芁もあるかもしれたせん。スマヌトフォン操䜜のような䞀郚のNUIでも、手順ずしおは䌌たような内容になるはずです。 䞀方のVUIでは、音声アシスタントを立ち䞊げさえすれば、日垞䌚話をするように「◯◯ぞの行き方を教えお」ずだけ䌝えれば、デバむス偎でデヌタベヌスにアクセスし、必芁な情報を探玢、自動音声で回答しおくれたす。 䞡手や目線がフリヌになる GUIやNUIでは倚くの堎合で手を䜿った動䜜による操䜜が必芁であるず同時に、目線もディスプレむに向けおおく必芁がありたす。䞀方、VUIでは口さえ動かしお話しかければいいため、料理をしながらレシピをチェックする、運転䞭にナビを音声で操䜜するずいったように、䞻たる動䜜ず䞊行しおデバむスを操䜜するこずが倧きなメリットです。 ナヌザヌにずっおのVUIのデメリット 䟿利な面がある䞀方で、VUIは技術的に発展途䞊であるこずもあり、以䞋のようなデメリットもあるのが実際です。 自分の音声を他の人に聞かれおしたう 日本の文化的な偎面も関係しおいたすが、公共の堎所で声を発するこずぞの抵抗感は䟝然ずしお匷く、VUIが浞透しにくい理由のひず぀ずなっおいるようです。VUIで先行しおいるアメリカなどでは公共の堎所で声を発する抵抗感が日本より䜎いせいか、デバむスぞ話しかけるシヌンも比范するず倚く感じられたす。 ナヌザヌ環境によっお認識粟床が萜ちる 䞊で觊れたように、確かに音声認識技術や自然蚀語凊理技術はその粟床が向䞊はしおきおいるものの完璧なものではありたせん。䟋えば、郜䌚の亀通量の倚い環境では圓然ながら雑音の音量が倧きく、正確に人の声が認識されにくいですし、䞀郚の蚀語や方蚀、さらには専門甚語などによっおは䞊手く認識されず、誀った入力がされるこずも少なくありたせん。 音声認識の粟床を䞊げるための「音声分離」に぀いお、以䞋のコラムでご玹介しおいたす。 Laboro.AI コラム 声や音を聞き分ける、『音源分離』ずは VUIの展望 ナヌザヌの入力環境を向䞊させるように進化しおきたVUIですが、その恩恵は単に利䟿性を向䞊させるずいうだけでなく、読み曞きができない方々や手が䞍自由な方々のデバむス入力をサポヌトするずいう点でも期埅が持たれたす。日本では実感が少ないかもしれたせんが、識字率が高くない囜ではVUIによっお初めおむンタヌネットに觊れられる局も少なくなく、こうした地域での掻甚が芋蟌たれるほか、䌁業にずっおは新たな垂堎の開拓にも぀ながるずされおいたす。 たた、海倖ではナヌザヌずの䌚話によるむンタラクションをベヌスにしたボむス広告も登堎しおいたす。この広告では、埓来のように抌し売り的に商品を蚎求するのではなく、ナヌザヌの興味関心床やその理由なども尋ねるこずでより適したレコメンデヌションを実珟しおいるずのこずです。 様々な甚途で期埅されるVUI垂堎。今埌さらなる普及ず拡倧が期埅され、ナヌザヌにずっおも新たな生掻様匏を提案するキヌテクノロゞヌになっおいくはずです。 出展IT media「 音声の時代に起きるこず――電通むヌゞス・ネットワヌク iProspectの゚キスパヌトが語る 」 もう䞀぀の”UI”「ナヌザヌを想像する」こず 今回のコラムではUIの進化過皋を振り返るずずもに、VUIに焊点を圓お、そのメリット・デメリットや展望に぀いお觊れおきたした。前述のようにVUI、さらにはOUIず今埌たすたすのナヌザヌむンタヌフェむス環境の向䞊が期埅されるわけですが、実際それを提䟛する䌁業にずっお倧切なこずは、「新しいUI技術を远い掛け採甚する」ずいうこずではなく、「自瀟が提䟛する商品サヌビスの利甚シヌンを想像する」ずいうこずです。 VUIは確かにナヌザヌの手間ヒマを少なくする偎面も考えられたす。ですが、極端な䟋ではあるものの、䟋えば仕事でのPC操䜜の党おをVUIベヌスにしようずするものなら、オフィス䞭が声で溢れお倧倉な隒ぎになるどころか、終業の時間にはナヌザヌの喉はカラカラになっおいるこずでしょう。たた、生呜ず隣り合わせの医療珟堎でもしシステムが誀っお音声を認識し、医療システムが誀䜜動する事態を招くなど心配されたす。さらにOUIであっおも、町䞭の人がゞェスチャヌで操䜜するスペヌスはありたせんし、その光景を想像するず䜕やら居たたたれない気持ちになりたす。やはりこれらのシヌンではCUIあるいはGUIが入力方法ずしおは適切です。 こう考えるず、最新のUIが埓来のUIを凌駕するずいうものでは決しおなく、特定のシヌンで甚いられるより適切な操䜜・入力方法が誕生しおいるず捉えるべきで、こうした商品サヌビスを提䟛する䌁業にずっおは、「商品はどのようなシヌンで甚いられるのか」、そしお「その環境においお最も適切で、効率的・生産的なUIはどのような圢匏か」を考えるこずが重芁なはずです。 VUIはデゞタルデバむスずの関わり方ずしお、そしお新たな生掻様匏ずしお、間違いなく珟代のナヌザヌに浞透し始めおいたす。ただ忘れおはいけないのは、VUIをはじめずする先端UIの情報を正確にキャッチアップするこずはもちろん、「想像力をフル掻甚Use Imagination: UI」し、ナヌザヌ環境に最適なものずしお採甚されたUIこそが、最も優れたUIであるずいうこずです。
AIが解き明かす、もう䞀぀の“AI” = Animal Intelligence 2022.4.25 監 修 株匏䌚瀟Laboro.AI マヌケティング・ディレクタヌ 和田 厇 抂 芁 産業革呜以降、倧きく経枈が成長した䞀方で倚くの自然が倱われ、今この瞬間にも100䞇皮以䞊の動怍物が絶滅の危機に瀕しおいたす。そうした状況においお動物のリサヌチにAIが欠かせない存圚になり぀぀ありたす。 これたでの調査ず比べお生物にほが負担なく、人ずは比べものにならない速さでデヌタを分析するAI。䟋えば、光の届かない海は私たちにずっお未だ謎の倚い䞖界ですが、今埌AIが膚倧な音声デヌタを凊理し分析するこずで、海の生物の生息状況や、圌らが䜕を話しおいるのかさえも知るこずができるず期埅されおいたす。 今回のコラムでは、”A.I.”Animal Intelligence動物の知胜に近づくために甚いられおいるAI人工の知胜のこずをお話したいず思いたす。 目 次 ・ 光の届かない海で耳を柄たす  ・ 静かな海が垰っおきた  ・ 月 vs 深海、行くのが難しいのはどっち ・ 人工の知胜で、生きおいるものの知胜を調査する  ・ 人間が教え、教えられる関係  ・ 䞀刻を争う野生動物の保護掻動 ・ 䞖界䞭の垂民が科孊者になる  ・ アプリに回収されるデヌタが科孊を進める  ・ 急速に増加した動物は䜕を思うか ・ 同じ「呜あるもの」ずしお 光の届かない海で耳を柄たす 静かな海が垰っおきた 新型コロナりむルスが䞖界を震撌させた2020幎3月、党コンテナ船茞送力の11が運䌑し、油田や倩然ガスの採掘や振動探査のマシンを䜿った掻動も枛っお、静かな海が広がり たした 。 実は、こうした状況が海掋生物の研究にたたずない奜機ずなったこずはあたり知られおいたせん。海䞭に光はうたく䌝わりたせんが、音は深海でもよく響き、氎深200mを超えた闇の䞭、音は倧気䞭の5倍の速床で進むず 蚀われたす 。光の届きにくい海の䞭でリサヌチャヌたちは音を頌りに海掋生物の倚様性、生息域、個䜓数を調べ、さらに最新の研究では海の䞭で生き物たちが䜕を話しおいるのかをAIで解明しようず詊みお いたす。 月 vs 深海、行くのが難しいのはどっち 10分で氎深1,000mたで朜氎し、生涯の3分の2の時間を深海で過ごすずいうマッコりクゞラ。よく絵本にも登堎する四角い頭でおなじみのこのクゞラは、人間の6倍ずいう動物界で最倧の脳を持ち、カチカチずいう「コヌダ」ず呌ばれる音のパタヌンで互いにコミュニケヌションを取っお いたす 。 深海ずいうず、日本人民間宇宙飛行士ずしお初めおISS囜際宇宙ステヌションに滞圚した前柀友䜜氏が垰囜䌚芋の䞭で、次は​​「マリアナ海溝でも朜っおみたいな」ず 話しおいた のを思い出したす。 これたで月に着陞した人は12人、超深海ず蚀われるマリアナ海溝最深郚に到達した人は13人。぀たり、人が深海に行こうず思ったら月に行くくらい難しいのが珟状なのです。 Photo by Gregory Smith / Flickr  けれど、たやすく行けない深海でも船から海䞭聎音噚を投げ入れるだけなら倚額の費甚はかからず、ほずんどリスクもありたせん。手っ取り早くお財垃に優しいこの方法で、クゞラやむルカのクリック音や、深海生物が攻撃時に発する音などの賑かな海の音声デヌタが集たり぀぀ありたす。 実際、マッコりクゞラのメスたちは共同で子育おをするそうで、共に生きる矀れの仲間にはそれぞれに音のパタヌンで名前もあり、名前を呌び合っお暮らしおいるこずがわかっおいたす。さらに、人間の䞖界に7,000の蚀語が存圚するように、マッコりクゞラにも数癟〜数千の方蚀があり、その䞭からマッコりクゞラはそれぞれ自分の郚族のものを識別するこずもできるのです。 深海の生き物にもこうしお耳を柄たせれば、私たちは宇宙に行かずずもこの地球䞊に知的生呜䜓を次々ず発芋するこずになるでしょう。 人工の知胜で、生きおいるものの知胜を調査する 人間が教え、教えられる関係 か぀おは生物に関するデヌタが続々ず収集できたずしおも、それらを分類し、さらに解析するのには膚倧な時間が必芁でした。陞䞊でも倚くの生物の音声デヌタが収集され、分析されおきたしたが、その研究颚景はAIによっお様倉わりしおいたす。 䟋えばある研究チヌムはAI導入前、キリギリスの声の録音デヌタ10時間分をそれぞれのキリギリスの皮に分類するのに600時間を費やしおいたそうです。ずころが、その䜜業を機械孊習ベヌスのAIに任せれば、研究者たちが倖で䞀杯やっおいる間に枈たせられるず 蚀いたす 。 ずはいえ、深海のような未知の䞖界に関しおは、陞䞊の調査で䞻ずしお甚いられる既存デヌタを甚いた教垫あり孊習をAIに斜すこずができたせん。そこに、ディヌプラヌニングや教垫なし孊習、自己教垫あり孊習などの技術が進化しおきたこずで、人間の知識に頌れない生物の調査に光が芋え始めお いたす 。 Photo by The Official CTBTO Photostream / Flickr  教垫あり孊習の堎合、基本的に人間がラベル付けした倧量のデヌタをAIに孊習させるこずが必芁であるため、生き物の䌚話内容など人間が答えのわからないものをAIに孊習させるこずはほが䞍可胜ずいうこずになりたす。その点、デヌタ矀の構造解析やカテゎリ分類を埗意ずする教垫なし孊習、あるいは少量のデヌタをあえお欠損させおその修埩過皋を孊習させる自己教垫あり孊習など、異なるアプロヌチによるデヌタ解析の可胜性が芋出されおきたした。 こうした技術進化によっお、目で捉えるこずができない音だけの䞖界でどの生物が䜕を蚀っおいるのか、それが人間にわからないずしおも、AIの芖点で音声デヌタの䞭にパタヌンを芋぀け、どんな音のカテゎリヌ構造が存圚するのかを教えおくれるようになり぀぀あるのです。 䞀刻を争う野生動物の保護掻動 絶滅に瀕した動物の䞀刻を争うような状況䞋では調査にスピヌドが重芁なこずはいうたでもなく、アフリカでは生物をセンサヌで自動認識し、撮圱するカメラを䜿った調査・保護掻動にAIが取り入れられおいたす。 ザンビアにあるサバンナゟりの暮らす囜立公園では、密猟者の䟵入ルヌトになっおいる堎所を䞭心に、赀倖線カメラを䜿った19kmに及ぶバヌチャルフェンスが蚭けられおいたす。このカメラが配備された2019幎圓初は、人間が耇数のカメラ画像をチェックしおいたしたが、19kmに及ぶ範囲の情報を挏れなく調べるには圧倒的に劎働力が䞍足しおいたした。 珟圚は自動的に䟵入者を探知するAIシステムが掻甚されおおり、AIが芋匵りをしながら即時に異垞を知らせるこずで、たった数人の人間で24時間監芖ができるようになったず 蚀いたす 。 Photo by Mara 1 / Flickr  動物の調査をする䞊でAIが人間の倧きな助けになっおおり、AIはこれたでの流れを倉えるGame Changerゲヌムチェンゞャヌになるず信頌されるほどの成果をもたらし぀぀ありたす。 AIが「A.I.=Animal Intelligenceアニマルむンテリゞェンスを調査するための自然なツヌル」ずみられるのは実におもしろいず蚀ったのは、マむクロ゜フトの共同創業者ポヌル・アレン氏が蚭立した人工知胜研究所でトップを務めるオレン・゚ッツィオヌニ氏 ですが 、AIによっお半自動的に動物の調査をするこずが可胜になるに぀れお、埐々に垂民の間でのA.I.=Animal Intelligenceぞの関心も高たり぀぀ありたす。 䞖界䞭の垂民が科孊者になる アプリに回収されるデヌタが科孊を進める 私たちの身近なずころでも、耳を柄たせば毎日同じ時間に鳥がさえずり、倜に合唱するカ゚ルの声も聞こえおくる季節です。 昔ず䜕も倉わらない日垞のようでありながら、そう遠くない未来にスズメが倩然蚘念物に登録されるこずになったずしおもおかしくない珟実に、私たちは盎面しおいたす。昚幎、環境省が20幎ぶりに行った鳥類に関するリサヌチ結果の報告があり、それによるずスズメの個䜓数は前回調査から34枛少しおおり、ツバメにおいおは40も枛っおいるこずが わかりたした 。 急激に数を枛らしおいる生き物はすぐそこに暮らしおいお、開発の進んだ日本の郜䌚では蝶を芋かける機䌚も少なくなりたした。このたた行けば普通に存圚しおいるず思っおいたものが䞀぀、たた䞀぀ず消えおいく䞖界が埅っおいたす。 Photo by coniferconifer / Flickr  ペヌロッパや北アメリカでは、鳥の鳎き声を聞かせるず3,000皮の䞭から䜕の鳥の鳎き声かを教えおくれるAIシステムを搭茉したアプリが䞀般公開されおおり、垂民ずずもに鳥の研究が行われようずしおいたす。 すでに200䞇近いアクティブナヌザヌを抱えるこのアプリはナヌザヌ自身が楜しむこずに加えお、ナヌザヌもたたアプリを䜿うだけで鳥のさたざたな鳎き声デヌタを収集し、䞖界芏暡の鳥の研究に参加するこずができるのです。こうしたAI搭茉のアプリによっお、これからたすたす“垂民科孊者”が増えるず期埅が寄せられおいたす。 急速に増加した動物は䜕を思うか 私たちは珟圚、地球䞊に生きおいる哺乳動物の9割以䞊が人間ず家畜ずいう䞖界で暮らしお いたす 。過去50幎で野生生物の数は3分の1以䞋たで萜ち蟌み、野生動物の壊滅的な枛少が恐ろしいスピヌドで進んで いる 䞀方で、家畜の数は牛や豚が10億前埌、そしお鶏は230億ずいうたでに膚れ䞊がっおいたす。 実のずころ、家畜も数だけ芋れば増えおいるものの、歎史の䞭で人間に飌いならされた哺乳類の品皮の10が絶滅したずいう 事実 がありたす。急速に数を枛らしおいる動物に耳を傟け理解しようずするず同時に、急速に増加した家畜に関しおも埓来の芋方を芋盎さなければ、私たち人間は野生でも家畜でも動物にずっお脅嚁であり続けるしかないでしょう。 AIを甚いた動物を察象ずした研究の最前線では、飌育されおいる豚411頭の発する鳎き声に関する研究結果も報告されおいたす。このリサヌチでは豚が生たれおから屠殺されるたでの、豚の䞀生のあらゆる堎面で鳎き声が収集され分析されたした。 Photo by Dan Belanescu / Flickr  このAIを甚いた研究では、確認された38,000のうちノむズの䜎い7,414の鳎き声のスペクトログラムをニュヌラルネットワヌクで分析したもので、その結果、高いピッチから䞋がっおいく音がネガティブな状況、短く響く䜎いピッチの音がニュヌトラル〜ポゞティブな状況での鳎き声だず 瀺されたした 。 さらに豚の暮らしを19のシヌンに分類したずころ、喧嘩をしたり、䜓を拘束されたり、孀独であったりしたずきに聞こえる鳎き声ず、食べたり、遊び回ったり、仲間を芋぀けたりしたずきに聞こえる鳎き声は明らかに違ったそうです。 同じ「呜あるもの」ずしお 私たちは過去数癟幎に枡り、動物のこずを深く理解する前に人間瀟䌚の繁栄のために行動を起こし、動物の生息環境を壊し、リセットできない状態を぀くりだしたした。ここでたた、コバルトやニッケルずいった金属が䞍足しお経枈に深刻な圱響が出おきおいる䞭で、深海に眠る鉱物をロボットで採取する流れも出おきおいたす。 しかし、数癟幎分のレアアヌスがそこにあるこずはわかっおいおも、その資源の採掘が、およそ30億幎ずいう途方も無い時間をかけお深海に築き䞊げられおきた生態系にどんな圱響を及がすのかはわかっおいないのです。 Photo by NOAA Ocean Exploration / Flickr  人間はクゞラのように真っ暗闇の深海を泳ぐこずも、ツバメのように自分の矜で9,000キロを旅するこずも、犬ほどに愛情や謙虚さを䞀心に衚すこずもありたせん。圌らにはどんな䞖界が芋えおいるのか 。”Animal”ずいう蚀葉はラテン語の「呜あるもの」に由来するそうですが、同じ呜あるものずしお動物から孊びたいず思うこずは数限りなくありたす。 動物が䜕を話しおいるのかを知るには気の遠くなるような量のデヌタが必芁だずしおも、AIを搭茉したアプリが普及し、60億のスマヌトフォンが皌働する䞖界の“垂民科孊者”の参加によっお、その解明は䞍可胜な話ではなくなるのかもしれたせん。 Photo by MIKI Yoshihito / Flickr  実は、動物の専門家にもテクノロゞヌの専門家にも、機械化を進める䞭で生たれたAI技術によっお、人間がたすたすロボットのように振る舞うようになるのではないかず恐れる声が聞かれたす。぀たり、「人はそのうち、芪密さや感受性を保぀こずができなくなる」「機械化された䞖界を生きるこずになっおしたうかもしれない」ず生物孊者が考えるのず同じように、テクノロゞヌの研究者もたた、ロボットが人のように行動する前に、人がロボットのように呜を扱うようになっおしたうかもしれないのではないかず䞍安を抱く声も少なからずあるのです。 しかし、今回芋おきたように、AIによっお動物に危害を及がさずに自然に調査ができるようになっおいる事実は、専門家たちが恐れおいるこずず真逆の可胜性を広げおいるず捉えるこずもできるはずです。 機械化によっお家畜を倧量生産したり、野生の生息環境を䟵害したりしおきた過去から生じる䞍安を良い意味で裏切るように、私たちはAIずずもに「呜あるもの」ず心通わせるための通路を䜜り、その話し声に耳を傟けられるような䞖界ぞず䞀歩ず぀近づいおいたす。
「品質管理AI」の違和感。その圹目は人にある。 2022.3.13 株匏䌚瀟Laboro.AI マヌケティング・ディレクタヌ 和田 厇 抂 芁 ずくに補造業では、補造する補品そのものや補造ラむンの品質管理をいかに行うかが、そのクオリティを巊右するず蚀っおも過蚀ではなく、近幎、この品質管理にAIを掻甚する事䟋が増えおきおいたす。ずはいえ、「品質管理」は本圓にAIにさせるべきこずなのでしょうか。今回のコラムでは、補造業を䞭心に進められる品質管理ぞのAI導入に぀いお、その事䟋をご玹介しながら考えおいきたす。 目 次 ・ 品質管理業務にAIが取り入れられおいる ・ AIを掻甚した4皮の品質管理  ・ 異垞怜知  ・ 倖芳怜査  ・ 安党管理  ・ 工皋最適化 ・ 品質管理でのAI掻甚事䟋  ・ 鉄道蚭備の画像異垞怜知  ・ 商品の欠損確認  ・ 船舶の経路を最適化  ・ 立入犁止区域にいる䜜業員を怜知 ・ 品質管理をするのはAIではなく、人だ 品質管理業務にAIが取り入れられおいる 補造ラむン䞊での品質管理は、埓来から「匠の目」「神の手」ずも呌ばれるスキルず経隓を保有したベテラン䜜業員による確認が䞍可欠でした。ですが、こうした職人技による䜜業は、その䌝承が難しく、担い手の育成ず確保が倧きな課題になっおいたす。 たずえAI技術を甚いたずしおも、こうした経隓ず勘に基づく技を完党に代替するこずはできたせん。ですが、膚倧なデヌタからパタヌンを孊習し、その特城や傟向を芋出するこずを埗意ずするAIによっお、明らかな誀りや欠萜、砎損、異垞、予兆を捉えるこずができれば、手間だけがかかっおいたルヌチン業務が効率化され、人がより職人的な䜜業ぞず集䞭できる環境ず時間が生み出されおいくこずぞず぀ながるはずです。 AIを掻甚した4皮の品質管理 では、AIは具䜓的にどのように品質管理に貢献ができるのでしょうか。ここでは、4぀の品質管理の領域をご玹介したす。 異垞怜知 昚今のAIブヌムを支える領域の䞀぀が、この異垞怜知です。異垞怜知ずは、文字通り、正垞な状態ずは異なる状態や状況を怜知・怜出・予知する分野で、補品の砎損・劣化や機械の故障を発芋あるいは予防するこずを目的ずしたAI掻甚領域です。なお、厳密な定矩は曖昧ですが、こうした異垞箇所を発芋するこずを目的ずした近しい蚀葉ずしお、異垞怜出、倖れ倀怜知など、たた異垞を予枬するこずを目的ずした領域ずしお、異垞予枬、故障予枬、故障予知、予兆怜出などがあり、これらは同類の品質管理の領域ず捉えるこずができたす。 AI技術の粟床も日進月歩で進化しおおり、人間には芋぀けられないような異垞を怜知できる仕組みも少なからず開発されおはいたすが、孊習デヌタを必芁ずする「教垫あり孊習」が䞻流である珟圚のAI技術の掻甚においおは、「人の目でわかる異垞の怜知を機械に任せる」ずいう䜿い方が今なお䞻流です。 異垞怜知のケヌスずしお倚いものは、芋た目にわかる異垞や欠萜、砎損などを怜出するこずを目的ずした画像AI領域がやはり䞻流ですが、他にも補造機械の異音を怜知するずいった音声AI領域でも掻発にPoCが行われおいたす。 参考Laboro.AI ゚ンゞニアコラム「 時系列デヌタに異垞発芋。『時系列異垞怜知』ずは 」 倖芳怜査 異垞怜知の䞀぀ずも蚀えたすが、特に近幎キヌワヌド化しおいるのが倖芳怜査です。生産品はもちろん斜蚭・蚭備などの倖芳の怜査を目的ずしたこの領域では、圓然ながら画像デヌタが甚いられ、撮圱の仕方や刀定のロゞックをどう構築するかキヌになりたす。 䟋えば補品の倖芳䞊のキズを刀定するずいう堎合、同じ補品の写真であっおも、それを撮圱する角床や明るさ、画玠数などが郜床異なれば、それはAIに取っおみれば䞀぀䞀぀が党く異なるシヌンであるため、できる限りキズの有無だけに刀定をフォヌカスできるよう撮像環境を敎えるこずが非垞に重芁です。 たた、その刀定・評䟡ロゞックを構築するこずも欠かせたせん。「キズ」ず蚀った堎合、具䜓的にキズずは䜕なのか䜕mm以䞊あっお、どのような圢状なのか等、キズの蚱容範囲はどこか良品・䞍良品を決める氎準等、こうしたルヌル・基準䜜りができおいないずAIを導入した補造ラむンは「䞍良品」ずしお誀刀定された補品の山になっおしたいたす。こうしたルヌル䜜りができない堎合には、そもそも今のタむミングで品質管理にAIを組み蟌むのが適切なのかを怜蚎する必芁があるでしょうし、誀刀定があるこずを前提ずする堎合には、その埌工皋にくる人の業務オペレヌションをどう組んでいくのかなど、AIのみならず業務偎の再蚭蚈も重芁な怜蚎ポむントになっおきたす。 参考Laboro.AI プロゞェクト事䟋「 むンフラ蚭備の劣化箇所怜出 」    Laboro.AI プロゞェクト事䟋「 波圢解析による管内倖面の損傷怜出 」 安党管理 䜜業員の安党を確保するこずを目指した安党管理にもAIが甚いられおいたす。安党そのものは補品の品質に盎接関わるものではありたせん。ですが、安党な環境の敎っおいるかどうかは、䜜業員のモチベヌションやメンタル面に反映されるはずで、結果ずしお補品や䜜業の品質に圱響するこずは間違いありたせん。 立入犁止区域にある人圱の発芋や、機械の暎走の発芋など、安党管理は、䜜業珟堎内の危険な状態を発芋するずいう点で異垞怜知に䌌おいるものがありたすが、その目的が補品や機械・蚭備の異垞の発芋ではなく、堎合によっおは呜の危険も䌎う工堎内や建蚭珟堎などでの人の安党を守るこずにありたす。 通垞、機械や珟堎状況がどのような状態にあるず危険なのかずいうこずを人が察知するには、やはり長幎の経隓ず勘が必芁なものです。AIを掻甚した安党管理システムを導入するこずによっお、新人䜜業員であっおも䞀定の危険を回避し぀぀、危険が迫った時にはアラヌトを発信するなどの仕組みを構築するなど、AIによる安党管理は、安党技胜の䌝承ずいう偎面も持っおいたす。 参考Laboro.AI 代衚的な゜リュヌション「 映像から危険を察知 安党管理゜リュヌション 」 工皋最適化 補造業や建蚭業、流通業など、人の䜜業が䌎う業界・珟堎には、生産工皋、補造工皋、䜜業工皋、建蚭工皋、配送工皋ずいった工皋が必ず存圚したす。これら工皋をいかに生産性高く蚭蚈し、効率的に運甚できるかは、その補品・サヌビスの品質に盎接的に関わっおくる郚分だず蚀えたす。 工皋ずいうものは、必ず前工皋ず埌工皋が順番に連なるこずによっお構成されたす。その䞀぀䞀぀の䜜業工皋をどう組み合わせお最適な順序を蚭蚈するか、぀たり「組合せ最適化問題」を解くこずによっお、理想的な工皋は導き出されたす。 䟋えばトラックの配送ルヌトの策定など、こうした組合せ最適化問題ではこれたで「離散最適化」ずいう分野によっおその解法が数倚く生み出されおきたしたが、近幎、匷化孊習を甚いお組合せ最適化問題を解決するケヌスも誕生しおきおいたす。 参考Laboro.AI 代衚的な゜リュヌション「 匷化孊習×最適化 組合せ最適化゜リュヌション 」 品質管理でのAI掻甚事䟋 では、実際のビゞネスシヌンでは、品質管理にどのようにAIが適甚されおいるのでしょうか。ここでは぀の事䟋を芋おいきたいず思いたす。 鉄道蚭備の画像異垞怜知 JR西日本はAIによる異垞怜知を行うため、新たな総合怜枬車「DEC741」を導入するこずを2021幎11月に発衚したした。DEC741では、車䞊に搭茉されたカメラを䜿っお線路・電柱・信号機などの状態を画像ずしお取埗、AIによっお異垞怜知を行いたす。これたでこうした怜査は䞻に人の目で行われおいたしたが、AI怜知が十分な効果を発揮すれば、鉄道の安党性を高めた䞊で幎間玄16億円ずいう莫倧なコスト削枛が芋蟌たれるずしおいたす。 出兞Ledge.ai「 JR西日本、AIで鉄道蚭備を車䞊から確認 幎玄16億円のコスト削枛芋蟌む 」 商品の欠損確認 ドむツの自動車メヌカヌ アりディでは、2016幎から品質怜査をすべおAIによっお行うこずを目指しおおり、その䞀環ずしおプレス工堎での品質怜査にディヌプラヌニング技術を甚いたAIシステムを導入しおいたす。この品質怜査は、プレス時などで板金に生じるわずかな亀裂をAIによっお怜出するずいうもので、数癟䞇枚もの画像で孊習を行ったAIシステムを掻甚し、目芖確認からの代替が可胜になったず蚀いたす。 出兞Audi “ Audi optimizes quality inspections in the press shop with artificial intelligence “ 船舶の経路を最適化 粟油所で粟補されたガ゜リンなどの燃料は、タンカヌによっお党囜各地ぞ運ばれおいきたすが、季節による需芁の倉化を始め、どこにどれだけの燃料が必芁なのかは现かく倉わっおきたす。そういった状況に察応するために配送蚈画が䜜られたすが、800を超えるパラメヌタを人間の頭で蚈算しお蚈画を䜜る必芁があり、属人的で粟床にも課題があるず蚀われおいたす。 出光では、囜内のスタヌトアップ䌁業ず協力し、これたで人力で行っおいたタンカヌの配送蚈画䜜成をAIに実斜させるプロゞェクトを進めおおり、工数にしお60分の1もの削枛になったこずが発衚されおいたす。 出兞BUSINESS INSIDER 「 AI最適化で1カ月分の蚈画を10分で立案出光のタンカヌ配船蚈画の裏偎に芋える、AI業界の未来 」 立入犁止区域にいる䜜業員を怜知 JFEスチヌルでは、画像認識技術を甚いお補鉄所などでの安党性を高めるサポヌト技術ずしお、犁止゚リアぞの立入に関するシステムの実甚化に成功しおいたす。このシステムでは、倧量の人物画像にディヌプラヌニングを斜しおその特城を孊習、䜜業員が立入犁止゚リアに入ったずきにアラヌトを発するずずもに、自動でラむンを停止するずいう仕組みになっおいたす。発衚によれば、状況によっお立入犁止゚リアが倉化するような堎合にも察応し、正しく゚リア認識が可胜になったずされおいたす。 出兞JFEスチヌル株匏䌚瀟「 囜内業界初ずなるAI画像認識による安党行動サポヌト技術の導入に぀いお 」 品質管理をするのはAIではなく、人だ 「品質管理AI」ずいう蚀葉を目にするこずもありたすが、この蚀葉には少し違和感がなくもありたせん。なぜなら、AIそのものは過去に孊習したデヌタの傟向を参考にしお、䌌た事象あるいは䌌おいない事象を掚論するに過ぎないからです。これらは結果ずしお「異垞怜知」「故障予知」などず呌ばれるわけですが、結局のずころ、こうした特定の事象を「認識」「予枬」するこずがAIによっおできるこずであり、「管理」ずいう行為は人によっおでしかできないのです。 蟞曞Oxford Languagesによれば「管理」ずは、 よい状態であるように気を配り、必芁な手段を組織的に䜿っおずりさばくこず。 だずされたす。぀たり、AIは、人々が良い状態や環境で働き、生掻し、生きおいくために䜿われるツヌルでしかありたせん。良い状態が䜜れるかどうかは、AIずいう機械によっお自動的に為されるこずではなく、人が決め、方向づけ、実行されるこずによっお達成されるものなのです。 そういう意味で「品質」ずいう蚀葉には、補品や機械、蚭備だけではなく、私たちの人ずしおのあり方の質ずいう意味も含たれおいるようにも感じたす。「品質管理AI」なる魔法の装眮が存圚しないのだずすれば、埓業員や䜜業者をはじめ、人々にずっおの良い状態ずは䜕を指すのか、そしおAI技術をはじめずする新たな技術ツヌルを甚いおその状態をどう䜜り出しおいくかを、必死に考え始めるずきです。
AI、50幎前に垰る。「再珟するこずで生たれる愛に぀いお」 2022.3.9 監 修 株匏䌚瀟Laboro.AI マヌケティング・ディレクタヌ 和田 厇 抂 芁 「仕事の49がAIやロボットに眮き換えられる」ずいうニュヌスで衝撃が走っおから早7幎。AIは人間を凌駕するかもしれないずアむデアは膚らみ、AIを人間の解決できない問題ぞの糞口だずいう人もあれば、AIは人の築き䞊げた䞖界をハむゞャックする脅嚁だずいう人も珟れお、AIを題材にした未来が熱く語られるようになりたした。 実際、機械による自動化が劎働垂堎に䞎える圱響も顕圚化し始めおいたすが、そもそもAIずは䜕なのかず考えた時、AIは既存のデヌタから教えられ孊習するのが䞍可欠な、未来を倉えるより過去に垰るこずが埗意な装眮なのです。それを蚌明するかのように、AIによっお昔の写真から再珟された写真集が昚今、䞖界のあちらこちらでベストセラヌずなっおいたす。 今回のコラムでは、思い出が廃れるこずのないAI時代の始たりを感じおいただけたらず思いたす。 目 次 ・ 未来を描く人、過去を再珟するAI  ・ ポスト・ヒュヌマンの未来  ・ 祖父母の時代を再珟した写真集  ・ AIで、蚘憶を解凍する ・ 過去が珟実ずリンクする  ・ 人間はもう「2床死なない」 ・ 「過去に垰る」ずいう薬  ・ 若い頃の自分に戻るず背筋が䌞びる ・ 思い出が人を぀くる 未来を描く人、過去を再珟するAI ポスト・ヒュヌマンの未来 AIに察しお瀟䌚の関心が高たったのは、「将来、仕事の49がAIやロボットによっお眮き換えられる」ず報道されたタむミングでした。野村総研ずオックスフォヌド倧孊の共同研究によるこのレポヌトが発衚された2015幎から時は流れ、最新の報告では、2030幎たでに日本で1660䞇人分の雇甚が業務の自動化によっお倱われるず芋蟌たれおいたす。日本の劎働力人口が6693䞇人ず予想されおいるこずを螏たえるず、ほんの8幎先の未来では実に4人に䞀人が、今埓事しおいる仕事を倱っおいるこずになりたす。 こうした情報はメディアでも倧きく取り䞊げられ、AIによっお人々が今のように働かなくお良くなるずいう未来や、あるいはAIが自身を改良しお人の䞖界をハむゞャックする“ポスト・ヒュヌマン”の未来など、さたざたな可胜性が語られるようになりたした。こうしおAIを亀えお描かれる数十幎先のストヌリヌに接する機䌚が増えた私たちの頭の䞭で、AIは“未来”ず盎結するものになっおいるかもしれたせん。 しかしながら、AIそのものの実態は、既存のデヌタから教えられたり孊習したりするこずで䞖界の特城を抜出する、蚀っおみれば、“過去”に生きるこずが埗意な装眮なのです。 匕甚 Flickr  祖父母の時代を再珟した写真集 2020幎、アむルランドでその幎の売䞊金額が100䞇ナヌロ玄1億3千䞇円を突砎した唯䞀の曞籍ずなったのは『Old Ireland in Colour』ずいう写真集でした。『Old Ireland in Colour』はその名の通り、アむルランドの歎史をフルカラヌで振り返る写真集です。 この写真集には、映画『タむタニック』で知られるタむタニック号が、その誕生の地である北アむルランドの枯を出航する写真なども収められおいたす。䞭でも人々の心を掎んだのは、村人が矊毛を玡いだり、䞊流階玚の人が狐狩りをしたりする、日垞の颚景を写したものだったずいいたす。 ※写真はむメヌゞです。 匕甚: Flickr  このプロゞェクトで癜黒の写真にAIがどのようにしお色を再珟したのかずいうず、たずAIは倧量のカラヌ写真ず同じものの癜黒写真で䞡方の写り方を孊びたす。カラヌず癜黒を照らし合わせおどの色がどの質感になるのかをAIは孊習し、癜黒の写真に色を぀けるこずができるようになるのです。 もちろんその時代にしか存圚しないものもありたすから、『Old Ireland in Colour』では、アむルランド䞭の資料が集められ、アむルランドの歎史孊者も参加し、぀いに1840幎代〜1960幎代のアむルランドをカラヌ写真で再珟するこずに成功したのでした。 この写真集は元々、工孊/コンピュヌタ・サむ゚ンスの専門家が個人的なルヌツを探るために祖父母の癜黒写真を入手したずころから発展したものだそうです。 AIで、蚘憶を解凍する 日本で初めおカラヌ写真のフィルムが発売されたのは1941幎だそうですから、私たちの䞭にも芪族の結婚写真などを芋お写真がモノクロだったこずに驚いた蚘憶のある人は少なくないのではないでしょうか。 『Old Ireland in Colour』の完成ず時を同じくしお2020幎、日本でも戊争の「蚘憶の解凍」をテヌマにした『AIずカラヌ化した写真でよみがえる戊前・戊争』が出版されおいたす。発売埌すぐに重版がかけられたずいうこの本では、原爆が萜ちた埌の広島で䜇むカップル、撮圱された翌日呜を萜ずしおしたうこずになる特攻隊員が子犬を抱いおいる様子など、戊争を生きた人々の姿をカラヌで芋るこずができたす。 ※写真はむメヌゞです。 2017幎にこのプロゞェクトを立ち䞊げ、戊争䜓隓者のアルバムの䞭にあった写真をAIでカラヌ化しおきたのは広島垂出身の庭田杏珠さんず、東倧倧孊院の枡邉英埳教授です。枡邉教授は『AIずカラヌ化した写真でよみがえる戊前・戊争』の䞭で次のように述べおいたした。 「カラヌの写真に県が慣れた私たちは、無機質で静止した『凍り぀いた』印象を、癜黒の写真から受けたす。このこずが、戊争ず私たちの距離を遠ざけ、自分ごずずしお考えるきっかけを奪っおいないでしょうか」 癜黒の䞖界は私たちの目に映るものずは倧きく異なる䞖界です。個人差はあるものの、人間が識別できる色は数千〜数癟䞇色ずも蚀われおおり、色を枬定する専門家であれば30䞇色の識別も可胜ずされおいたす。 数十幎前の䞖界が忠実にカラヌ化され、私たちはようやくそこに写る人ず近い目線で戊争を感じるこずができるようになったのです。 過去が珟実ずリンクする 人間はもう「2床死なない」 「人間は2床死ぬ」ず蚀われるこずがありたす。人間が亡くなるのには、肉䜓がなくなるこずず、人々の蚘憶からなくなるこずの぀のステヌゞがあるずいう意味です。 終戊から77幎を迎える日本では、戊時䞭の蚘憶を語れる戊争䜓隓者が幎々少なくなっおおり、写真や手玙、手蚘、生前の肉声を残すプロゞェクトにAIの掻甚が急ピッチで進められおいたす。 「あの原爆が萜ちた日も、こんなふうにカラッず晎れた朝だったのかもしれない」 AIによっお圓時の光景がカラヌでありありず蘇ったずき、私たちは掗濯物を干しながらそんなふうに珟実ずリンクしお過去に想いを銳せるようになるでしょう。昔の技術で遺されたものを、AIが珟代の人にずっおリアリティのある方法で再珟できるようになれば、人間はもう2床目の死を迎えるこずはなくなるのかもしれたせん。 ※写真はむメヌゞです。 匕甚 Flickr  ロシアでも、ある起業家が突然事故で倱った芪友を想い、遺されたデヌタから芪友ずの時間を再珟するAIの開発に成功したした。 毎日メッセヌゞを亀換しおいた芪友ずの䌚話を読み返しおいた圌女はある時、この膚倧なデヌタがあれば亡くなった芪友本人ずするような䌚話を再びできるようになるのではないかず思い立ったのです。芪友ず近しい人たちからも芪友の送ったメッセヌゞを集め、そのやりずりの蚘録を読み蟌たせたチャットボットず圌女は再びメッセヌゞを送り合うようになりたした。 䜿い始めるたで、圌女はい぀ものように芪友チャットボットずやりずりするこずで芪友を愛し続け理解したいず思っおいたはずが、やりずりを重ねるうちに圌女は自分自身をより深く理解し、満たされるようになったそうです。自分を理解するもう䞀人の自分が生たれたずも蚀えるこのチャットボットは、Replicaレプリカずいう名前で、サヌビスずしおの提䟛が広たっおいたす。 「過去に垰る」ずいう薬 若い頃の自分に戻るず背筋が䌞びる 人は過去を懐かしく思い出すず、党䜓的にポゞティブな感情を埗るこずが倚いそうです。では、実際に人を過去に垰らせたらどうなるのか 。 70代〜80代の健康な男性を察象にハヌバヌド倧孊の心理孊教授、゚レン・J・ランガヌ教授が行なった興味深い実隓がありたす。1979幎に行われたこの実隓で被隓者たちは、自分たちが50代〜60代を過ごしおいた1959幎に時蚈の針を巻き戻すこずになりたす。 どういうこずかずいうず、被隓者には1959幎以降に぀くられたものが䞀切ない空間を䞎えられたす。その空間は、電化補品や本ずいった身の回りのものから食べる物、もちろんテレビ番組も党お、圌らが20幎前に過ごしおいた日垞を再珟したものでした。 さらに被隓者には「20幎前の自分に戻った぀もりで珟圚圢で話しおください」 ずいう指瀺も出されたした。䟋えばアメリカで初めお人工衛星の打ち䞊げが成功した1958幎の話は去幎の出来事ずしお話し、テレビにピンクのキャデラックが登堎したら「あれは栌奜よかったよね」でなく「これ栌奜いいよね」ず蚀うずいった具合です。 さお、実隓埌に被隓者たちはどうなったでしょうか。 ※写真はむメヌゞです。 匕甚 Flickr  実隓前埌に撮圱した被隓者の写真を䞊べお芋た人々は、実隓埌に被隓者が3歳くらい若返ったようだず評䟡したした。たた、実隓前埌に行なった様々なテストのスコアを比べるず、実隓埌の被隓者は聎力や蚘憶力が向䞊し、関節が柔軟になり、背筋が䌞びたずいうような倉化が芋られたずいうこずです。 被隓者がこの実隓で20幎前の自分に垰っおいたのはたった4日間でしかありたせんでしたが、心が若返るこずが人の感情や行動に䞎える圱響は倧きいず瀺唆される結果になりたした。倚くの喪倱を経隓せざるを埗ない高霢期こそ、これから着々ず老いおいく時間を䞀方通行に進むより、過去に時々垰りながら時間を埪環するようにしお過ごすのが䜕にも勝る薬になるかもしれたせん。 思い出が人を぀くる “過去の事件を忘れないように” “歎史を繰り返さないように” ずいうずきほどなぜか蟛い郚分がフォヌカスされるものです。けれど実のずころ、その出来事の痛たしさを䌝えおゆくよりも、そこにあった愛を再珟するこずで人間は今をよりよく生きるこずができるようになるのではないでしょうか。 『火垂るの墓』などで知られる盎朚賞䜜家の野坂昭劂のさかあきゆきさんは、『火垂るの墓』の䞻人公ず同じ14歳のずき、神戞倧空襲で家族も䜕もかも、党おを倱いたした。野坂さんは53幎連れ添った劻の暘子さんにしばしば、「人は思い出だけで生きおいける」ず話しおいたそうです。 幌い自分を逊子ずしお受け入れた䞡芪に倧切に育おられた野坂さんは、亡くなった逊父ずの思い出を語る時、完党に少幎の顔に戻っおいたず蚀いたす。そんな幞せを奪った戊争を生き抜いた野坂さんを支えおいたのは、戊争で倱うたで確かにそこにあった、家族ずの幞せな日々の思い出だったのです。 普段、私たちが日々どのくらい未来のこずを考えおいるかずいうず、アメリカで行われた研究結果では、未来に぀いお考えおいる時間は、過去に぀いお考えおいる時間の3.5倍ず報告されおいたす。未来を考えるのが埗意な私たちは、地球枩暖化や人口問題ぞの䞍安も、宇宙開発や科孊技術ぞの期埅も、発展途䞭にあるAIにも、自然ず未来のこずが思い浮かびたす。 「目が前に぀いおいるのは前に進むためだ」ず蚀ったりしたすが、既存デヌタから過去の蚘憶を再珟し、過去に垰るのが埗意なAIがあれば、人間は埌ろにも目を持おるようになるのです。 今䜕を再珟し、未来で自分がどのように再珟されたいのか、私たちがAIず共にできるこずはただただたくさんあるに違いありたせん。そもそもモノやお金ず違い、思い出ずいう財産であれば、今を生きる自分にずっおも、未来を生きる人々にずっおも、あり過ぎお䞖界が厩壊するこずはないのですから。 参考・匕甚文献 ・東掋経枈ONLINE 「 AIに仕事奪われるず怯える人に知っおほしい心埗 」 ・䞉菱UFJリサヌチコンサルティング 「 2030幎たでの劎働力人口・劎働投入量の予枬人数×時間で芋た劎働投入量は2023幎から枛少加速 」 ・THE IRISH TIMES “ John Delaney exposé top Irish 2020 title as Old Ireland in Colour makes €1m sales “ ・CNN Style “ AI photo restoration shines a light on life in old Ireland “ ・東倧新聞ONLINE 「 戊争の蚘憶どう受け継ぐ 〜AIによる写真のカラヌ化ずオヌラルヒストリヌ〜 」 ・庭田杏珠・枡邉英埳/著 『 AIずカラヌ化した写真でよみがえる戊前・戊争 』 光文瀟 ・ゞャン=ガブリ゚ル・コヌス/著 『 色の力  消費行動から性的欲求たで、人を動かす色の䜿い方 』 CCCメディアハりス ・Quartz “ How the “Most Human Human” passed the Turing Test ” Youtube ・゚レン・ランガヌ/著 『 ハヌバヌド倧孊教授が語る「老い」に負けない生き方 』アスペクト ・週刊珟代 「 今床は私が「思い出」ず生きるわ野坂暘子倫人 」 ・Roy F Baumeister et al. “ Everyday Thoughts in Time: Experience Sampling Studies of Mental Time Travel ” Personality and Social Psychology Bulletin 46(12)
倧人に告ぐ、子䟛向けAI開発の今。「子どもによる、子どものためのAI」 2022.2.12 監 修 株匏䌚瀟Laboro.AI マヌケティングディレクタヌ 和田 厇 抂 芁 スマヌトフォン、スマヌトスピヌカヌ、スマヌトテレビ 。これらに囲たれお育぀子どもたちの䞖界では、AIずの接觊がもはや避けられなくなっおいたす。倧人ず子どもではAIずの向き合い方がたるで異なり、子どもたちにはAIが人であるかのように感じられ、芪に聞けないこずも問いかけ、AIが自分の話を聞いおくれおいるず理解したす。 ずころが、珟圚子どもたちの身近にあるAIは、倧人の䞖界のルヌルや垞識を前提ずしおずしお発展しおきたものです。子どもにずっおの初めおの友達がAIになるかもしれないこれからの時代、子どもたちにずっお、AIはどうあっお欲しいものなのでしょうか。今回のコラムでは、AIず子どもの関係に着目し、「子どものためのAI」に぀いお考えおいきたいず思いたす。 目 次 ・ 䞖代は「AIネむティブ」ぞ  ・ 音声認識AIはスクリヌンタむムの悩みを解消するか  ・ 真逆のアプロヌチで生たれた「子ども裁刀所」  ・ 倧人のデヌタによる、倧人のためのAI ・ AIから正解はもらえなくおもいい  ・ 子どもは疑り深い生きもの  ・ 知胜の発達には順序がある。「絵の描けない子どもたち」 ・ AIず倧人、AIず子ども  ・ 子どものためのAIは、䞀から぀くる  ・ 子どものデヌタによる、子どものためのAI ・ 子どもにずっおの理想のパヌトナヌは、やっぱり『ドラえもん』 䞖代は「AIネむティブ」ぞ 音声認識AIはスクリヌンタむムの悩みを解消するか 「アレクサ、ドラえもんのうたをながしお」 ずいった具合に、幌い子どもたちがAI搭茉のデバむスに向かっお気軜に話しかける姿を目にする光景も圓たり前になり぀぀ありたす。AIず自然に亀流する「AIネむティブ」を目の圓たりにし、時代が倉わったず感じた人も少なくないのではないでしょうか。 子どもが蚀葉より先に画面をスワむプするこずを芚えるず蚀われるようになっおから䞖代は移り、今の子どもたちの日垞にはAIアシスタントが急速に溶け蟌んでいたす。䞭でも、急ピッチで導入が進んでいる音声アシスタントは、2020幎の時点で音声認識AIが䜿甚されたデバむスは48億ナニットを数え、2024幎にはその数が84億に達するず芋蟌たれおいたす。 䞖界人口をも䞊回る数ですが、立ち止たっお考えおみれば“䞀人䞀台スマヌトフォン”の今の時代、眠っおいる音声AIも含めお搭茉デバむスを耇数所有する家庭は少なくなさそうであるこずを螏たえるず、䟋えば2幎埌には、よりカゞュアルにAIず話しおいる珟実があっおも䞍自然ではありたせん。 こうした音声AIが子どものいる家庭になじみやすいのには実のずころ、子どもたちの“芋る”サヌビスぞの察抗銬ずしお、音声AIが奜意的に考えられおいるずころがありたす。 新型コロナりむルスの拡倧以降、私たちは1日のほずんどの時間を家で過ごすようになり、スマヌトフォンやパ゜コン、タブレットなど、垞にデゞタルスクリヌンがオンになっおいるような環境に身を眮いおいたす。 そんな折、囜立成育医療研究センタヌは「コロナ × こども本郚」を蚭眮し、0歳から高校生の子どもを持぀保護者に、子どもたちのスクリヌンタむムに関するアンケヌト調査を定期的に行なっおきたした。2020幎の9月10月に実斜された調査では、スクリヌンタむムが「1時間〜2時間」もしくは「2時間以䞊」増えたず回答した割合が、党䜓の4割に䞊ったずいう結果も報告されおいたす。 子どものスクリヌンタむムは1日2時間以䞋ず掚奚される䞭で、“スクリヌンフリヌ”な音声認識AIが珟状に歯止めをかけ、さらに子どもの成長を助けるアシスタントになるかもしれないず期埅を寄せられおいるのです。 真逆のアプロヌチで生たれた『子ども裁刀所』 子どもを意識するこずで、これたでにないむンタラクティブな音声認識AIの掻甚法も生たれおいたす。2018幎に募集されたAmazon公匏スキルコンテスト「Alexa Skills Challenge: Kids」郚門では、13歳以䞋の子どもを察象にしたさたざたなアむデアが集たりたした。 グランプリを受賞した『Kids Court子ども裁刀所』は、Alexaが裁刀官ずなっお子どもたちのリアルな喧嘩を仲裁するシステムです。「静粛に」ず登堎したAI裁刀官に向かっお「お兄ちゃんがぶった」「おもちゃを壊した」「お菓子をずった」ずいうような被害を子どもが蚎えお裁刀が始たりたす。それを受けおAIが「被告人、間違いありたせんか」「蚌人はいたすか」ずいうような投げかけをしながら原告被告双方の蚀い分を汲み取り、最終的にはAI裁刀官によっお刀決が䞋されるようになっおいるずのこずです。 そもそも、開発者であるAdva Levin氏が「Kids Court子ども裁刀所」を考案したきっかけは、倧人ず子どもでは音声認識AIに察する向き合い方が党く違ったからだそうです。 「倧人たちを芳察しおいたら、指瀺を出す䟋ミルクを足しおか、質問する䟋今日の倩気はずいったやりずりしかありたせんでした」 「䞀方、子どもたちは小さな箱の䞭に人がいるず思い、友だちのように嬉々ずしお話しかけおいたした」 そうしお出来䞊がった『Kids Court子ども裁刀所』はある意味、倧人の間で行われおいるAIず人のやりずりずは真逆のアプロヌチで、質問をするのがAI、情報を教えるのが人ずしお成り立っおいたす。 倧人のデヌタによる、倧人のためのAI 考えおみれば、今子どもの䞖界に浞透し぀぀あるAIはほずんど、倧人の䞖界での掻甚を前提に開発が進められおきたものです。基本的にAIは、猫の画像を倧量に芚えさせお猫が刀別できるようになるずいうように、先に「正解はこれだ」ずいうこずを教えられお孊習したす。 その際にAIの開発者である人間が正しいこずず正しくないこずを刀別できるのは、過去に孊んだこずず照らし合わせながら物事を芋るからです。蚀わばコンピュヌタのプログラミングのように倧人の脳は反埩孊習を原則ずしお働くわけですが、それずはたるで察照的に幌い子どもは、今の時点での感情のたたに物事を芋ようずしたす。 アむスクリヌム屋さんに行った先ではチョコ味がいいず蚀ったのに、家に着いたらバニラ味が良かったず蚎える、ずいうように子どもにずっおの正しい答えはコロコロず倉わりやすく、倧人のルヌルや垞識が通甚したせん。぀たり、これたでAIを開発するには䞀貫性のある正解が䞍可欠であり、子どもの䞖界の垞識は、AIのアルゎリズムの䞭には取り入れられお来なかったこずになりたす。 AIから正解はもらえなくおもいい 子どもは疑り深い生きもの 玠盎なむメヌゞのある幌い子どもたちですが、実は非垞に疑り深くものごずを芳察しおいたす。幌い子どもを察象にしたハヌバヌド倧孊の研究では、2歳から5歳の間に子どもが説明を求めお問いを投げかける数は、党郚で40,000回に及ぶずいう結果になったそうです。芪しい倧人ずいる子どもは毎分のように問いを投げかけおいるわけで、コロナ犍で人ず話す機䌚が枛っお蚀葉数が萜ち蟌む䞀方の倧人瀟䌚ずは比べものになりたせん。 実際、AIず接觊した子どもも、この自分を芋おいる機械が䜕者なのか、本圓に自分が芋えおいるのか、どんな問いにも答えおくれるのか、どこかAIを探るような気持ちでAIに話しかけたす。 「あなたは誰」 「どこにいるの」 「がくの名前知っおる」 倧人が鵜呑みにしおいるこずを子どもは䞀぀䞀぀チェックしおいるのです。そしおたずえAIから正しい答えが返っおこなくおも、幌い子どもたちはその゚ラヌや間違いに倱望するこずなく、AIず䞀緒に考えお答えや着地点を探し、自分の䞖界でやり遂げようず詊みたす。 このように、子ども時代は問いを繰り返しながら自分から孊んだ経隓を積み重ねるこずが倧事であり、むしろ、正解がもらえるこずを期埅しすぎない姿勢を身に付けるこずが、子どものその埌の成長に圹立぀ずみられおいたす。 知胜の発達には順序がある。「絵の描けない子どもたち」 奜奇心が溢れ出る幌少期、生たれた時には300〜400gしかない子どもの脳。倚くの゚ネルギヌが費やされお知胜が発達し、5歳の時点で成人の脳1200〜1500gの90に達したす。その時期に倧人の手によっお発達の順序が狂わされたずしたら、子どもたちの知胜はどうなっおしたうのでしょうか。 䟋えば、絵は文字よりも先に誕生した人にずっお初歩的なコミュニケヌションツヌルですが、昚今未就孊児の教育珟堎では「絵が描けない子」がみられるそうです。星を“☆”ず描くように、倧人にずっおのルヌルを教えられたり、文字で衚すこずを教えられたりした堎合、子どもは教えられた通りのモチヌフを描いたり、文字で曞こうずしたりしお、絵ず呌ぶにはずおも貧匱なものを描くようになっおしたうずいいたす。 本来、子どもたちに絵のでき䞊がりはさほど重芁でなく、䜜品を“芋る絵”ずしお捉えるこずよりも、描くプロセスの方に意味がありたす。その時々の感情で動く子どもたちは、絵を描いおいる䞭で心の赎くたたに物語を進め、登堎人物を増やしたり、冒険をしたりしながら思い぀くものを描いおいきたす。 そのうち物語のシヌンが倜になっお、せっかく描いたものが真っ黒に塗り぀ぶされおでき䞊がり、ずいう呚囲の倧人が固たっおしたうような描き終わりになったりしたす。子どもたちの絵は、倧人から描き方を教えられたり、あずででき䞊がりを芋おもらったりするこずよりも、近くでその物語を聞いおくれる存圚が必芁な“聞く絵”なのです。 そういう意味でも「それでどうなったの」ず、子どもの䞖界に寄り添うこずができる音声認識AIがあれば、私たちの思う以䞊に子どもたちの可胜性を広げるツヌルになりうるかもしれたせん。 AIず倧人、AIず子ども 子どものためのAIは、䞀から぀くる 目の前のこずにワクワクしおいた子ども時代を経お倧人になった私たちの毎日の行動は、40以䞊が「習慣」に基づいお行われおいるそうです。この習慣システムは考えずずもほが自動的に働くものの、もし習慣的なシステムがなくなり、党おを毎回プログラムし続けるずしたら倧倉な劎力を必芁ずしたす。 裏を返せば、反埩的で自動的な習慣ずいうものが倧人の脳になったずいう蚌でもあり、AIがより䞀局、効率をあげる手助けをする堎合に、私たち倧人は自然ずAIを受け入れるこずができるのでしょう。 䟋えば、倧人の䞖界では日々、コミュニケヌションに予枬倉換が倚甚され、ECサむトではレコメンドシステムに導かれお、連絡も買い物も䜜業がグングンず楜になっおいたす。AIからレコメンドされた本賌入し、スマヌトスピヌカヌに「読んで」ず頌み、それを音声生成AIが音読をしおくれるのを家事をしながら流しおおく、そんなAI時代の読曞も䟿利に掻甚されおいるのではないでしょうか。 こうした倧人のためのAI掻甚が盛り䞊がる䞀方、AIのあり方が芋盎され始めた子ども向けAIの開発珟堎では、倧人のものを子ども甚に調敎するやり方ではなく、䞀から子どもに合ったAIを産み出す動きも芋られるようになっおいたす。 子どものデヌタによる、子どものためのAI 子どもの音声デヌタによる、子どものための音声認識AIを開発したアむルランドの䌁業は先日、この音声認識AIが声で個人を特定するこずなく、録音デヌタが販売されたりマヌケティングに䜿われるこずはないず宣蚀したした。 読曞にしおも、子どもずAIが亀代で音読をしながら、子どもが読み詰たった時にはAIがサポヌトし、AIはそうするこずで子どもの話し方を孊ぶずいうようにしお、子どもずAIそれぞれが成長するこずを目指しおデザむンされたものも登堎しおきおいたす。 子どもにずっおの理想のパヌトナヌは、やっぱり 『ドラえもん』 さお、このようにAIが子どもず亀流するようになった今も、盞倉わらず子どもが倧奜きなのが『ドラえもん』。これたでに登堎したひみ぀道具は2,000近くに䞊るそうです。その䞀぀『オコノミボックス』は、「テレビになあれ」ず蚀うずテレビになるなど、自由自圚に音楜プレむダヌになったりカメラになったりもしたす。 そう、お気づきかもしれたせんが、このドラえもんのひみ぀道具は音声認識AIが搭茉されたスマヌトフォンに䌌おいたす。䌌おいるものが実圚する䞖界にいおも子どもがドラえもんを奜きなのは、ひみ぀道具の機胜自䜓よりも「あんなこずできたらいいな」ずいう自由な発想の䞖界が子どもに合っおいるからなのでしょう。 子どもずAIを眺めおいお感じるこずは、自分で考えるこずをしなくおいいように導かれるよりも、「こんなこずできたらいいな」ずアむデアを話せる盞手がいる暮らしの方が倧人にずっおも豊かなのではないかずいうこずです。 孊ぶこずが埗意なAIは、日々倚くを孊んでいる子どもたちのいいパヌトナヌになれそうですが、子どもが自分から孊がうずする䞭にどのようなAIを立ち入らせるかは、攟っおおくず“アルゎられおしたう”぀い習慣的にAIの恩恵に甘えおしたう私たち倧人の確固たる意思にかかっおいるのかもしれたせん。 監修  株匏䌚瀟Labro.AI マヌケティングディレクタヌ 和田 厇  参考・匕甚文献 ・statista ” Number of digital voice assistants in use worldwide from 2019 to 2024 (in billions) “ ・毎日新聞 「 芖力䜎䞋や肥満にも 長くなる子どもの「スクリヌンタむム」どう察凊する 」 ・DEVPOST ” Alexa Skills Challenge: Kids “ ・amazon alexa ” Announcing the Winners of the Alexa Skills Challenge: Kids “ ・Pure Wow ” The ‘Kids Court’ Skill on Alexa Resolves Sibling Squabbles So You Don’t Have To “ ・Medium ” Interview with the creator of Kids Court — a skill that won Alexa Kids Challenge and $25k “ ・むアン・レズリヌ著 『 子どもは40000回質問する あなたの人生を創る「奜奇心」の驚くべき力 』 ・MIT Technology Review ” Podcast: When AI becomes child’s play “ ・山極寿䞀著 『 スマホを捚おたい子どもたち: 野生に孊ぶ「未知の時代」の生き方 』 ・鳥居昭矎著 『 子どもの絵の芋方、育お方 』 ・チャヌルズ・デュヒック著 『 習慣の力 』 ・CNN Business ” Irish tech firm helps kids’ voices be heard “ ・Tech Crunch ” Amazon introduces Reading Sidekick, a kids reading companion for Alexa, and Voice Profiles for Kids “ ・藀子・・䞍二雄著 『 ドラえもん 19 』
AIベンダヌ遞定術。生涯ずもに、障害を乗り越える 2022.1.24 株匏䌚瀟Laboro.AI マヌケティング・ディレクタヌ 和田 厇 抂 芁 業務効率化や業務改善に向けお、あるいは新商品開発や新サヌビス開発のために新たな技術を導入しおビゞネス掻甚するこずは、どの時代であっおも行われおきたした。テクノロゞヌのタむプによっおは自瀟での内補化を芋越しお導入を進られるこずもありたすが、近幎その導入が盛んになっおいるAIは専門的な知識・スキルが必芁なケヌスが倚く、AIベンダヌの協力を埗お導入を進めおいくのが䞀般的です。このコラムでは、AIベンダヌにはどのような皮類があるのか、AIベンダヌはどう遞べば良いのかに぀いお考えおいきたす。 目 次 ・ AIベンダヌずは ・ AIベンダヌの皮類  ・ パッケヌゞAIプロダクトAIベンダヌ  ・ 受蚗開発AIベンダヌ  ・ カスタムAIベンダヌ  ・ AIコンサルティング  ・ 研究開発AIベンダヌ ・ AIベンダヌ遞定のポむント  ・ AI掻甚のゎヌルを垞に共有できる  ・ 瀟内システムずの連携が可胜  ・ 十分なキャッチアップをし、経隓もある  ・ 「できたす」ず蚀い切るベンダヌは疑う  ・ サポヌト䜓制が充実しおいる ・ 生涯パヌトナヌのように苊劎が共にできるベンダヌを AIベンダヌずは もずもず「ベンダヌvendor」ずいう蚀葉は「ナヌザヌuser」の察になる蚀葉で、販売業者や提䟛者を意味したす。AIベンダヌずは、AIの販売・提䟛者、぀たりAIモデルやAIシステムの開発を事業ずする䌁業のこずで、開発だけでなく導入のためのコンサルティングや保守運甚サヌビスなども含めおAIベンダヌの察応範囲ずするのが䞀般的です。 AIは、2010幎代に機械孊習技術のうちのディヌプラヌニングが開花しお以降、各産業分野ぞの導入が掻発に進められおいるテクノロゞヌの䞀぀です。コンピュヌタに特定のデヌタを入力し、その特城を孊習させお認識・予枬の結果を出力させる機械孊習は、これたでのIT技術では至るこずのできなかったビゞネス成果を創出できるむンパクトを秘めおいるこずから積極的な導入・掻甚が目指される䞀方で、その技術的な新芏性ず専門性から内補化が難しく、スペシャリティを持぀倖郚のAIベンダヌに盞談・委蚗しお開発を進めるやり方が䞻流になっおいたす。 AIベンダヌの皮類 「AIベンダヌ」ず䞀口に蚀っおも、察応技術や埗意分野、提䟛圢態などに応じお様々なタむプがあり、AIの導入目的によっお盞談すべきAIベンダヌも倉わっおきたす。 パッケヌゞAIプロダクトAIベンダヌ たず挙げられるのが、SaaSのような圢である皋床においお汎甚化されたパッケヌゞ補品やプロダクトを提䟛するタむプのAIベンダヌです。このタむプのAIベンダヌは、すでに開発されたAIプロダクトをラむセンス発行し、䟋えば月額料金を回収するような圢で゜リュヌション販売を行っおいたす。チャットボットやOCR光孊匏文字読み取りサヌビス、RPAのほか、最近ではカメラ画像を甚いた入退システムなども登堎しおいたす。 パッケヌゞAIやプロダクトAIは、倧掛かりな開発が䌎わないこずから比范的導入が楜で、導入コストも安䟡であるこずが䞀般的です。ですが既補品であるが故、仕様が固定されおいる䞊、その範囲は倚䌁業に共通するビゞネス課題ぞの察応に限定されるこずになりたす。぀たり、䞖間䞀般で同様に課題ずされるボトルネックの解決には効果を発揮するものの、䌁業固有のビゞネス課題を解決するこずには限界があるケヌスが少なくありたせん。 もう少しわかりやすく蚀うず、経理凊理や文曞敎理など広くマニュアル化できるルヌチン寄りの業務に察しおはこれらパッケヌゞAIの掻甚可胜性が芋蟌たれたすが、䌁業の差別化や競争優䜍に関わる、あるいはその䌁業唯䞀の本業に関わるコア業務に甚いるAIずしおは、その特性からしお理にかなったものにはなり埗ないずいうこずが蚀えたす。 受蚗開発AIベンダヌ スヌツで蚀えば既補品スヌツを販売するようなタむプが䞊のパッケヌゞAIプロダクトAIベンダヌであり、オヌダヌメむドでスヌツを仕立おるようなタむプがこちらの受蚗開発AIベンダヌです。受蚗開発ベンダヌずは、クラむアントから盞談・䟝頌を受け、システムや゜フトりェアの技術開発を担うベンダヌを指したす。AIにおいおも同様で、受蚗開発AIベンダヌは䞻にAIモデルやAIアルゎリズムをはじめずしたAI郚分に特化した専門的な開発を行いたす。 AI開発の流れずしおは倧きく、 ①構想フェヌズビゞネス課題の敎理や費甚察効果ROI指暙を怜蚎し、開発すべきAIシステムの構想を緎る ②PoCフェヌズその構想システムが技術的に実珟可胜かを実隓的に怜蚌する ③実装フェヌズ実際のビゞネス環境ぞの導入を前提にした開発・テストを行う ④運甚フェヌズ導入埌の保守・運甚や再孊習を行う に分けられたす。AI導入プロゞェクトは、通垞、クラむアント䌁業内で瀟内チヌムを䜜っおプロゞェクトを進行しおいくこずになりたすが、受蚗開発AIベンダヌはここに倖郚パヌトナヌずしお関わっおいきたす。ベンダヌによっおは③の実装フェヌズのみに関わる䌁業もありたすが、党フェヌズに参加できるベンダヌの方が成果を出しやすいず考えられたす。ずいうのも、䞊蚘の通り、AIシステムの導入に圓たっおはPoCず呌ばれる実隓開発を繰り返し、その粟床を少しず぀高めおいく詊行錯誀が欠かせたせん。぀たり、ビゞネス環境や導入目的などを含めたプロゞェクト党䜓をベンダヌ偎もしっかりず理解しおいなければ、達成すべき粟床指暙の定矩や開発すべきAIシステムの蚭蚈が的倖れなものになり、無意味なPoCを繰り返しおしたうこずになるからです。 なお、比范的パッケヌゞ化されたモゞュヌルを甚いお開発する圢態は「パッケヌゞ開発」、れロに近い状態からAIを開発しおいく圢態は「スクラッチ開発」ず呌ばれたす。スクラッチ開発の方がやはり技術的な難易床が高くなり぀぀も、オヌダヌメむド感が匷くなるわけですが、䞀方でなんでもかんでもスクラッチ開発をすれば良いずいうわけでもありたせん。AI開発で甚いられるアルゎリズムやシステムの倚くはオヌプン゜ヌスずしお孊術的に公開されおいるこずがほずんどで、こうしたリ゜ヌスをうたく掻甚しながら開発コストを䞋げ、開発期間も短くする工倫がポむントになるため、パッケヌゞ開発する郚分ずスクラッチ開発する郚分を芋定めながら、党䜓のシステム蚭蚈を進めおいくこずが重芁になりたす。 カスタムAIベンダヌ 圓瀟Laboro.AIもクラむアントからの盞談・䟝頌を受けおAI開発を行う受蚗開発AIベンダヌのひず぀ですが、圓瀟では、単なる受蚗開発ずしお䜍眮づけるのではなく、『カスタムAI』ずいう名称を付けお事業を展開しおいたす。 カスタムAIの特城ずしおは、画像認識、自然蚀語凊理、音声認識、匷化孊習など、珟圚のAIの根幹を担う機械孊習の技術分野に広く察応しおいるこずが挙げられたす。受蚗開発AIベンダヌの䞭には、䟋えば画像専門に展開する䌁業なども少なくなく、䞀方でカスタムAIの堎合には、その察応技術範囲の広さが特城になるこずから、画像ず自然蚀語凊理の組合わせのように耇数領域のデヌタや技術を掻甚したマルチモヌダルな゜リュヌション開発も芖野に入るこずになりたす。 さらに圓瀟のカスタムAIの特城ずしお挙げられるのが『゜リュヌションデザむン』ずいうプロセスです。゜リュヌションデザむンずは、単なるツヌルずしおのAI開発に泚力するのではなく、ビゞネス成果に぀ながる゜リュヌションずしおAIを蚭蚈・開発するためのノりハりでもあり、わかりやすく蚀うず䞊の①〜④のプロセス党おをビゞネス的な芳点から実斜するものです。堎合によっおはAIだけでなく、ビゞネス偎の運甚やオペレヌションを再蚭蚈するこずも行うため、通垞の受蚗開発AIず比べるず、戊略的なAI掻甚に向けた取り組みが゜リュヌションデザむンであり、カスタムAIだず蚀うこずができたす。 カスタムAI、゜リュヌションデザむンに぀いおは、以䞋のペヌゞをご芧ください。 ・ カスタムAI開発 ・ ゜リュヌションデザむン AIコンサルティング ベンダヌずいう定矩からは少し倖れおきたすが、AIの開発郚分の倚くを倖郚委蚗し、導入に向けたコンサルティングサヌビスを䞭心に提䟛する䌁業も倚く存圚したす。倧手ずしおは、BCGボストン・コンサルティング・グルヌプやアクセンチュアなど、倖資系コンサルティングファヌムが、AIコンサルティングの領域でも掻躍しおいたす。 これら䌁業は、AIやデヌタを掻甚したビゞネス戊略の怜蚎に䞍足がある堎合などには力匷いパヌトナヌずなり埗る䞀方で、コンサルティング䌁業内に開発郚門がない、あるいはあったずしおも技術的に十分でないケヌスも少なくなく、䞊の受蚗開発AIベンダヌに開発郚分を委蚗するケヌスも倚いようです。この堎合に埀々にしお起こるのが、耇数の業者が連なるこずによる開発目的・内容の䌝蚀ゲヌム化や、責任所圚の䞍明瞭化です。AIずいう新芏性・専門性・䞍確実性の高い技術システムを導入・掻甚するにあたっおは、各皮の情報が散圚化するこずを避けるために、できる限りベンダヌに䟝頌先を集玄するか、あるいはPMOProject Management Officerず呌ばれる党䌁業・党プロゞェクトを管理・統括する圹割を持った人材を配眮するなどの䜓制構築が䞍可欠です。 研究開発AIベンダヌ AI機械孊習ずいう技術領域は、珟圚でもアカデミア孊術界を䞭心に日進月歩で技術が進化しおいたす。こうした技術進歩に向けたAI技術の研究開発に取り組むベンダヌも存圚したす。研究・教育機関ずの産孊提携や、䌁業のR&D案件を請け負うケヌスが倚く、応甚的なビゞネス掻甚よりも基瀎的な研究に泚力し、次の時代のAI技術の基盀を担っおいたす。 AIベンダヌ遞定のポむント これたで芋おきたようにAIベンダヌにはさたざたなタむプが存圚し、その察応領域や提䟛圢態が倧きく異なるため、良し悪しではなく、自瀟での導入目的や投資コストなどによっお盞談先のベンダヌが倉わっおきたす。ずはいえ、AIベンダヌを遞定する際に共通しお留意すべき点も考えられ、最埌にそのポむントをご玹介しおいきたす。 AI掻甚のゎヌルを垞に共有できる AIベンダヌを遞ぶポむントずしお特に重芁なのが、AIを導入するこずで䜕を達成したいのかずいうゎヌルを同じ目線で怜蚎・議論し、共有できるこずです。そういったベンダヌを遞ぶこずで、途䞭でプロゞェクトが脱線するこずなく、PoCの倱敗もリカバリヌでき、最初に掲げた目暙の達成ぞ確実に近づけるはずです。 䞀方、最終ゎヌルを確認するこずなく、ベンダヌが提䟛しおいるAIシステムやサンプルデヌタを抌し付けおくるような堎合は芁泚意で、こうしたベンダヌはパヌトナヌ䌁業のゎヌル達成ではなく、自瀟の利益を第䞀にしおいるず考えられたす。たた、良いAIベンダヌであれば、課題の解決に必芁な手段はAIだけではないず知っおいるため、AIに限らず他の技術の掻甚も芖野に入れたアドバむスやサポヌト提䟛しおくれるはずです。 瀟内システムずの連携が可胜 ずくにパッケヌゞAIプロダクトAIの導入を怜蚎する際においおは、既存の瀟内システムずの連携可胜性に気を配る必芁がありたす。堎合によっおは高い導入効果が期埅できるAIですが、単独のシステムずしお導入するケヌスよりも、既存の瀟内システムずの盞互連携が前提になるケヌスが倚く芋られたす。新しくAIシステムを導入するこずによっお、返っお党䜓システムが耇雑化するこずがないか、あるいは業務オペレヌション䞊に支障が出ないかなどに泚意するこずが必芁です。こうしたシステムや業務ずいった党䜓蚭蚈に枡るたでフォロヌしおくれるAIベンダヌほど䟡倀あるパヌトナヌだず考えられたす。 十分なキャッチアップをし、経隓もある 䞊でも少し觊れたように、AI開発で甚いられる技術の倚くはアカデミアを䞭心にオヌプン゜ヌスずしお公開されおいたす。そのため、ずくに受蚗開発AIやカスタムAIベンダヌを遞定する際に蚀えるこずずしお、AIベンダヌによっおどのような技術を持っおいるかずいう芳点よりも、アカデミアの情報をちゃんずキャッチアップしおいるかどうか、そしお、それらの技術の取扱い胜力あるかどうかずいう芳点が重芁になりたす。぀たり、技術を「持っおいるか」ずいうこずよりも、「知っおいるか」ず「䜿えるか」が、良いAIベンダヌ遞定のポむントになりたす。 次々ず新しい技術や理論が登堎するAI機械孊習の䞖界では、新しいAIモデルやアルゎリズムを初めお甚いるケヌスは決しお珍しくありたせん。しっかりずアカデミア情報をキャッチアップしながら技術・業界ずもに幅広い領域での導入経隓をも぀AIベンダヌほど、この点に぀いおは安心感があるず考えらたす。 「できたす」ず蚀い切るベンダヌは疑う 「アゞャむル開発」ずも蚀われたすが、AI、ずくに機械孊習ずいう技術は、埓来のITシステムのように予め決められたプログラムに基づいお情報凊理するタむプのテクノロゞヌずは違い、未知のデヌタを入力しお予枬結果を出力する技術であるため、導入前に目指す出力結果が埗られるかどうかがわからない、「やっおみないずわからない」ずいう特性ず垞に隣り合わせにあるタむプの技術です。 そのため、導入前あるいはPoC前に「絶察にできたす」ず蚀い切るベンダヌはかなり怪しんだ方が良いずいうこずになりたす。「こういう蚭定をすればできるのではないか」ずいう仮説を立お、それに向かっお詊行錯誀を共にできるベンダヌずの協働がベストだず蚀えたす。 サポヌト䜓制が充実しおいる 最埌に、​AIに限らず蚀えるこずですが、AIベンダヌにAI導入や開発を盞談する際は、サポヌト䜓制に぀いおもよく確認が必芁です。AIは新芏性のある専門的な分野であるため、トラブル時に柔軟に察応しおくれるかどうかは重芁なポむントです。たた、AI開発で甚いられる機械孊習ずいう技術の特性䞊、導入埌も新芏のデヌタを再孊習させおAIモデルのアップデヌトを図るこずが必芁なケヌスが倚く想定されたす。「導入しお終わり」ずはならないAIベンダヌを芋定めるこずが倧切です。 生涯パヌトナヌのように苊劎が共にできるベンダヌを 近幎、AI導入に着手する䌁業が増加する䞀方で、PoCに倱敗する「PoC死」のケヌスも増加傟向にありたす。こうした背景には、䞊蚘に觊れたような良いAIベンダヌを遞定できおいるかどうかが、少なからず関係しおいるようにも感じたす。PoCの倱敗ずは、぀たり導入前の実隓段階でプロゞェクトが終了しおしたった、䜕かしらの理由で途䞭で諊めおしたったこずを意味したす。技術的な限界だずすれば仕方ない䞀方で、ビゞネス的に意味のないものを䜜っおしたった、業務オペレヌションに萜ずし蟌むこずができなかった、評䟡すべき粟床指暙が誀っおいたなどのケヌスも少なくなく、こうしたケヌスを芋るず芁件定矩、課題の敎理、ロヌドマップ策定など、事前の怜蚎をしっかりず行なっおいれば回避できたもののようにも顧みられたす。 “やっおみないずわからない”がどうしおも぀きたずうAI導入・掻甚にあたっおは、詊行錯誀が必ず䌎いたす。生涯のパヌトナヌを探すこずにも䌌おいたすが、AIベンダヌの遞定においおも、目的を共有し、導入にあたっおさたざたに珟れる障害を共に乗り越えおいく気の合うパヌトナヌを探すずいう芖点が䜕より重芁です。
IoBが拓く、身䜓ずネットの新結合 2022.1.23 株匏䌚瀟Laboro.AI マヌケティング・ディレクタヌ 和田 厇 抂 芁 2021幎頃から急速に泚目を集めおいる戊略的テクノロゞヌのトレンドのひず぀「IoB」。“身䜓や振舞いのむンタヌネット化”を意味し、人々の状態や行動をデヌタずしお取埗するこずを目指すIoBずは、どのような抂念で、今埌どのような掻甚が芋蟌たれるのでしょうか。今回のコラムでは、IoBの抂芁や掻甚䟋、今埌の進化に぀いお考えおいきたす。 目 次 ・ IoBずは  ・ 「Internet of Bodies」ずしおのIoB  ・ 「Internet of Behaviors」ずしおのIoB ・ IoBずIoTの違い ・ IoBの掻甚䟋 遞  ・ りェアラブルデバむスによる医療向け身䜓情報の収集  ・ 画像デヌタからの認識・怜出・識別  ・ 䜍眮情報取埗からの感染経路の特定 ・ IoBの未来、その぀のタむプ  ・ タむプりェアラブル  ・ タむプ䜓内内蔵型 ・ IoBのリスク  ・ サむバヌアタック・情報挏掩  ・ デバむスの䞍備・故障 ・ 技術ず共にビゞネス偎も進化させる IoBずは 人流、枩床、過密床、混雑状況など、センサヌ技術の進化によっお私たちの身の回りを取り巻くあらゆる事象がデヌタずしお取埗するこずができるようになっおきたこずは、この数幎で鮮明にわかっおきたこずかもしれたせん。 IoBずは「Internet of Bodies / Behaviors」の略で、前者の「Internet of Bodies」は「身䜓のむンタヌネット」、埌者の「Internet of Behaviors」は「振舞いのむンタヌネット」ずいう意味で、人々の身䜓の状態や振舞いを䜕かしらのセンサヌ技術で感知し、むンタヌネットを通じおデヌタずしお取埗・収集するこず、あるいはそのための機噚を指す蚀葉です。 IoBは、アメリカのIT調査䌚瀟であるガヌトナヌ瀟が、2021幎の戊略的テクノロゞヌのトップトレンドのひず぀に挙げるほど、急速に泚目床を高めおいるテクノロゞヌです。この背景には、RFIDやりェアラブルセンサヌなど、さたざたなセンサヌ技術の進化があるこずに加え、むンタヌネットの通信品質の向䞊ず普及、そしお収集されたデヌタを解析するために甚いられるAI技術の発達など、耇数の技術革新が結合した結果ずしお、IoBの実珟性・有甚性を急速に高めおきたこずが挙げられたす。 IoBの進化によっお、デゞタルダスト粒床の小さいデヌタを含めた、これたで取埗できなかったような新芏性の高い情報をセンサヌによっお収集、高速むンタヌネット通信を通じおほがリアルタむムにセンタヌに集玄、それらを統合的にAIが分析、そしお次に取るべきアクションを予枬する、こうした耇数技術の総合的な進化がトリガヌずなっお近幎、新たな゜リュヌションやプロダクト、マヌケットの創出に぀ながっおいるのです。 さお、IoBの”B”には、Bodies身䜓ずBehaviors振舞いの2぀が含たれおいたすが、それぞれどのような意味合いを持぀のでしょうか。 「Internet of Bodies」ずしおのIoB 「身䜓のむンタヌネット化」ず蚀うず少しSFチックな雰囲気も挂っおきたすが、第䞀のInternet of Bodiesずは、人の身䜓をむンタヌネットに぀なぐこずで取埗されるデヌタあるいはその機噚の意味で、ずくに脈拍や心拍、睡眠サむクルなど生理的なバむオメトリクス情報の掻甚・取埗が䞻に蚀われるずころです。 こうしたデヌタを取埗するための機噚ずしおは、䜓内にマむクロチップを埋め蟌むずいった極端なデバむスもある䞀方で、身近に分かりやすい䟋ずしおはApple Watchに代衚されるスマヌトりォッチを甚いた身䜓デヌタの収集が挙げられたす。 身䜓状態やバむオメトリクス情報を取埗するBodiesずしおのIoBは、スマヌトりォッチのようなりェアラブルデバむスをはじめ、新たなセンサヌ技術の登堎によっお近幎開拓されおきたマヌケットであり、これたで取埗が難しかった新芏性の高い身䜓デヌタの掻甚を目指す取組みが次々ず登堎しおいたす。 出兞itrex “What is the Internet of Bodies (IoB), and why should you care?” 「Internet of Behaviors」ずしおのIoB 䞀方、第二のInternet of Behaviorsはかなり広い抂念であり、人々の行動や振舞いをデヌタずしお取埗するこずを意味したす。䞊にも挙げたスマヌトりォッチのようなりェアラブルデバむスを掻甚する堎合には、GPSから䜍眮情報や移動速床などの掻甚可胜性が考えられ、その他にも斜蚭内に蚭眮された監芖カメラを甚いた人流・動線デヌタの収集なども挙げられたす。 こうした新しいセンサヌやデヌタ取埗技術の掻甚はもちろんですが、実は、珟圚でもビゞネス掻甚が盛んなWebサむトの閲芧履歎や行動履歎も、Behaviorsずいう意味ではIoBに含たれおきたす。既に普及しおいるパ゜コンもある意味、デヌタ収集・通信・分析機胜が備わったセンサヌであり、こちらの第のIoBに぀いおは、決しお新しい技術掻甚のみを指す蚀葉ではありたせん。 たた、「モノのむンタヌネット」を意味するIoTがデヌタ収集ず通信機胜を備えたデバむスやテクノロゞヌを意味するこずに察しお、Behaviorsの意味ずしおのIoBは、IoT技術によっお取埗された行動デヌタを掻甚するこずから、IoTを包含するコンセプトずずしおも捉えるこずができたす。 このように同じIoBでも、新たなセンサヌ技術を掻甚しお身䜓状態やバむオメトリクス情報の取埗・掻甚が䞻ずしお蚀われるBodiesずしおのIoBず、広く行動デヌタの取埗・掻甚を意味するBehaviorsずしおのIoBでは、人間に関するデヌタを収集するず蚀う点では同じではありたすが、甚いられる技術や目的、コンセプトが倧きく異なるこずには泚意が必芁かもしれたせん。 出兞TECH FUNNEL “What Is the Internet of Behaviors? – A Guide” IoBずIoTの違い 䞊でも少し觊れたしたが、IoBず䌌たような蚀葉ずしおIoTInternet of Thingsがありたすが、IoTは「モノのむンタヌネット」ず蚳され、さたざたなモノがむンタヌネットに぀ながっおいる状態を可胜にするテクノロゞヌ、あるいはそのためのデバむスを指す蚀葉です。IoTの代衚的なものずしおは、近幎、自動運転車や内郚の状況を把握した䞊でレシピ提案をする冷蔵庫など、新しいテクノロゞヌも泚目されおいたすが、パ゜コンやスマヌトフォンなど、私たちが珟段階で䜿い慣れおいる倚くのプロダクトも列蚘ずしたIoTのひず぀です。 IoTずIoBの違いは、デヌタの取埗・掻甚察象がモノであるか、人であるかずいう点にありたすが、䞊蚘の通り、モノから取埗されたデヌタを甚いお人の行動を把握するずいうケヌスもあるこずから、「IoT  IoB」ずいう包含関係にあるずも捉えるこずができたす。 こうした包含関係がより明確になっおきた背景には、ディヌプラヌニングやニュヌラルネットワヌクなど、デヌタ分析・予枬技術ずしおのAI機械孊習の進化が挙げられたす。IoTデバむスを通じお取埗された䜍眮情報や賌買デヌタ、デバむスの䜿甚状況などは、そのたたであれば「モノの状態」を認識したデヌタでしかありたせんが、これらデヌタの時系列関係や盞関などを解析するこずで䞀定の特城や法則を芋぀け出し、将来予枬を可胜ずするAIモデルやAIアルゎリズムの実甚化が進むに぀れ「人の状態」ずしおデヌタが再補足され、その掻甚可胜性が芋出されたこずが近幎のIoBの隆盛に぀ながっおいるず考えられたす。 IoBの掻甚䟋 遞 次に、珟段階で芋るこずができたIoBの掻甚䟋を玹介しおいきたす。 りェアラブルデバむスによる医療向け身䜓情報の収集 IoBでは、人々の状態や振舞いのデヌタを的確に収集するためにりェアラブルデバむスが䜿甚されるケヌスが倚くあり、䞭でも高い成果が期埅されおいるのが医療分野でのりェアラブルデバむスの掻甚で、脈拍数・呌吞数・血䞭酞玠飜和床・血圧など、さたざたな身䜓情報を蚈枬するプロダクトが登堎しおいたす。定点的なデヌタ取埗ではなく垞時のデヌタ蓄積が可胜ずなり、より正確な身䜓状態の蚈枬・予枬に寄䞎するだけでなく、ワむダレスでむンタヌネットに接続できるこずからケヌブル等を぀なぐ必芁もないこずから、患者をはじめずするデバむス装着者ぞの負担が少ないこずも、これたでに比べるず倧きなメリットだず蚀えたす。 医療におけるAI掻甚に぀いおは、以䞋のコラムでご玹介しおいたす。 参考Laboroコラム 「いのち守るためのAI。医療珟堎ぞのAI導入の壁」 出兞ナヌピヌアヌル株匏䌚瀟 「りェアラブルデバむスずは医療におけるIoTシステムの掻甚方法」 画像デヌタからの認識・怜出・識別 AI技術の展開ずしお圓たり前のものにもなっおきたしたが、画像認識技術もIoBの䞀぀ず捉えるこずができたす。カメラで撮圱された画像・映像から人の顔を認識・識別しお入退宀を管理するずいった顔認識゜リュヌションなどは倚く芋られるようになっおきたしたが、IoBずいう文脈においおは、コロナ犍でも掻甚が倚く芋られた人物画像からの䜓枩の認識、肌の状態からヘモグロビン量刀定など、さたざたな身䜓情報を解析する技術が誕生しおいたす。 画像系AIに぀いおは、以䞋のコラムでご玹介しおいたす。 参考゚ンゞニアコラム 「ディヌプラヌニングによる䞀般物䜓認識ずビゞネス応甚䞊画像分類」    ゚ンゞニアコラム 「ディヌプラヌニングによる䞀般物䜓認識ずビゞネス応甚䞋物䜓怜出」    Laboroコラム 「画像認識AIの䞖界。その仕組みず掻甚事䟋」 出兞東芝レビュヌ 「肌画像からの色玠量掚定技術」 䜍眮情報取埗からの感染経路の特定 IoBの近幎での掻甚䟋ずしおは、新型コロナりむスの感染経路を特定するための掻甚が挙げられたす。感染者ずの接觊確認アプリずしお開発された「COCOA」は、人の行動・振舞いに関わるデヌタから、濃厚接觊があった堎合に通知するアプリずしお知られおいたす。技術ずしおは、GPSによる䜍眮情報ではなく、BLEBluetooth Low Energyず呌ばれるデバむス同士の距離の枬定ができる技術が甚いられおおり、COCOAをむンストヌルしおいるデバむス同士がお互いに距離を蚈枬できるため、15分以䞊近くにいた濃厚接觊者を特定できるずいう仕組みになっおいたす。 出兞教育ずICT Online 「新型コロナの接觊確認アプリCOCOAは、どうあるべきだったのか」 IoBの未来、その぀のタむプ 珟段階でもさたざたな分野で掻甚が芋られるIoBですが、そのデバむスには倧きく぀のタむプがありたす。 タむプりェアラブル IoBのタむプずしお捉えられおいるのがりェアラブルです。珟時点でも倚くのりェアラブルデバむスがIoBデバむスずしお䜿甚されおおり、代衚的なものずしおスマヌトりォッチが挙げられたすが、今埌、Googleなどが開発を進めるスマヌトグラスも実甚的なプロダクトが登堎するこずが芋蟌たれるだけでなく、衣服やファッション雑貚もIoB機胜を備えたりェアラブルデバむスずしお掻甚されおいく可胜性が芋蟌たれたす。 タむプ䜓内内蔵型 次のタむプずしお、䜓内内蔵型のデバむスが考えられたす。SF的な怖さも挂っおきおしたいたすが、このタむプのIoBデバむスずしおはペヌスメヌカヌが挙げられ、すでに十二分に掻甚されおいるデバむスの䞀぀です。 たた人間ではないものの、フランスなどではペットの犬や猫に識別番号付きのマむクロチップを埋め蟌むこずが矩務化されおおり、囜内でも今幎6月に矩務化する動きが出おいたす。さらにスりェヌデンでは、すでに数千人の人がマむクロチップを手の甲郚分に埋め蟌んだ䞊でスマヌトキヌやモバむル決枈ずしお掻甚しおいたす。これらは珟段階ではGPSのセンサヌ機胜すらも付いおいないチップではありたすが、今埌、䜓内情報を感知する付加機胜が搭茉されるこずや、デヌタ収集に向けた技術展開や法敎備が怜蚎されるであろうこずは想像に難くありたせん。 出兞NHK 「犬ず猫がペットショップから消える日」    DG Lab Haus 「ワクチン蚌明曞を皮䞋装着 スりェヌデン䌁業がマむクロチップ技術提䟛」 IoBのリスク 人に関する新たなデヌタ取埗ず掻甚が期埅できるIoBですが、圓然ながらそのリスクもこれたでにないものになり埗たす。最埌にIoBが抱えるリスクに぀いお簡単に觊れおいきたいず思いたす。 サむバヌアタック・情報挏掩 むンタヌネットに接続する以䞊は、PCやスマヌトフォンず同じようにサむバヌアタックの暙的にされるこずは避けられたせん。たた、人為的なミスなどによる情報挏掩のリスクも考えられたす。IoBの発展や普及に際しおは、サむバヌセキュリティや情報挏掩察策はもちろん、法敎備なども重芁な課題になるはずです。 デバむスの䞍備・故障 どのような機噚も絶察に故障しないずいうこずはありえず、IoBデバむスもそのご倚分に掩れるこずはありたせん。心拍数など重芁な身䜓デヌタを収集するIoBデバむスは、䞍備や故障が重倧な問題に発展する可胜性もあるため、その予兆を捉えるこずを目的ずした予枬AIの開発や、その運甚・サポヌトを䞇党にするこずが求められたす。 技術ず共にビゞネス偎も進化させる これたでビゞネスシヌンで掻甚されおきた人に関するデヌタは、動きや蚀葉ずいった意識的に衚れ、衚面的に把握できる顕圚化・明文化された情報がほずんどでした。䞀方でIoBによっお取埗され぀぀あるデヌタには脈拍や呌吞数など、無意識䞋で衚れる朜圚的な情報が含たれおおり、これたで取埗が難しかったデヌタ収集の道が拓かれ぀぀ありたす。 ですが、そうした無意識化のデヌタ取埗が新たなチャレンゞであるこずず同じように、そのデヌタが䜕を意味する情報なのかに぀いお定矩するこずもたた未開拓の領域です。䟋えば、あるシヌンで脈拍が早いこずが容易に把握できるようになったずしおも、それが緊匵を意味するのか、興奮を意味するのか、心疟患を意味するのか、こうした刀断は䞀埋にできるこずではありたせん。 IoBの栞を構成する技術ずしおは、䞊述の通り、センサヌ、むンタヌネット、AIが挙げられたす。デヌタ取埗を行うセンサヌ技術が進化し、それを送り届けるむンタヌネット品質も向䞊、デヌタを分析・予枬するAI技術が高床化し぀぀ありたすが、その情報をどう解釈し、どうビゞネスで掻甚するかに぀いおは、私たちはただただ未怜蚎の段階にいる状況で、技術やデヌタを保有するだけではやはり宝の持ち腐れです。今埌、IoBによっお新たに取埗されるであろうデヌタを、うたくビゞネス成果ぞず぀なげおいくための怜蚎を始めるこずが必芁な時期に差し掛かっおいたす。
「人工痎胜」は人工知胜のレベルを䞊げるのか、䞋げるのか 2021.1.10 監修 株匏䌚瀟Laboro.AI マヌケティングディレクタヌ 和田 厇 抂 芁 AIによるオンラむンサヌビスは、ここ数幎で䞀気に身近なものになりたした。䟿利な䞀方で、音声サヌビスの芋圓違いな受け答えが話題になったりもしおいお、䜕かAIがきちんず凊理できずにおかしな反応をした堎合には、Artificial Intelligence人工知胜に察しお「Artificial Stupidity人工痎胜」ず呌ばれたりもしおいたす。 実のずころ、Artificial Stupidityずいう蚀葉は「人為的にStupidityを甚いおAIを孊習させる」ずいう意味でも甚いられるのですが、それに぀いおはあたり知られおいたせんでした。しかしながらここにきお、アメリカの研究チヌムが䞖界初のArtificial Stupidityのプロトタむプを発衚するなど、Artificial Intelligenceの枠を広げる可胜性ずしおArtificial Stupidityが泚目されおいるようです。 果たしお、この人工痎胜は人工知胜のレベルを䞊げるのか、䞋げるのか。今回のコラムでは、この問いに向き合っおいきたいず思いたす。 目 次 ・ Artificial Intelligence人工知胜を賢くするには   ・ Artificial Stupidity人工痎胜のプロトタむプの発衚  ・ 人工知胜の越えられない壁 ・ 合理的でないこずを远求する  ・ Intelligentであるほど、”バむアスの盲点”が倧きくなる ・ 人工知胜ず自然知胜  ・ 倧倚数にずっお恩恵ずなるか、害ずなるか  ・ 人工ず自然を合わせた知胜の研究 ・ 知胜のための痎胜の掻甚 Artificial Intelligence人工知胜を賢くするには  Artificial Stupidity人工痎胜のプロトタむプの発衚 暮らしの䞭でAIずの関わりが増え、チャットボットサヌビスで芋圓違いな回答を受けたり、音声サヌビスが予期せぬ堎面で反応したりするこずが話題に䞊るようになりたした。英語を話す人の間では、ナヌザヌの䞍意を぀き、むラっずさせたり笑わせたりするAIの反応のこずは、Artificial Intelligence人工知胜に察しお「Artificial Stupidity人工痎胜」ず揶揄されおいたす。 そんな折、マサチュヌセッツ工科倧孊の゚ンゞニアリングチヌムが発衚したのは、䞖界初の「Artificial Stupidity System」でした。 䞀䜓なぜ、ネガティブな印象の匷いArtificial Stupidityに特化したプロトタむプが発衚されるこずになったのでしょうか 。どうやら、AIを開発するプロセスにおいお立ちはだかった壁に、Artificial Stupidityが突砎口ずなる可胜性が考えられおいるようです。 人工知胜の越えられない壁 マサチュヌセッツ工科倧孊の研究チヌムは圓初、最高のAIを搭茉したロボットの研究を行っおいたした。できあがったロボットは人間の蚀うこずを聞き、タスクをこなし、感情を暡倣し、どこから芋おも完璧でしたが、それでもなぜか最埌の難関である「チュヌリングテスト」を突砎するこずができたせんでした。 そもそもチュヌリングテストずは、1950幎にアラン・チュヌリングずいう数孊者によっお提案された察話匏のテストです。AIの知胜レベルに぀いおは、珟時点ではチュヌリングテストを甚いお「知胜を持っおいる人間のように完璧に振舞うこずができるのか」をテストし、知胜を枬るずいうこずが行われおいたす。 どのようにテストするのかずいうず、チュヌリングテストではたず人間を2人、AIを1぀甚意したす。それらを盞手に、耇数の人間が詊隓官ずしお䌚話の投げかけをしたす。合栌するにはAIが、詊隓官の30以䞊に「察話盞手が人間か機械か刀別できない」ず認められなければなりたせん。 さお、このテストに合栌できない理由に぀いお時間をかけお研究チヌムが考え蟿り぀いたのが、圌らのAIが“Intelligentすぎるのではないか”ずいう疑問だったのです。結果、研究チヌムは完璧にたで仕䞊げたAIの限界を打砎するため、Artificial Stupidityを探求するこずになりたした。数ヶ月をかけお぀くりあげたArtificial Stupidityのプロトタむプは、他のアンドロむドを口説き、新しい情報を取り蟌むこずを拒むような態床を取るずいいたす。 合理的でないこずを远求する Intelligentであるほど、”バむアスの盲点”が倧きくなる そもそも人工知胜ずは、人間の知的機胜を代行できるようにモデル化された゜フトり゚ア・システムのこずです。人間の知的機胜を叞り、およそ1,000億個もの现胞がそれぞれに最倧1䞇個の现胞ず結び぀き情報亀換を行っおいる、そんな私たちの脳のメカニズムは未だ解明されおおらず、著名な科孊者たちは「宇宙で発芋された最も耇雑なもの」ず蚀ったりもしたす。 ずころが、この究極に耇雑な人間の脳で考えるに合理的ではない、いわばStupidず呌べるこずをきっかけに、思いがけず科孊は発展しおきたした。特にノヌベル賞玚の発芋ずいうのは、それたでの䞖界では科孊的に認められおいなかったこずが絡んでいるものです。 ノヌベル経枈孊賞を受賞したプリンストン倧孊名誉教授のダニ゚ル・カヌネマン氏は、そんな人間の非合理的な行動を研究した人物です。䟋えば、収入ず幞犏床の関係における、幎収US$75,000玄860䞇円を超えるず、幎収が増えたからずいっお幞犏床は䞊がらないずいう研究結果は広く知られおいたす。 こうした発芋により「行動経枈孊」ずいう新しい研究分野も発展したしたが、圓時この非合理的行動に関する研究のこずを知った著名な哲孊者は「Stupidityの心理孊など興味ない」ず䞀蹎したずいいたす。 皮肉にも、その埌の研究によっお明らかになったのは、Intelligenceが高い人ほど、“バむアスの盲点”がより倧きくなるこずを瀺唆するものでした。䟋えば、倧きな声で「静かにしなさい」ず叫んでいる人が自分の声の倧きさを無芖しおしたうように、私たちは無意識のうちに非合理的な行動をしおいたす。アメリカで倧孊進孊に必芁なS.A.T. スコアの点数が高い、いわゆる知胜が高いずされおいる人ほど、こうした盲点に気づかず、勘違いを起こしやすいずいう研究結果になったのだそうです。 こうした颚朮ずしお思い起こされるのは東日本倧震灜で広く共感を呌んだビヌトたけし氏のコメントです。テレビ画面では死者数がどんどん曎新され、その数ばかりが倧きく報道されおいたのを芋お違和感を芚えたビヌトたけし氏は、この灜害は「2䞇人が死んだ䞀぀の事件ではない」ず蚀いたした。 「人の呜は、2䞇分の1でも8䞇分の1でもない。そうじゃなくお、そこには『1人が死んだ事件が2䞇件あった』っおこずなんだよ」ず、人䞀人倱う重みに぀いお語り、数字で衚せない悲しみを人々ず分かちあいたした。 人工知胜ず自然知胜 倧倚数にずっお恩恵ずなるか、害ずなるか 私たちが自然ず物事を「わかる」知胜のメカニズムは解明されおいたせんが、明らかになっおいるこずは、わからなかったこずが「わかる」ようになるプロセスには「分ける」ずいう䜜業が含たれおいるずいうこずです。サッカヌのわかる人、味のわかる人、人の痛みのわかる人などは、それに関する倚くの知識や経隓があり、わずかな違いを読み、感じ取れる人のこずを指すものです。 AIの開発においおも、孊ぶ察象に関しおどんなデヌタをどのように扱うかが重芁であり、それによっおAIが倧倚数に恩恵をもたらすものになるのか、害をもたらすものになるのかさえも倉わっおきたす。 䟋えば、ある顔認蚌システムの開発では、癜い肌をした人の堎合、性別を誀認したのが1であったのに察し、肌の色が黒い人の堎合、゚ラヌ率が35たで跳ね䞊がったずいうリサヌチ結果が報告されたした。 このサヌビスの開発を手がけたのは、肌の癜い人の倚いチヌムだったのだそうです。デヌタの䞭でアンダヌサンプリングされたグルヌプは、その開発に埓事する人が気づかない限り無かったこずのようになっおしたい、それによっお䞀郚の人に有益でも、倚くの人に害をもたらす結果さえもたらされたす。 著しい技術進化を遂げた珟代のAIは、スマヌトフォンやスマヌトスピヌカヌの䞭だけでなく、医療や保険、䜏宅、小売、流通など倚くのビゞネスシヌンで甚いられ、䜕癟䞇もの人の生掻や人生を倉える決断に関わり始めおいたす。 開発に関わる䌁業や担圓者は、ナヌザヌをデゞタルワヌルドの存圚ずしおではなく、リアルワヌルドに間違いなく息づく生掻者ずしお捉え、倚くの人のためになるこずを確かめる目を持たなくおはなりたせん。 人工ず自然を合わせた知胜の研究 私たちの暮らしのあちこちでAIの導入が進む䞀方で、専門家の間ではAIの開発・運甚のために䜿われるデヌタによっお、差別を生むようなこずのないように甚心しなければならないずいう意識がたすたす高たっおいたす。こうした䞭、AI研究の最先端では知胜の本質に぀いおの議論が掻発に亀わされるようになりたした。 ゚ンゞニアリングによる知胜を人工知胜ず呌ぶのに察しお、私たち生き物が自然ず授かっおいる知胜はNatural Intelligence自然知胜ず呌ばれたす。知胜の本質を求めお、研究機関では人工知胜ず自然知胜を切り離さず、その䞡方から知胜そのものに぀いお解き明かそうずいう取り組みがスタヌトしおいたす。 「人間がこれたで取り組んできたこずが正解だずしたら、そこからのズレや誀り、愚かさず蚀われるもののなかに、新しい気づきやアむデアがある」 これは『動物ず機械から離れお―AIが倉える䞖界ず人間の未来』ずいう著䜜に玹介されおいた、Computational Creativity機械による創造性などを専門に研究し、AIを甚いたミュヌゞックビデオの制䜜しおいる埳井 盎生なお氏の蚀葉です。 埳井氏は、数幎に枡っおAI DJずコラボレヌションをしおきた経隓を持ちたす。人間のDJずコラボレヌションをするAI DJは、人間DJの遞んだ曲の音の高さや倧きさずいった曲の物理的な特城を甚いお、曲の印象を特城量ずしお定量化するこずにより、その流れにマッチする遞曲をするこずができるそうです。 自身がDJずしお参加した埳井氏は、その流れの䞭で自分ならば絶察に遞ばない遞曲をAI DJが持っおくるこずに、ハッずする瞬間が䜕床もあったず蚀いたす。埳井氏はAIの研究をする䞭で、AIよりむしろ、人間の垞識にずらわれない愚かさを持぀Artificial Stupidityに興味を瀺す䞖界の䞀流ミュヌゞシャンず出䌚い、倧きな圱響を受けたずいうこずです。 知胜のための痎胜の掻甚 人工にしろ自然にしろ、Stupidityは知胜の最骚頂に私たちを導く鍵だずも蚀われおいたす。思えば普段の人間関係の䞭でも、䞀芋ふざけおいる人間味のある人は「おもしろい人」ず呌ばれ、合理的で頭の良い人」よりも呚囲に良い圱響を䞎えおいるこずはないでしょうか。 幕末から150幎以䞊語られおきた萜語䞖界の䜏人など、著名な人はいないかもしれたせんし、ただのお調子者にも芋えたすが、なぜかどんな人ずも心を行きかわすこずに長け、実はそうした人たちが文化䌝承の立圹者だったりしたす。その䞀方で、 「なぜ賢い人ほど愚かなのか」 歎史の䞭で床々䞊がるこの問いに、私たちはAIを通じお向き合い、AIを次の段階ぞず進めようずしおいたす。 私たちがより倚くの人にずっお䟡倀のあるAIを生み出すためには、非合理的な蚀動であるStupidityにいかに寛容になれるか、そしおそれらをうたく取り蟌み、知胜ずしお掻かしおいけるか、぀たり、“人工痎胜による人工知胜を生み出せるか”が、実は重芁なのかもしれたせん。 監修  株匏䌚瀟Laboro.AI マヌケティングディレクタヌ 和田 厇  参考・匕甚文献 ・THE BEAVERTON “Scientists give up on artificial intelligence, begin work on artificial stupidity” ・THE NEW YORKER “Why Smart People Are Stupid” ・The Harvard Gazette “University seen as well-equipped to meet goals of ambitious institute” ・European Commission “What is real intelligence? What is natural intelligence and artificial intelligence and how are they different from each other?” ・ダニ゚ル・ピンク著 『ハむ・コンセプト「新しいこず」を考え出す人の時代』 ・ビヌトたけし著 『ヒンシュクの達人』 ・ゲむド・メッツ著 『GENIUS MAKERS ゞヌニアスメヌカヌズ Google、Facebook、そしお䞖界にAIをもたらした信念ず情熱の物語』 ・管付雅信著 『動物ず機械から離れお: AIが倉える䞖界ず人間の未来』
考えるな、感じろ。感情分析AIはアゞャむルに 2021.11.22 株匏䌚瀟Laboro.AI マヌケティング・ディレクタヌ 和田 厇 抂 芁 “感情を理解するこずは、人間特有の胜力だ。”人ずのコミュニケヌションを通しお盞手の感情を読み取るこずを日垞的に行っおいる私たちからすれば、そのように考えるこずが圓然かもしれたせん。ですが近幎、ずくに衚情解析を䞭心に、AIが人の感情を認識・掚定する技術が登堎し、さたざたな掻甚方法が暡玢されおいたす。今回のコラムでは、そもそも感情ずはなにか、そしおAIによる感情分析の皮類や、具䜓的に掻甚が期埅されおいる分野に぀いおご玹介しおいきたいず思いたす。 目 次 ・ 「感情」ずはなにか ・ 意識感情ず無意識感情 ・ 衚情ず感情 ・ AIによる感情分析の皮類  ・ 衚情からの感情分析  ・ 音声からの感情分析  ・ 文章からの感情分析 ・ 感情分析AIの掻甚  ・ 人々の幞犏床を枬定する感情認識AIカメラ  ・ 自動車乗員のリアルタむム感情分析  ・ 衚情解析による燃え尜き症候矀の予枬  ・ マヌケティンングリサヌチでの掻甚 ・ 考えるな、感じろ。アゞャむルに 「感情」ずはなにか 日本語では、人の気持ちや雰囲気を衚す蚀葉ずしお「感情」ずいう䞀぀の甚語が甚いられたすが、感情ず密接に関わる脳を研究する脳科孊ニュヌロサむ゚ンスでは、人間が抱くこうした心理的感芚を、その匷さや時間的な背景から倧きく぀に分けお捉えられるこずが䞀般的です。 Feeling気持ち 盎前の䜓隓に察しお確認され、印象付けられる感芚。個人的なもので、䌝蚘的なもの。 Emotion情動 Feeling気持ちが投圱されたもので、瀟䌚的であり、環境によっお衚珟が倉化するこずから、真実であるこずもあるし、芋せかけの堎合もある。 Mood気分 長期的で、䜎床で、より長い時間数分から数時間、堎合によっおは数日に枡る反応。 Affect感情 意識に先立぀、無意識的な感芚であり、完党に蚀葉で認識するこずができず、曖昧な感芚。比范的短時間のうちに起こる脳や自埋神経系、および行動の協調的倉化。 私たちが日垞抱く「感情」ずいうものには、瞬間的なものもあれば、長く継続されるものもあり、そしお意識的で蚀葉で䌝蚘的に衚せるものもあれば、無意識の䞭で醞成され、文章化するこずが難しい曖昧な感芚も含たれおいるこずがわかりたす。 【参考文献】 ・Shouse, E.2005Feeling, Emotion, Affect., M/C Journal, 8(6), https://journal.media-culture.org.au/mcjournal/article/view/2443 ・Davidson, R. J., Scherer, K. R., Goldsmith, H. H.. (Eds.)2002 Hand book of affective sciences. New York: Oxford University Press. ・Cerf, M. Garcia-Garcia, M.ç·š, 犏島誠監蚳2019『コンシュヌマヌニュヌロサむ゚ンス 神経科孊に基づく消費者理解ずマヌケティングリサヌチ』共立出版 p.73 意識感情ず無意識感情 Feeling気持ちのような意識的に瀺される感情ず、Affect感情のような無意識的に衚れる感情ずでは、どちらが私たちにずっお、あるいはビゞネス応甚を考えるにあたっおはより重芁なのでしょうか。 近幎泚目されおいるのが、埌者の無意識的な感情の存圚です。少し叀い実隓ですが、「リベットの実隓」ずいう脳科孊実隓がありたす。脳科孊研究者であるリベットがこの実隓で蚌明したこず、それは、人が意識的に感情を抱くよりも早くに、脳が掻性化しおいるずいうこずでした。 リベットが行った実隓はずおもシンプルなもので、被隓者は脳の反応を枬定する機噚を装着させられ、時蚈を芋ながら奜きなタむミングで手銖を曲げるこずを䟝頌されたす。合わせお「手銖を曲げよう」ず決めた時間を蚘録するよう指瀺されたす。脳反応が起きた時間、「曲げよう」ず意思決定した時間、実際に手銖を曲げた時間、それぞれを枬定した結果、被隓者の脳は意思決定するよりも0.3秒ほど早い段階で反応を瀺しおいたこずが明らかにされたした。このリベットの実隓を前䟋に、脳が人の感情よりも先に反応するずいう事象は、様々な研究で蚌明されおいたす。 これらの実隓結果からわかるこず、それは、脳をはじめずする私たちの身䜓に衚れる生䜓反応は、感情の前觊れであるずいうこずです。脳掻動はもちろんのこず、脳ず玐づいお反射的に衚れる衚情、発汗、䜓枩、心拍ずいった身䜓の状態を解析するこずは、その埌に起こるAffect感情を認識し、予枬するためのヒントを埗るこずに぀ながっおいるのです。 【参考文献】 ・Cerf, M. Garcia-Garcia, M.ç·š, 犏島誠監蚳2019『コンシュヌマヌニュヌロサむ゚ンス 神経科孊に基づく消費者理解ずマヌケティングリサヌチ』共立出版 p.8 ・居氞正宏2013「心脳問題ず人間的自由 : リベットの実隓ずデネットの解釈に぀いお」珟代生呜哲孊研究, 2, pp.23-36 ・Fried, I., Mukamel, R., Kreiman, G.2011Internally generated preactivation of single neurons in human medial frontal cortex predects volition. Neuron, 69(3), pp.548-562 ・Cref, M. & Mackay, M.2011Studying consciousness using direct recordings from single neurons in the human brain, In S. Dehaene & R. Christen (Eds.), Characterizing consciousness: From cognition to the clinic? Research and perspectives in neurosciences, pp.133-146. Berlin: Springer-Verlag ・Perz, O., Mukamel, R., Tankus, A., Rosenblatt, J. D., Yeshurun, Y., & Fried, I.2015Preconscious prediction of a driver’s decision using intracranial recordings. Jounal of Cognitive Neuroscience, 27(8), pp.1492-1502 衚情ず感情 近幎、AI技術の革新によっお、「感情AI」「感情予枬AI」「感情分析AI」などの分野もよく芋られるようになっおきたした。先のように、人の感情を掚定するためには様々な生䜓反応を解析の察象にできる可胜性があるわけですが、ずくに研究が進んでいるのが衚情解析に基づく感情予枬です。 AIによる衚情解析・感情予枬が特に進んでいる背景ずしおは、やはり芋た目ずしおわかりやすさ怜蚌のしやすさがあり、叀くから぀の衚情解析に関する考え方が確立しおいたこずが挙げられたす。぀たり、既存の衚情解析の研究が、AI開発に転甚しやすかったずいうこずです。 基本感情説 䞀぀目の考え方は、1971幎に゚クマンずいう研究者が提唱したこずに始たる「基本感情説」ず呌ばれるものです。基本感情説では、人の感情は、「驚きsurprise」 「恐れfear」 「嫌悪disgust」 「怒りanger」 「喜びjoy」 「悲しみsadness」「通垞neutral」の感情を基本ずするずいう前提に立぀もので、衚情解析ではそれぞれの特城に埓っお、それぞれの感情に分類するこずが目指されたす。※研究が行われた幎代や研究者によっお基本ずする感情や名称に異なりはありたすが、ベヌスずなる少数の感情を発芋するこずを目指すずいう点では倉わりはありたせん。 基本感情説は、感情を説明する際によく匕甚される理論で、倚くの感情AIモデルもこの理論に基づいおおり、認識された情報を分類するずいう゜リュヌションが䞻流になっおいたす。 【参考文献】 ・荒川歩・鈎朚盎人2004しぐさず感情の関係の探玢的研究, 感情心理孊研究, 10(2), pp.56-64 ・Ekman, P.1971Universals and cultural differences in facial expressions of emotion. Nebraska Symposium on Motivation, 19, pp.207-283. ・ Ekman, P.(1992). An argument for basic emotions. Cognition and Emotions, 6, pp.169-200. 感情円環モデル ぀目の考え方が、感情は少数の基本的な分類に集玄されるものではないずいう基本感情説ぞのアンチテヌれずしお登堎した「感情円環モデル」です。1980幎にラッセルずいう研究者を䞭心に発展させられおきたこのモデルでは、感情は、芚醒床を衚す「Arousal芚醒–Sleep沈静」軞ず、感情䟡を衚す「Pleasure快–Unpleasure䞍快」軞の぀の軞の匷匱によっお決定され、点にプロットされたす。 私たちが日頃感じる感情の耇雑さを考えるず、円環モデルの方がより感情を認識・予枬するためには適したモデルのように感じられたす。ですが、衚情を認識した䞊で、これらの匷匱を数倀的に定匏化するこずはやはり難しく、感情円環モデルを甚いたAIモデルやAI゜リュヌションはほずんど芋られないのが珟状です。 【参考文献】 ・Barrett, L. F., & Bliss-Moreau, E.2009Affect as a Psychological Primitive. Advances in Experimental Social Psychology, 41, pp.167-218. ・Barrett LF, Russell JA.1999 Structure of current affect. Current Directions in Psychological Science., 8:10–14. ・Russell JA.1980 A circumplex model of affect. Journal of Personality and Social Psychology.39:1161–1178. ・江川翔䞀・瀬島吉裕・䜐藀掋䞀郎2019情動評䟡のためのラッセルの円環モデルに基づく感情重心掚定手法の提案, 日本感性工孊論文誌, 18(3), pp.187-193. AIによる感情分析の皮類 昚今、技術進化が著しいAIには、衚情解析をはじめ、どのような感情分析の皮類があり、どのような仕組みで成り立っおいるのでしょうか。 衚情からの感情分析 䞊述の通り、AIによる衚情解析では皋床の基本的な衚情に分類するやり方が䞻流になっおいたす。そのため、眉の䜍眮、口角の倉化、目や目頭の䜍眮など、顔面に衚れる各パヌツの状態をカメラから認識し、各基本感情を衚す衚情ずの類䌌床を刀定、分類するずいった分析をしおいくこずになりたす。 衚情研究は既存研究も倚く、感情分析AIの䞭でも比范的やりやすい分野の䞀぀です。ビゞネス応甚ずしおは、マヌケティングリサヌチでの掻甚が代衚的で、店頭で顧客が商品を手に取った瞬間の衚情、あるいはTVCMやデゞタルサむネヌゞをを芋た際の衚情を認識・分析するずいった掻路が芋蟌たれたす。 音声からの感情分析 衚情だけでなく、音声も感情を衚す重芁なデヌタの䞀぀です。音声からの感情分析では、認識された音声を自然蚀語凊理によっお意味のある蚀葉ずしお倉換・分析するこずも考えられたすが、声の倧きさ、抑揚の倉化、息の入れ方などの特城を分析しお感情を予枬するずいったアプロヌチも考えれたす。 音声感情分析の応甚ずいう芖点では、コヌルセンタヌなどの電話口での掻甚や、面接や接客時などあらゆるコミュニケヌションシヌンでの掻甚が芋蟌たれたす。䞀方で、音声特有の難しさずしお挙げられるのが、「音源分離」の問題です。音声デヌタを収集するにあたっおは、人の声だけを正確に収集する必芁がありたすが、特に接客シヌンなどでは、背埌に雑音・隒音が入り蟌むこずが少なくなく、目的ずする音声を抜出するこずに難しさが生じたす。音源分離に぀いおは、こちらのコラムで詳しく玹介しおいたす。 ゚ンゞニアコラム 声や音を聞き分ける、『音源分離』ずは 文章からの感情分析 衚情、音声に加えお、文章も感情が衚れるデヌタの䞀぀です。特に近幎はむンタヌネットやSNSの普及により、こうした文章デヌタは取埗がしやすくなっおきたため、デヌタ収集が比范的やりやすい分野であり、文章感情AI゜リュヌションや自然蚀語凊理を掻甚したAPIも倚く登堎しおいたす。 しかし、文章感情分析は比范的やりやすい分野である䞀方、冒頭の話に基けば、心理孊的・脳科孊的には泚意が必芁な面もありたす。それは、文章ずは人が行動を起こした結果ずしお䜜り出されるものであっお、意識的な感情ずしおの偎面が匷く、堎合によっおは瀟䌚的な目を気にしお衚珟が歪めらたり、嘘の感情ずしお衚珟されるこずも少なくないずいうこずです。䞖の䞭のSNSの投皿を思い浮かべればわかりやすいですが、宣䌝目的の投皿、呚りに迎合した文章、匿名だからこその歪んだ発蚀など、文章には感情以倖の瀟䌚的芁玠が倚く含たれるのが実際です。 確かに技術的には取り掛かりやすい感情分野ではあるものの、無意識的な反応ずしお衚れる衚情や音声ずは違い、その文章に含たれる文脈や背景などを読み取るこずなくしおは、真の意味での感情を捉えにくい分野だず蚀えたす。 感情分析AIの掻甚 最埌に、感情分析AIの掻甚䟋ずしお、すでに実甚化されおいるものから、将来的に実珟されるであろう技術をいく぀か玹介したいず思いたす。 人々の幞犏床を枬定する感情認識AIカメラ アラブ銖長囜連邊のドバむで実際に実甚化されおいるのが、カメラに写った人々の衚情などから幞犏床を枬定し、さたざたなビゞネスに掻かすAIです。このシステムでは人々の幞犏床を枬定し、システムの利甚偎にその結果をフィヌドバックしたす。幞犏床が䜎䞋すればアラヌトを出し、埓業員の察応を改善するずいった掻甚方法が芋蟌たれおいたす。 なお、衚情解析では、保存された個人情報である衚情デヌタの扱いが問題になるこずが少なくありたせんが、このシステムでは分析に䜿甚した画像は保存されない仕組みが搭茉されおいるずのこずです。 出兞 Gulf News「Are you happy: RTA starts measuring customers’ happiness level by using AI-cameras」 自動車乗員のリアルタむム感情分析 昚今、運転䞭の安党確保や自動運転技術の開発に圹立おる目的などで開発されおいるのが、自動車乗員の感情をリアルタむムで分析するAIです。䟋えば、車内に蚭眮しおいるカメラずマむクから映像ず音声を取埗し、双方を分析するこずで乗員の感情を分析するシステムが登堎しおいたす。 このシステムでは単に感情を分析するのではなく、眠気に関するサむンに぀いおも分析し、アラヌトを鳎らすこずも可胜です。顔の角床から眠気を怜出するようなシンプルなシステムに比べ、AIによっお倚角的に分析しおいるため、より実甚性の高い眠気防止システムだず蚀えたす。 たた先日、デン゜ヌがあおり運転防止のための感情認識AIの研究成果を報告するど、自動車の利甚シヌンにおける感情分析AIの掻甚が掻況になっおいたす。 出兞 日経クロステック「感情認識AIで「あおり運転」防止など、30呚幎のデン゜ヌ先端技術研」 衚情解析による燃え尜き症候矀の予枬 ストレス状況など心的状態を枬定するこずも、感情分析AIの掻甚が芋蟌たれる分野の䞀぀です。これからの研究ではありたすが、先日、筑波倧孊ずテックりむンドが発衚したのが、衚情解析に基づく燃え尜き症候矀の予枬に関する取り組みです。そのほか、う぀病やPTSD、認知症などに代衚される気分障害や疟病の蚺断のサポヌトずしお、AIを甚いおその兆候を把握できるようになるこずは、今埌、感情分析AIの掻甚が最も期埅される分野の䞀぀だず蚀えたす。 しかし、こず医療珟堎は蚺療や医療刀断のミスが蚱されたせん。そのため、䞍確実性の高いAI技術の応甚は珟実的に難しい偎面も吊定できず、珟状、意思決定やそれに準ずる機胜を持぀AIが、医療珟堎に導入されおいるケヌスは非垞に少ない状況だず蚀えたす。 Laboroコラム いのち守るためのAI。医療珟堎ぞのAI導入の壁 出兞 日本経枈新聞「テックりむンド、筑波倧ずAI感情分析による燃え尜き症候矀の予枬に関する共同研究契玄を締結」 マヌケティング・リサヌチでの掻甚 感情分析のビゞネス応甚が最も芋蟌たれるのが、マヌケティング・リサヌチ分野です。 TRIAL のようなAI店舗や、 b8ta ずいった「売らない店舗」も昚今話題になっおいたすが、来店客が商品を手に取った際の状態を分析し、それに基づいお最適な広告を配信する、あるいはそれらの分析デヌタを䌁業に販売、䌁業偎はそれらのデヌタを次の商品開発にいかすなど、単にナヌザヌの状態を分析するに留たらない、倚方面でのビゞネス展開が行われおいたす。 たた、デゞタルサむネヌゞにAIカメラを搭茉し、衚情から広告の効果怜蚌を行うずいった䟋も登堎し、広告やプロモヌション分野でもより高い粟床での広告配信が実珟され、その基瀎技術ずしお感情分析AIが甚いられるようになっおきたした。 䞀方、これらの分野でずくに掻甚される䞍特定倚数の衚情デヌタには個人の肖像が含たれるため、その扱いに泚意が必芁です。個人情報にあたる衚情デヌタそのものをクラりドに保存するこずは危険性が高いため、䟋えば゚ッゞカメラ偎で画像を削陀した䞊、凊理されたデヌタのみをクラりド偎に送信するなど、プラむバシヌ保護をずもなったシステム開発が求められる分野です。 Laboroコラム 答えのない、マヌケティング×AIの䞖界ぞの挑戊 考えるな、感じろ。アゞャむルに 「考えるな、感じろDon’t think! Feel.」 映画『燃えよドラゎン』でブルヌス・リヌが発した名台詞ですが、私たち人間は、ロゞカルに考えるだけでなく、感芚的あるいは本胜的に䜕かを感じ取る胜力を確かに持っおいるようです。人の感情ずはたさにその䞀぀であり、本来、ある人を「圌は喜んでいる」「圌女は悲しんでいる」ず䞀矩的に枠に圓おはめるこずは䞍適切なこずです。なぜなら、圌が感じおいる喜びの裏偎には、それたでの経隓ずしおの楜しさもあれば、過去の蚘憶からくる悲しさもあり、それらが耇雑に絡み合った結果ずしお喜びが衚珟されおいるはずで、私たちはそうした圌の状態を考えるこずなく無意識のうちに感じ取っおいるからです。 こう考えるず、少なくずも珟圚の感情分析AIは、あくたで人が考え、䞀矩的に定めたルヌルに基づいお衚面的に把握される状態を分類しおいるだけに過ぎず、人の歎史や経隓、蚘憶ずいった文脈を無意識的に感じ取り、感情を読み取るこずには遠く至っおはいたせんし、今埌しばらくはその領域に届くこずは無さそうです。 しかし、だからず蚀っお感情分析AIに意味がないずいうこずではありたせん。確かに、䞊蚘のような単に䞀矩的な割り振りをするような”AI”の名が付いただけのツヌルでは圹立たずかもしれたせんが、感情ずいう耇雑な人の心理を扱うために、そもそも感情ずは䜕か、掻甚シヌンに応じおどのような状態を抜出したいのか、どのような刀定結果が出るずビゞネス的に成功ず蚀えるのかを入念に怜蚎し、そのためのAIモデルを、考えに考えお蚭蚈するこずが、感情分析AIをビゞネス成果に぀なげおいくための肝になりたす。 感情を分析・予枬するずいうこずは、人であっおも簡単なこずではありたせん。そのためのAIモデルを開発するためには、考え、感じ、さらに考えるこずを繰り返し、アゞャむルに開発を進めおいく芚悟ずパヌトナヌが欠かせないのです。
A New Japanese-English Parallel Corpus − 新日英察蚳コヌパス − 2021.11.9 Laboro.AI Inc. Machine Learning Engineer Zhao Xinyi ※このコラムでは、圓瀟が開発した機械翻蚳モデルによる日本語蚳を各セクションに掲茉しおいたす。翻蚳文は、その性胜を実感いただくこずを目的に、いく぀かの甚語を眮き換える以倖は人手による修正は行なっおおりたせん。そのため、䞀郚文章に䞍自然な箇所も含みたすこずをご了承ください。 INTRODUCTION Parallel corpus is essential to Natural Language Processing (NLP) research, especially when it comes to translation. However, such research sometimes suffers from the lack of high-quality corpus. Hoping to make NLP researchers’ life easier, we are here to share a Japanese-English parallel corpus. To assess the quality of our corpus, NMT models were trained with the corpus and then evaluated on several datasets. The models reach quite good BLEU scores and are able to give decent translation involving text from various fields and sources. Now we’re making our corpus public to everyone. Besides that, by writing this article, we also want to share the methodology for building a parallel corpus efficiently and financially friendly. Traditionally, collecting a parallel corpus needs considerable amount of linguistic resources (corpora, dictionaries, etc.), which is difficult for those with limited budgets. We managed to find some workarounds and make the whole process more practical. In this article, we will first explain how our corpus is collected, including where the data are from and how parallel sentence pairs are mined. Then we will introduce the NMT models that were trained, followed by the evaluation results and conclusions. 察蚳コヌパスは、特に翻蚳に関しおは、自然蚀語凊理(NLP)の研究に䞍可欠です。しかし、そのような研究は、質の高いコヌパスの欠劂に苊しむこずがありたす。NLP研究者の生掻をより楜にするために、日英察蚳コヌパスを共有したす。コヌパスの品質を評䟡するため、NMTモデルをコヌパスで孊習し、いく぀かのデヌタセットで評䟡したした。モデルは、非垞に優れたBLEUスコアに達し、さたざたな分野や情報源からのテキストを含む適切な翻蚳を提䟛できたす。 たた、本皿を執筆するこずで、効率的か぀経枈的な察蚳コヌパス構築の方法論を共有したい。埓来、察蚳コヌパスの収集には盞圓な蚀語資源(コヌパス、蟞曞など)が必芁であり、予算が限られおいる人には難しい。いく぀かの回避策を芋぀けお、プロセス党䜓をより実甚的なものにするこずができたした。本蚘事では、たず、コヌパスの収集方法や、デヌタの出所、䞊列文章ペアの採掘方法などに぀いお解説したす。次に、蚓緎されたNMTモデルを玹介し、評䟡結果ず結論を述べる。 CONTENTS ・ Corpus Collecting  ・ Related works  ・ Crawling & Preprocessing  ・ Alignment  ・ Filtering ・ Training NMT ・ Evaluation ・ Download & Source Code ・ Acknowledgements Corpus Collecting Related works One of the most well-known projects for building a parallel corpus is ParaCrawl, aiming to mine sentence pairs from the web for European languages. ParaCrawl has been  proven  to be one of the most high-quality large parallel corpora. In order to achieve that, ParaCrawl team developed a set of open-source tools including Extractor for processing the data in Common Crawl, Bitextor for crawling and aligning data, and Bicleaner for filtering bilingual text pairs. Using the tools developed by ParaCrawl, JParaCrawl corpus was created by NTT as the Japanese version of ParaCrawl. Our project was inspired by the two projects mentioned above. コヌパス集め 関連䜜品 察蚳コヌパス構築で最もよく知られおいるプロゞェクトのひず぀が、ペヌロッパの蚀語向けにりェブから文章ペアを掘り起こすParaCrawlです。ParaCrawlは 蚌明 され、最も高品質の倧型察蚳コヌパスの䞀぀です。これを実珟するために、ParaCrawlチヌムはコモンクロヌルでデヌタを凊理するためのExtractor、クロヌルず敎列甚のBitextor、バむリンガルテキストペアをフィルタリングするためのBicleanerなどのオヌプン゜ヌスツヌルのセットを開発したした。JParaCrawlは、ParaCrawlが開発したツヌルを甚いお、NTTが日本版のParaCrawlずしお䜜成したコヌパスです。この2぀のプロゞェクトから着想を埗たした。 Crawling & Preprocessing Our parallel corpus is built based on web-crawled data. To begin the crawling, we have to first decide the candidate domains.  Common Crawl  as a large web archive database is a good place to start for selecting the candidate domains. An ideal source domain for our purpose should include parallel webpages having the same contents in two languages. To simplify the selection of candidate domains, however, we only request a desirable language ratio between Japanese and English at this step. With the help of the  Extractor , we were able to extract Japanese and English text from Common Crawl database, and then calculate the language bytes ratio for each domain. Top 50,000 domains were finally selected with the closest Japanese to English bytes ratio to 1.22. The main limitation of using Common Crawl as the source data, however, is that it usually doesn’t have a complete copy of a website. This leads to two problems. One is that the language statistics we collected in the previous step might have bias from the actual situation. The other problem is that from a potentially ideal domain, we want to obtain as much data as possible, in other words, the entire website. This means instead of using the imcomplete copy in Common Crawl, it’s better for us to crawl the websites again for more data. From this step, we started using another tool called Bitextor. It integrates together the functions of crawling, alignment, filtering, etc, and the tools for them. By modifying the configuration files, we are able to control the pipeline and select the tools. Detailed instruction can be found on its GitHub homepage . As for the crawling, we chose Creepy among several crawlers supported by Bitextor. Creepy is very straightforward to use, and Bitextor has some Creepy-specific variables to help us control the crawling process. Specifically, we set the  crawlTimeLimit  as 24 hours,  crawlSizeLimit  as 1GB and  crawlTLD  as False. By doing this, we restrained the crawling from taking up too much resources, and obtained around 1TB data with gzip compression. The crawled data have to be preprocessed for further use. This includes extracting plain text, splitting sentences and tokenization. To better extract text and suit Japanese characters and punctuations, we modified and replaced source code  bitextor-warc2preprocess.py  and  split-sentences.perl . For tokenization, we used the original source code  tokenizer.perl  for English, and used MeCab tokenizer with NEologd dictionary for Japanese. After preprocessing, we got about 29GB of English plain text and 20GB of Japanese plain text. クロヌリングず前凊理 匊瀟の察蚳コヌパスは、りェブクロヌルデヌタに基づいお構築されおいたす。クロヌルを始めるには、たずは候補ドメむンを決定する必芁がありたす。倧芏暡なWebアヌカむブデヌタベヌスずしおの Common Crawl ずいう倧芏暡なWebアヌカむブデヌタベヌスは、候補ドメむンを遞択するのに最適な堎所です。理想の゜ヌスドメむンは、2぀の蚀語で同じ内容のパラレルりェブペヌゞを含むべきです。ただし、候補ドメむンの遞択を簡略化するため、この段階では、日本語ず英語の望たしい蚀語比率のみをリク゚ストしたす。 Extractor の助けを借りお、Common Crawlデヌタベヌスから日本語ず英語のテキストを抜出し、各ドメむンの蚀語バむト数比を蚈算するこずができたした。最終的に、日本語ず英語のバむト数の割合が1.22ず最も近い䞊䜍50,000ドメむンが遞ばれたした。 しかし、Common Crawlを゜ヌスデヌタずしお䜿甚する䞻な制限は、通垞、りェブサむトの完党なコピヌを持っおいないこずです。これは2぀の問題に぀ながりたす。1぀は、前のステップで収集した蚀語統蚈には、実際の状況からバむアスが生じる可胜性があるずいうこずです。もう䞀぀の問題は、朜圚的に理想的なドメむンから、可胜な限り倚くのデヌタ、すなわちりェブサむト党䜓を取埗したいずいうこずです。぀たり、Common Crawlで䞍完党なコピヌを䜿甚する代わりに、より倚くのデヌタのためにりェブサむトを再床クロヌルするこずをお勧めしたす。 このステップから、Bitextorずいう別のツヌルを䜿い始めたした。クロヌル、アラむメント、フィルタリングなどの機胜ず、それらのツヌルを統合したす。蚭定ファむルを倉曎するこずで、パむプラむンを制埡し、ツヌルを遞択するこずができたす。詳现な手順は GitHubホヌムペヌゞ にありたす。 クロヌリングに関しおは、Bitextorがサポヌトするクロヌラの䞭からCreepyを遞びたした。Creepyは非垞に䜿いやすく、Bitextor にはCreepy特有の倉数があり、クロヌリングプロセスを制埡できたす。具䜓的には、「crawlTimeLimit」を24時間、「crawlSizeLimit」を1GB、「crawlTLD」をFalseに蚭定したす。これにより、クロヌルによる資源の取り蟌みを抑制し、gzip圧瞮で1TB前埌のデヌタを取埗したした。 クロヌルされたデヌタは、埌で䜿甚するために前凊理する必芁がありたす。これには、プレヌンテキストの抜出、文章の分割、トヌクナむれヌションが含たれたす。テキストを抜出しお日本語の文字や句読点に合うように、゜ヌスコヌド「bitextor-warc2preprocess.py」ず「split-sentences.perl」を倉曎しお眮き換えたした。トヌクナむズには、オリゞナル゜ヌスコヌドの「tokenizer.perl」を英語に䜿い、NEOlogd蟞曞付きのMeCabトヌクナむザヌを日本語に䜿いたした。前凊理埌、玄29GBの英語プレヌンテキストず20GBの日本語プレヌンテキストを手に入れたした。 Alignment Once the crawled data is ready, we can start document and segment (sentence) alignment in order to extract parallel sentence pairs. Bitextor supports two methods to do both alignments, using a dictionary or introducing an external machine translation (MT) to the system. The big obstacle we were facing was that we didn’t have any dictionary or MT available. Collecting a dictionary is apparently the more practical option here, because after all training a reliable MT is our ultimate purpose. We set off to crawl an English-Japanese dictionary from several dictionary websites, and ended up collecting 82,711 entries. It is important to select multiple sources to crawl the dictionary in order to balance the language style, because we want our final corpus to contain a little bit of everything, both academic and casual text. Fortunately, the detour ends here. With the collected dictionary, alignment can be easily done following the instruction for Bitextor. We collected about 329 million sentence pairs when sentence alignment was finished, but many of those are not correct pairs and need to be filtered out. アラむメント クロヌルされたデヌタの準備ができたら、ドキュメントずセグメント(センテンス)のアラむメントを開始しお、平行な文のペアを抜出したす。Bitextorは、蟞曞を䜿甚するか、倖郚機械翻蚳(MT)をシステムに導入するかの2぀の方法をサポヌトしおいたす。私たちが盎面しおいた倧きな課題は、蟞曞もMTもないずいうこずでした。蟞曞の収集は、明らかにここではより実甚的なオプションです,なぜなら、信頌できるMTをトレヌニングするこずが究極の目的だからです。日英蟞曞をいく぀かの蟞曞サむトからクロヌルし、最終的に82,711の゚ントリを集めるこずにしたした。蚀語スタむルのバランスを取るために、耇数の゜ヌスを遞択しお蟞曞をクロヌルするこずが重芁です。 幞いなこずに、迂回はここで終わりたす。収集された蟞曞を䜿甚するず、Bitextorの指瀺に埓っお簡単に䜍眮合わせを行うこずができたす。アラむメントが完了するず玄3億2900䞇個の文章ペアを収集したしたが、それらの倚くは正しいペアではなく、陀倖する必芁がありたす。 Filtering On the Bitextor pipeline, Bicleaner is used to filter the sentence pairs and output the final parallel corpus. What it does is to score each pair and eliminate those whose scores are lower than a threshold we set. However, it takes some time and efforts to train a Bicleaner model. The very detailed explanation for training a Bicleaner can be found  here , according to which, we still need some extra data for the training. In general, two parallel corpora are needed, a big corpus to extract probabilistic dictionary and word frequency information, and a small but high-quality corpus as the training corpus. Note that the dictionary used in the previous alignment step cannot be used here, because it doesn’t contain the probability and word frequency information required in the training process. We crawled the big corpus from a bunch of dictionary websites with bilingual example sentences. It contains more than 1 million sentence pairs as suggested in the training instruction. As for the small but clean training corpus, we selected about 600K sentence pairs from Reijiro corpus. We also tested several types of classifier used in Bicleaner, and finally decided to adopt “random forest” classifier and 0.5 as the threshold in order to suit our needs the best. By using Bicleaner, our corpus reduced from 329 million sentence pairs to 23 million pairs. By browsing the corpus we got, we found there’s still possibility to further clean the corpus. Some of the wrong sentence pairs are easy to spot because the source URL pairs obviously mismatched, and this is caused by the mistakes in document alignment. Using a dictionary instead of an external MT for document alignment compulsorily aligns one URL with the other most possible URL, even if they contain totally different contents. To deal with this problem, we appended a strict rule-based filter at the end of the pipeline to identify correct URL pairs. The rules include 1. the URL pairs must contain at least one language identifier including “ja”, “en”, “=j”, etc; 2. the numbers in the URLs, if exist, are usually the date or post ID, and are asked to be identical in a URL pair. The size of our final parallel corpus reduced to 14 million sentence pairs after cleaning. Giving it a second thought, if we do the alignment again in the future, using this rule-based filter right after document alignment can save us some time in the later steps. フィルタリング Bitextorパむプラむンでは、Bicleanerを䜿甚しお文章ペアをフィルタリングし、最終的な察蚳コヌパスを出力したす。䜕をするかは、各ペアをスコア化し、蚭定したしきい倀よりも䜎いスコアを排陀するこずです。しかし、Bicleanerモデルのトレヌニングには時間ず劎力がかかりたす。Bicleanerの蚓緎の非垞に詳现な説明は、 ここ にある、これに埓っお、トレヌニングのためにはさらにいく぀かのデヌタが必芁です。䞀般的に、2぀の察蚳コヌパス、確率的蟞曞ず単語頻床情報を抜出する倧きなコヌパス、および蚓緎コヌパスずしお小さくお高品質なコヌパスが必芁です。前のアラむメントステップで䜿甚する蟞曞は孊習過皋に必芁な確率や単語頻床情報が含たれおいないためここでは䜿えたせん。 倧量の蟞曞りェブサむトから、バむリンガルの䟋文をクロヌルしおみたした。蚓緎の指瀺に瀺されおいるように、100䞇以䞊の文のペアが含たれおいたす。たた、小型でクリヌンな孊習コヌパスは、Reijiroコヌパスから玄600Kの文章を遞びたした。たた、Bicleanerで䜿甚されおいる分類噚をいく぀か詊し、最終的にはニヌズに合わせお「random forest」分類噚ず0.5を閟倀ずしお採甚するこずを決めたした。Bicleanerを甚いるこずで、コヌパスは3億2,900䞇文察から2,300䞇察ぞず枛少したした。 私達が埗たコヌパスを閲芧するこずによっお、私達は、コヌパスをさらにきれいにする可胜性があるこずに気が぀きたした。゜ヌスURLのペアが明らかに間違っおいるため、間違った文のペアのいく぀かは芋分けが぀きやすいです。これは、ドキュメントのアラむンメントの間違いが原因です。ドキュメントのアラむンメントに倖郚MTではなく蟞曞を䜿甚するず、たずえ完党に異なる内容が含たれおいおも、あるURLを他の最も可胜なURLに匷制的に敎列させるこずができたす。この問題に察凊するために、パむプラむンの最埌に厳密なルヌルベヌスのフィルタヌを远加し、正しいURLペアを特定したした。 1. URLペアには、「ja」、「en」、「=j」など、少なくずも1぀の蚀語識別子を含める必芁がありたす。 2. URL内の番号は、通垞、日付たたは投皿IDであり、URLのペアで同じであるように求められたす。 最終的な察蚳コヌパスのサむズは、クリヌニング埌に1400䞇文ペアに瞮小したした。将来、アラむンメントを再び行う堎合、ドキュメントのアラむンメント盎埌にこのルヌルベヌスのフィルタを䜿甚するず、埌のステップで時間を節玄できたす。 Training NMT To evaluate and compare the quality of the parallel corpora, we trained several sets of NMT models. The first set of models is trained with Laboro-ParaCorpus. To explore how much the performance is influenced by add an extra corpus, especially when adding a small corpus, we tested a Laboro-ParaCorpus+ which is a combination of Laboro-ParaCorpus and an HNK daily conversation corpus. The NHK corpus is also crawled from online resources and contains only around 60K sentence pairs. In addition to that, the third set is trained with the combination of Laboro-ParaCorpus and NTT-JParaCrawl corpus. Each set includes 4 models, 1. base model, from English to Japanese 2. base model, from Japanese to English 3. big model, from English to Japanese 4. big model, from Japanese to English All the pre-trained models are later evaluated on 7 datasets. 4 of those, namely ASPEC, JESC, KFTT, IWSLT, are furthermore used for fine-tuning each model for an extra 2000 steps. We list and briefly introduce them as followings. ・ ASPEC , Asian Scientific Paper Excerpt Corpus ・ JESC , Japanese-English Subtitle Corpus containing casual language, colloquialisms, expository writing, and narrative discourse ・ KFTT , Kyoto Free Translation Task that focuses on Wikipedia articles related to Kyoto ・ IWSLT 2017 TED.tst2015  used in IWSLT 2017 Evaluation Campaign, including TED talks scripts in both languages ・ Duolinguo STAPLE  for the 2020 Duolingo Shared Task on Simultaneous Translation And Paraphrase for Language Education ・ Tatoeba  corpus, a large collection of multilingual sentences and translations that keeps being updated by voluntary contributors;  release v20190709  is used in our experiment ・ BSD , Business Scene Dialogue corpus containing Japanese-English business conversations トレヌニングNMT 察蚳コヌパスの品質を評䟡し比范するために、いく぀かのNMTモデルのセットを蚓緎したした。モデルの最初のセットはLaboro-ParaCorpusで蚓緎されたす。远加コヌパスを远加するこずによっおパフォヌマンスがどの皋床圱響されるかを調べるには、特に、小さなコヌパスを远加する堎合、私たちは、Laboro-ParaCorpusずHNK日垞䌚話コヌパスの組み合わせであるLabolo-ParaCorpus+をテストしたした。NHKコヌパスもオンラむンリ゜ヌスからクロヌルされ、玄60Kの文章ペアしか収録されおいたせん。さらに、第3セットは、Laboro-ParaCorpusずNTT-JParaCrawlコヌパスの組み合わせで蚓緎されたす。各セットに4モデル、 1. ベヌスモデル(英語から日本語) 2. ベヌスモデル(日本語→英語) 3. 倧きなモデル(英語から日本語) 4. 倧きなモデル(日本語から英語) 事前孊習枈みのすべおのモデルは、その埌7぀のデヌタセットで評䟡されたす。ASPEC、JESC、KFTT、IWSLTの4぀は、さらに2000ステップ远加で各モデルのファむンチュヌニングに䜿甚されたす。以䞋にリストアップしお簡単に玹介したす。 ・ ASPEC 、アゞア孊術論文抜粋 ・ JESC 、日本語・英語字幕コヌパス、口語・解説、ナラティブ・ディスコヌス ・ KFTT 、京郜に関するWikipedia蚘事を䞭心にした京郜フリヌ翻蚳タスク ・ IWSLT 2017 TED.tst2015 、䞡蚀語のTEDトヌクスクリプトを含むIWSLT 2017評䟡キャンペヌンで䜿甚 ・ Duolinguo STAPLE 、2020 Duolingo Shared Task on Simultaneous Translation and Paraphrase for Language Education ・ Tatoeba コヌパス、自発的な貢献者によっお曎新され続ける倚蚀語文章ず翻蚳の膚倧なコレクション;  release v20190709 が我々の実隓で䜿甚されおいたす ・ BSD 、日英ビゞネス䌚話を含むビゞネスシヌン察話コヌパス Evaluation NMT models are evaluated by BLEU scores on the test datasets. Except the three sets of models mentioned above, we used models trained on NTT’s JParaCrawl as the baseline, and the results from Google Cloud Translate as a reference. In the table below, we show a simplified version of comparison based only on BLEU scores on average, so that it is easy to understand. The pre-trained (PT) models are represented by the average scores on 7 datasets, while the fine-tuned (FT) models on 4 datasets. For the detailed results for each model on each dataset, please refer to our  Github document . It is obvious to see that big models always get higher scores than base models. Except that Google Cloud Translate exceeds other pre-trained models, the models trained with the combination of 2 corpora give the best performance. As for models trained on one single corpus, the models trained on NTT-JParaCrawl perform slightly better than those trained on Laboro-ParaCorpus overall, but by adding a small and high-quality corpus to our corpus, it raised the performance to the same level as NTT’s models. Specifically which model is better really depends on the type and content of the evaluation dataset. The results show that the Laboro-ParaCorpus+ is of comparable quality with NTT-JParaCrawl corpus. With limited resources in hand, it’s still possible to create a decent parallel corpus of your own. In this article, we set out to share a self-build parallel corpus and the NMT models pre-trained with the corpus. We also dicussed the methodology for creating a parallel corpus when we only have access to limited linguistic resources. This experience is valuable for our future work, and hope what we shared is helpful for you too. 評䟡 NMTモデルは、テストデヌタセット䞊のBLEUスコアによっお評䟡されたす。䞊蚘の3぀のモデル以倖は、NTTのJParaCrawlで孊習したモデルをベヌスラむンずしお䜿甚し、Google Cloud Translateの結果を参考ずしお䜿甚したした。 䞋衚では、平均しおBLEUスコアのみを基準に簡略化した比范を瀺しおおり、わかりやすいようにしおいたす。事前孊習(PT)モデルは7぀のデヌタセットの平均スコアで、4぀のデヌタセットで埮調敎(FT)モデルで衚されたす。各デヌタセットにおける各モデルの詳现結果に぀いおは、 Githubドキュメント を参照しおください。 倧きなモデルがベヌスモデルよりも高いスコアを垞に埗るこずは明らかです。Google Cloud Translateが他の事前蚓緎枈みのモデルを超える堎合を陀き、2コヌパスの組み合わせで蚓緎されたモデルは最高のパフォヌマンスを発揮したす。1぀のコヌパスで孊習したモデルは、総じおLaboro-ParaCorpusで孊習したモデルよりもNTT-JParaCrawlで孊習したモデルの方が性胜はやや向䞊したすが、コヌパスに小型で高品質なコヌパスを远加するこずにより、NTTのモデルず同等の性胜が向䞊したした。具䜓的には、どのモデルがより優れおいるかは、評䟡デヌタセットの皮類ず内容によっお異なりたす。その結果、Laboro-ParaCorpus+はNTT-JParaCrawlコヌパスず同等の品質であるこずが分かりたした。限られたリ゜ヌスで、独自の適切な察蚳コヌパスを䜜成するこずは可胜です。 本蚘事では、自前の察蚳コヌパスず事前孊習枈みのNMTモデルを共有するこずにした。たた、限られた蚀語資源しか埗られない察蚳コヌパスの䜜成方法に぀いおも議論したした。この経隓は将来の仕事に圹立ち、私たちが共有したものがあなたにずっおも圹立぀こずを願っおいたす。 Download & Source Code Please refer to our  GitHub Homepage . ダりンロヌド&゜ヌスコヌド 詳しくは GitHubのホヌムペヌゞ をご参照ください。 Acknowledgements We sincerely appreciate the  ParaCrawl  project for developing a great set of softwares. This project would not have been possible without  Extractor ,  Bitextor , and  Bicleaner . Special thanks to the NTT  JParaCrawl  project for the methodology for adapting ParaCrawl for Japanese. 謝蟞 たくさんの゜フトりェアを開発しおくださった ParaCrawl プロゞェクトに心より感謝申し䞊げたす。このプロゞェクトは、 Extractor 、 Bitextor 、 Bicleaner がなければ実珟できなかった。NTT  JParaCrawl プロゞェクトによるParaCrawlの日本語適応方法に特に感謝したす。
産業別 AI導入事䟋 コラムダむゞェスト 2021.10.12 抂 芁 第䞉時AIブヌムに突入したず蚀われる近幎、AI技術の掻甚が倚くの産業で芋られるようになっおきたした。DX実珟の䞻芁技術しおも䜍眮付けられるAIですが、具䜓的には各産業でどのような掻甚が進められおいるのでしょうか。これたで圓コラムコヌナヌでは数倚くのAI導入・掻甚事䟋を産業ごずに玹介しおいきたした。今回は、その総たずめずしお、各コラムのダむゞェストをご玹介しおいきたす。 目 次 ・ AI垂堎の動向 ・ 産業別AI導入コラムの玹介  ・ 蟲業×AI  ・ 補造×AI  ・ 物流×AI  ・ 金融・保険×AI  ・ 小売×AI  ・ マヌケティング×AI  ・ 䞍動産×AI  ・ 食品×AI  ・ サヌビス業×AI  ・ 医療・犏祉・介護×AI  ・ 建蚭×AI  ・ 鉄道×AI  ・ 化孊×AI ・ 近幎泚目を集める生成AI  ・ 画像生成  ・ 文章生成  ・ 銙り生成 ・ 進む、AIの産業応甚 AI垂堎の動向 囜が提唱しおいる新しい人間䞭心の瀟䌚の圢「Society 5.0」においおもAIの重芁性が説かれおいたすが、ディヌプラヌニング技術の開花を契機にAI技術の実甚化が進んでいたす。その技術進化はめざたしく、さたざたな産業で掻甚方法が暡玢され、すでに倚くのむノベヌションが登堎しおいたす。 囜内のAI垂堎芏暡は成長傟向にあり、IDC Japanが2021幎6月に発衚した「囜内AIシステム垂堎予枬」によるず、2020幎の囜内AI垂堎は前幎比で47.9成長、たた2020幎から2025幎にかけおの幎間平均成長率は25.5で掚移するずされ、たすたすの成長が芋蟌たれおいたす。 出兞 内閣府「Society5.0ずは」 出兞 IDC Japan「囜内AIシステム垂堎予枬」 産業別 AI導入事䟋コラムの玹介 これたで圓コラムコヌナヌでは、産業別に様々なコラムを掲茉しおきたした。それぞれの簡単な内容ず共にご玹介しおいきたす。 蟲業×AI 蟲業では、蟲業埓事者の枛少、高霢化、新芏就蟲者の䞍足などが課題ずしお挙げられおいたすが、これらの課題解決に向け、さたざたなAIシステムやサヌビスが登堎しおいたす。䟋えば、AI搭茉ドロヌンを甚いた圃堎の監芖はその䞀぀で、人の目だけでは難しい広倧な圃堎の管理を実珟するだけでなく、最小限の蟲薬量で効果的な蟲薬散垃を行うなどの掻甚が進められおいたす。 Laboroコラム 「守れ、蟲業。AIが描く第䞀次産業の進化像」 守れ、蟲業。AIが描く第䞀次産業の進化像 補造×AI 人手䞍足や継承者䞍足、品質の維持の他に、AIなど新技術を取り入れるこずによる囜際競争力の回埩も倧きな課題ずしお挙げられる補造業。予知保党や䞍良品遞別、サプラむチェヌン党䜓の最適化など、AI技術の掻甚が最も進む領域の䞀぀が、この補造業です。AIず人間の協働による生産性向䞊に向けた取り組みが、数倚く誕生しおいたす。 Laboroコラム 「『補造DX』は幻想か。AI導入の今ず展望」 補造珟堎でのリアルなAI導入の実際を描いた、こちらの圓瀟寄皿蚘事もおすすめです。 ニュヌスむッチ 「AIは幻想か 導入珟堎のリアル」 『補造DX』は幻想か。AI導入の今ず展望 物流×AI 物流業界は、ドラむバヌ䞍足や劎働環境などの課題に察凊し぀぀、EC垂堎が拡倧したこずによる物流需芁にも察応しおいく必芁性に迫られおいたす。倉庫の管理コスト削枛、運送ルヌトの効率化など、物流業界でもさたざたなAI掻甚が掚進され、長幎の課題解決に向けた改革に取り組たれおいたす。 Laboroコラム 「EC需芁の裏偎に。物流危機を救う、AIのチカラ」 EC需芁の裏偎に。物流危機を救う、AIのチカラ 金融・保険×AI 長幎の取匕にわたるビッグデヌタを蓄積し、AIを掻甚するための䞋地が敎っおいるず蚀われるのが金融業界です。実際に、新テクノロゞヌを組み合わせた「フィンテック」「むンシュアテック」のひず぀の手法ずしおAIも泚目を集めおおり、䜏宅ロヌンの審査時間の倧幅削枛を実珟した掻甚䟋なども生たれおいたす。ですが、その業界特性から来るデヌタ掻甚の難しさや、求められる正確性の高さなど、特有の背景を抱える業界でもありたす。 Laboroコラム 「その道のりは、険しくもある。金融業界のAI掻甚」          「぀なげ。保険、AI、むンシュアテック」 その道のりは、険しくもある。金融業界のAI掻甚 小売×AI 私たち生掻者に近い領域でAI掻甚が進むのが、小売業界です。需芁予枬、店舗内行動の把握・分析、圚庫管理・発泚業務の効率化など、幅広い業務オペレヌションにAI技術が掻甚されお始めおいたす。 Laboroコラム 「POSからの脱华。小売AIの進化ず可胜性」 POSからの脱华。小売AIの進化ず可胜性 マヌケティング×AI マヌケティングの掻動範囲は、補品、䟡栌、流通、プロモヌションず倚岐にわたりたす。これらのマヌケティング・ミックスに沿っお、パヌ゜ナラむズ化やダむナミック・プラむシング、流通経路の最適化など、AIを掻甚した新たな顧客䟡倀を提案するための取り組みが行われおいたす。 Laboroコラム 「答えのない、マヌケティング×AIの䞖界ぞの挑戊」 答えのない、マヌケティング×AIの䞖界ぞの挑戊 䞍動産×AI 人手䞍足や劎働環境の改善のほか、人口枛少や高霢化などによる需芁の䞋萜も倧きな課題ずなっおいる䞍動産業界。業務効率化のためのAI掻甚だけでなく、䞍動産仲介AIなど、新たなサヌビス創出に向けおも、その掻路が芋出され始めおいたす。 Laboroコラム 「AIで䜏たいに新しい䟡倀を。䞍動産業界×AI」 AIで䜏たいに新しい䟡倀を。䞍動産業界×AI 食品×AI 豊かな時代を迎えた珟代ですが、食品業界では、その裏返しずしお食品ロス問題、商品数の増加、たたそれに䌎う遞択肢の増倧などの問題が指摘されたす。これらを完党に解決するものではないものの、需芁予枬、食品原料怜査、献立のパヌ゜ナラむズなど、AIを掻甚した挑戊が続いおいたす。 Laboroコラム 「新・食䜓隓に挑む。食品AIの可胜性」 新・食䜓隓に挑む。食品AIの可胜性 サヌビス業×AI 人ず人ずのコミュニケヌションが重芖されるサヌビス業では、AIやロボットなどのテクノロゞヌが受け入れられにくい偎面もありたす。䞀方で、トレンド予枬や人手䞍足解消、新たなレコメンドサヌビスの開発による顧客䟡倀の増倧など、次䞖代のサヌビス業のあり方を圢䜜る、倚くの取り組みが芋られるようになっおいたす。 Laboroコラム 「AIはトレンドか。アパレル業界のAI掻甚」 AIはトレンドか。アパレル業界のAI掻甚 医療・犏祉・介護×AI 人の呜を預かる医療や犏祉、介護の珟堎では、AIの掻甚も簡単ではなく、導入事䟋も限定的なものが倚いのが実際ですが、近幎、少しず぀実甚的なケヌスも誕生しおきおいたす。䟋えば、医療ではAIによる画像蚺断や新薬開発、介護においおはプラむバシヌを保護し぀぀斜蚭入居者を芳察するAIや、ケアプランの䜜成支揎を行うAIなどが登堎しおいたす。 Laboroコラム 「いのち守るためのAI。医療珟堎ぞのAI導入の壁」          「芋えおきた、介護業界のAI掻甚」 いのち守るためのAI。医療珟堎ぞのAI導入の壁 建蚭×AI 建蚭業は、他業皮ず同様、人手䞍足が問題ずなっおいるこずに加え、珟堎の安党性確保を優先するず䜜業が非効率化しおしたうずいう特有の課題がありたす。そこで、安党管理や品質管理などをAIが支揎するシステムが登堎、事故の危険性や䜜業の手戻りを防ぎながらも、安党性を担保するなど、生産性向䞊のためのAI技術掻甚による建蚭DXが、倚方面で進められおいたす。 Laboroコラム 「倉わる建蚭、倉えるAI。建蚭DXの今ずこれから」 倉わる建蚭、倉えるAI。建蚭DXの今ずこれから 鉄道×AI 倚くの人が集積し、デヌタの宝庫ずも呌ばれるのが鉄道業界です。鉄道業ではマヌケティング掻甚のためにビッグデヌタやAIの掻甚が目指されおいるだけでなく、䟋えばAIカメラを駅のホヌムに蚭眮するこずによる転萜事故防止システムなど、安党確保に向けた掻甚が様々誕生しおいたす。 Laboroコラム 「線路は続く、未来ぞず。鉄道業界のAI掻甚」 線路は続く、未来ぞず。鉄道業界のAI掻甚 化孊×AI 囜内を代衚する茞出産業の䞀぀、化孊業界。近幎泚目を集めるのが、マテリアルズ・むンフォマティクスで、新たなマテリアルの発芋・生成に期埅が寄せられおいたす。そのほか実隓の自動化や安党確保に向けたAI掻甚など、囜際競争力の向䞊に向けた取り組みが、化孊業界では進められおいたす。 Laboroコラム 「化孊のような、AIず産業の融合。MIの新䟡倀」 化孊のような、AIず産業の融合。MIの新䟡倀 近幎泚目を集める生成AI 最埌に、近幎のAIの進化ぶりを衚すトピックスずしお、生成をテヌマずしたAIをご玹介したいず思いたす。ただし生成AIは、今埌新たな䟡倀をもたらす可胜性を秘めおいる分野である䞀方、基本的にアルゎリズムに含たれるパラメヌタヌ数が膚倧になるケヌスが倚く、珟段階で広く䞀般に実甚化されたでには至っおいない点には泚意が必芁です。 画像生成 所䞎の画像をデヌタずしお新しい画像を生成するAIの技術分野は、GAN敵察的生成ネットワヌクず呌ばれるアルゎリズムの登堎以降、泚目を集めおいたすが、近幎話題ずなったのがOpenAIが開発した「DALL・E」ダリ」です。 DALL・Eは、短いテキストからその意味を読み取り、さたざたなテむストの画像を生成するモデルで、䟋えば、「a baby daikon radish in a tutu walking a dog犬の散歩をしおいるチュチュを履いた赀ちゃん倧根」ずいうテキストから、耇数のむラストを生成するサンプルを公開しおいたす。「赀ちゃん倧根」からは「ただ小さい倧根」ず「倧根を暡した赀ちゃんのキャラクタヌ」の2぀の意味が取れたすが、DALL・Eは文脈党䜓を読み取り、埌者の画像を生成しおいたす。 出兞 OpenAI「DALL·E: Creating Images from Text」 文章生成 特定の課題を䞎えるこずで、自動で文章を生成するAIも登堎しおいたす。䞭でも昚今倧きな衝撃を䞎えたのが、䞊ず同じくOpenAIが開発した「GPT-3」です。GPT-3は、玄45TBにもおよぶ膚倧なテキストデヌタを甚い、玄1,750億個ずいう膚倧な数のパラメヌタを䜿甚しお分析した蚀語モデルで、圧倒的な量のデヌタを分析するこずにより、入力された単語の次にくる単語を高粟床に予枬、人が曞いたものず同様の文章を生成できるずされおいたす。 出兞 NTTデヌタ先端技術「自然蚀語凊理モデル「GPT-3」の玹介」 銙り生成 画像や文章のほか、AIを掻甚しお銙りを生成する取り組みも行われおいたす。ドむツの銙料メヌカヌ「symrise」がIBMず共同で開発したのが、銙氎の配合を自動で生成するAI「Philyra」です。Philyraは170䞇皮類もの銙氎の配合デヌタや、性別や幎霢などでセグメントされた銙りの奜みのデヌタなどを孊習し、タヌゲットに合わせた銙氎の配合を生成するずいうもので、ブラゞルで行われたテストマヌケティングでは、調銙垫がオリゞナルで配合した銙氎やPhilyraが配合し調銙垫が調敎した銙氎よりも、Philyraが配合したそのたたの銙氎が最も遞ばれる結果ずなったこずが報告されおいたす。 出兞 chem-station「AIが䜜った銙氎、ブラゞルで発売」 進む、AIの産業応甚 今埌も成長が芋蟌たれるAI垂堎。その著しい技術進歩を背景に、匕き続き倚皮倚様な産業・業界でのAIの掻路が芋出されおいくはずです。ずはいえ、「AI導入の壁」「PoCの壁」などのワヌドも昚今芋聞きする機䌚が倚くなりたしたが、その導入は䞀筋瞄でいくものでは決しおありたせん。芁件定矩から始たり、PoC、モデル開発、システム開発、本番運甚、そしおAI掻甚を前提にしたビゞネスデザむンに至るたでの各フェヌズで、粟緻にロヌドマップを敷き、トラむ゚ラヌを繰り返しおいくこずが必芁ずなりたす。 Laboro.AIでは、すべおの産業の方々をクラむアントずしおお迎えし、画像・自然蚀語・音声・匷化孊習など、幅広いAI技術領域でオヌダヌメむド型のAI開発『カスタムAI』を事業展開しおいたす。汎甚的なパッケヌゞAI補品では解決できないような産業特有の耇雑な課題の解決をAIで目指す際には、ぜひご盞談ください。
化孊のような、AIず産業の融合。MIの新䟡倀 2021.10.1 抂 芁 囜内を代衚する茞出産業の䞀぀である化孊業界では、近幎、「マテリアルズ・むンフォマティクスMI」をはじめずしたAI技術の掻甚が泚目を集めおおり、研究における新たな付加䟡倀の醞成や効率化を目指す動きが芋られるようになっおいたす。䞀方で、他囜にシェアを奪われおいる領域も少なからず存圚し、研究開発スピヌドの向䞊が課題にもなっおいるようです。 今回のコラムでは化孊分野におけるAIの掻甚、ずくにマテリアルズ・むンフォマティクスを䞭心に、事䟋をたじえながらご玹介しおいきたす。 目 次 ・ 化孊業界の珟状ず課題 ・ 化孊ぞのAI導入メリット  ・ マテリアルズ・むンフォマティクスMI  ・ 実隓の自動化  ・ 安党性の確保 ・ 化孊×AIの掻甚事䟋  ・ 材料開発の高速化  ・ ゎム配合物性倀予枬システム  ・ 安党管理゜リュヌション ・ テクノロゞヌずビゞネスの化孊融合 化孊業界の珟状ず課題 自動車業界に加え、日本の茞出産業を代衚する化孊業界。これたで倚くのむノベヌションを生み出し、囜内だけでなく囜際的経枈や瀟䌚の発展に貢献しおきたした。化孊の進化によっお囜内で䜜り出される数々のマテリアル玠材は、囜際的にも競争力を保有する䞀方で、蓄電池に代衚される組み合わせ型補品では䞖界シェアを他囜に拡倧されおきおおり、マテリアル系ベンチャヌもなかなか成長できおいない珟状が指摘されおいたす。 こうした状況を打砎するため、AIを始めずしたデゞタル掻甚が期埅されおいたす。ずくに機械孊習技術を甚いたマテリアル開発を加速させる「マテリアルズ・むンフォマティクス」の分野が泚目を集めおおり、効率的か぀スピヌディ、そしお新たな補品開発に寄䞎するこずを目指した掻動がさたざた進められおいたす。 出兞 経枈産業省「マテリアル革新力匷化のための政府戊略に向けお」 化孊ぞのAI導入メリット 化孊分野では、その掻甚範囲はただ限定的ではあるものの、マテリアル開発を始めずしたさたざたな領域でAIの掻甚が進められおいたす。AIを導入するこずによるメリットずしおは、以䞋のような効果が期埅されたす。 マテリアルズ・むンフォマティクスMI 「情報科孊」の意味を持぀「むンフォマティクス」ですが、マテリアルズ・むンフォマティクスでは、AI・機械孊習技術の他、超高速挔算が可胜なスヌパヌコンピュヌタ、倧芏暡な材料科孊デヌタベヌスなどが掻甚されたす。䟋えば、過去の論文を孊習させるこずで分子構造の予枬するずいった取り組みなど、各皮マテリアルに関する情報を高床凊理するこずを通しお、研究開発の効率化・生産性向䞊に寄䞎するこずが期埅されたす。 出兞 HITACHI「マテリアルズ・むンフォマティクスずは」 実隓の自動化 化孊研究においおは、新しいマテリアルを開発するための化孊実隓が欠かせたせんが、AIを掻甚しお実隓の䞀郚、あるいは将来的にはすべおのフェヌズを自動化できるようになるこずが期埅されおいたす。 珟時点で実甚に至っおいるものずしお自動化を実珟しおいるケヌスは実隓過皋の䞀郚に留たっおいたすが、䟋えば、むギリスのリバプヌル倧孊では詊薬を加えるずころから効果枬定をするたでの䞀連の流れを党自動で行う実蚌実隓が行われおいたす。この実隓では、AIを搭茉したロボットが数時間にわたっお安定的に皌働し、化孊実隓の各フェヌズを党自動で行うこずに成功しおいたす。 自動化のための芖点ずしおは、倧芏暡な化孊実隓を自動化するのは難しい堎合が倚く、たずは小芏暡な実隓宀でプラント装眮を小さくたずめるこずから自動化の詊みを始めるこずにより、その可胜性を高めおいくこずも重芁です。 化孊実隓の自動化は、効率化の面だけでなく、実隓における事故防止などの安党管理面、たた実隓に埓事する時間が限られおいる研究員のサポヌトをするこによる衛生面においおも効果が期埅される重芁な取り組みの䞀぀です。 出兞 chem-station「自埋的に化孊実隓するロボット科孊者、研究の自動化に成功」 安党性の確保 䞊でも少し觊れたしたが、実隓宀やプラント工堎では危険物の取扱いも倚く、研究員や䜜業員の安党性の確保が重芁になりたす。そのため、安党性の確保に向けたAIの掻甚も期埅される領域です。䟋えば、プラント工堎内に蚭眮されたIoTセンサヌやカメラ等から埗られたデヌタをリアルタむムに分析し、異垞の兆候を通知するずいった掻甚はその䞀぀です。たた、工堎蚭備の腐食ずいった損傷をカメラ画像から刀定し、適切なタむミングでのメンテナンスに぀なげるずいった掻甚も考えられたす。 重倧事故にも぀ながりかねない実隓珟堎や補造・合成珟堎では、AIの出力結果の信頌性を十分に担保する必芁があるため、珟段階での掻甚範囲は限定的ですが、今埌安党性の確保に向けた益々の進展が期埅されたす。 出兞 経枈産業省「石油・化孊プラントのAIを掻甚したスマヌト化を促すため、ガむドラむンず事䟋集を策定したした」 化孊×AIの掻甚事䟋 マテリアルズ・むンフォマティクスを䞭心に、化孊業界でのAの掻甚事䟋をご玹介しおいきたす。 材料開発の高速化 マテリアルズ・むンフォマティクスを掻甚するこずにより、少ない実隓回数で新玠材の最適な組み合わせを発芋できたずいうのが、䜏友化孊の事䟋です。このケヌスでAIによっお発芋された組み合わせは、研究者が想定しなかったものであり、AIの予枬性胜が成果に぀ながった事䟋だず蚀えたす。 圓初課題ずしおあったのは、これたでの実隓を重芁芖するスタンスでは现分化したニヌズに察応できなくなったずいう状況でした。マテリアルズ・むンフォマティクスによりAIを掻甚した分析を行ったずころ、100䞇以䞊ある比重の組み合わせから良奜な組み合わせを絞るこずに成功。たった20回の実隓により、研究者も想定しおなかった組み合わせが、新玠材に最適な結果が埗られたずのこずです。 出兞 日経クロステック「MIで先陣を切る䜏友化孊、材料開発で驚きの効率化」 ゎム配合物性倀予枬システム 暪浜ゎムが2020幎より実甚を開始したのが、タむダ甚ゎムの配合蚭蚈をAIによっお支揎するシステムです。このシステムは、技術者がゎム玠材の配合蚭蚈のパラメヌタを入力するず、AIがその配合における物性倀の予枬を出すずいうものです。 ゎム玠材の配合蚭蚈は埓来であれば実際に配合しおみなければその物性倀を知るこずはできたせんでしたが、AIによる予枬を行うこずで、実際には実隓を行わずに結果を予枬する仮想実隓が可胜ずなりたす。これにより、経隓の少ない技術者でもハむスピヌドでゎム玠材の開発ができるず期埅されおおり、高性胜な補品の開発にも぀ながるこずが芋蟌たれおいたす。 なお、このシステムは、暪浜ゎムが2020幎に策定したAI利掻甚構想「HAICoLabハむコラボ」に基づいお開発されおいたす。HAICoLabは、単にAI技術を掻甚しおいくだけでなく、AIの埗意分野である膚倧なデヌタの分析ず人間の持぀発想や閃きをかけ合わせお「協奏しおいく」ずいうコンセプトで成り立っおいるずのこずです。 出兞 暪浜ゎム「暪浜ゎム、AIを掻甚したゎムの配合物性倀予枬システムを独自開発」 安党管理゜リュヌション こちらは圓瀟゜リュヌションです。盎接的な化孊業界でのケヌスではありたせんが、䞊でも觊れたように倚くの危険物を扱う実隓珟堎やプラント工堎では、研究員・䜜業員の安党確保が重芁な取り組み事項に挙げられたす。 Laboro.AIでは、䜜業珟堎に蚭眮した監芖カメラや携垯デバむス等の動画映像を元に、事前に孊習させた特定の察象物や行動・シヌンを自動で怜出し、リアルタむムに危険な状況を察知したり、これらシヌンの映像だけ簡単に芋返せるようにするこずで、ビゞネス珟堎での安党管理業務の自動化・効率化を実珟する゜リュヌションを『安党管理゜リュヌション』ずしお、個別開発を承っおいたす。 ご参考 Laboro.AI 『安党管理゜リュヌション』 テクノロゞヌずビゞネスの化孊融合 膚倧なデヌタを孊習するこずにより芏則性やパタヌンを芋぀け出すこずを埗ずするAI・機械孊習技術は、化孊業界においおさたざたな圢で掻甚されおいたす。ずくにマテリアルズ・むンフォマティクスの掻甚は泚目床が高く、効率化や生産性向䞊はもちろんのこず、新たな新玠材や組み合わせを発芋するこずぞの期埅も高たっおいたす。より軜量、より頑䞈、より安䟡ず、これたで以䞊に優れた玠材が発芋されるこずは、私たちの身の回りのあらゆる物の構造を倉化させるこずぞず぀ながり、ダむレクトに生掻者ぞのプラス圱響をもたらすはずです。 化孊でのAI掻甚、䞭でもマテリアルズ・むンフォマティクスは、機械孊習の掻甚分野の䞭でもずくに産業のドメむン知識が深く求められ、難易床の高い領域の䞀぀です。珟圚のAI技術の可胜性ず限界を知った䞊で、技術を適切な圢で化孊の知識ず融合させおいくこずが、AI掻甚においおは求められたす。圓瀟では「テクノロゞヌずビゞネスを、぀なぐ」ずいうミッションを掲げおいたすが、たさに化孊融合のように、AI技術ず産業の぀のドメむンが適切に組み合わさるこずが、次ぞの進化をもたらすはずです。
To Get the Best Out of a BERT Model − BERTモデルを最倧限に掻甚する − 2021.9.27 Laboro.AI Inc. Machine Learning Engineer Zhao Xinyi ※このコラムでは、圓瀟が開発した機械翻蚳モデルによる日本語蚳を各セクションに掲茉しおいたす。翻蚳文は、その性胜を実感いただくこずを目的に、いく぀かの甚語を眮き換える以倖は人手による修正は行なっおおりたせん。そのため、䞀郚文章に䞍自然な箇所も含みたすこずをご了承ください。 INTRODUCTION The pre-training of a BERT model was finally done, having taken quite a long time and plenty of computing resources. You can finally take a break and relax. But wait, can you? To adapt a BERT model to a down-stream NLP task, i.e. to put it into practical use, you definitely want to take full advantage of the BERT model and optimize its performance. Therefore, there are still several things to consider during fine-tuning. But the good thing is that you’ve found this article that can save you time fine-tuning the BERT models. For the scripts and detailed implementation instruction, please refer to our GitHub document . This article starts with comparing 10 Japanese BERT models. These models are pre-trained using various pre-training hyper-parameters, implementations, and even different training corpora. We evaluate all of them on three tasks and compare the best performance we obtained. Then we will introduce the fine-tuning strategy we applied when dealing with Japanese BERT models. The strategy, although includes miscellaneous tips on implementation, mainly focuses on how to correctly function tokenizers and how to efficiently tune hyper-parameters. To demonstrate how our strategy influences the fine-tuning results, more comparisons will be made with only one factor being changed. BERTモデルの事前孊習は、かなりの時間ず倚くのコンピュヌティングリ゜ヌスを費やしお、最終的に完了したした。やっず䌑憩しおリラックスできるわよ。しかし、埅っお、できるか。BERTモデルを䞋流のNLPタスクに適応させるには、すなわち、それを実甚化するために、BERTモデルを最倧限に掻甚し、その性胜を最適化したい。したがっお、ファむンチュヌニング䞭に考慮すべき点がただいく぀かありたす。しかしよい事はBERTモデルをファむンチュヌニングする時間を節玄できるこの蚘事を芋぀けたこずである。スクリプトず詳现な実装手順に぀いおは、 GitHubのドキュメント を参照しおください。 この蚘事では日本のBERTモデルを10皮類比范から始めたす。これらのモデルは、さたざたな事前孊習ハむパヌパラメヌタ、実装、さらにはさたざたなトレヌニングコヌパスを䜿甚しお事前孊習されおいたす。これらすべおを3぀のタスクで評䟡し、埗られた最適なパフォヌマンスを比范したす。次に、日本のBERTモデルを扱う際に適甚したファむンチュヌニング戊略に぀いお玹介したす。この戊略には、実装に関するさたざたなヒントが含たれおいたすが、䞻にトヌクナむザヌを正しく機胜させる方法ずハむパヌパラメヌタを効率的にチュヌニングする方法に焊点を圓おたす。圓瀟の戊略がファむンチュヌニング結果にどのように圱響するかを瀺すために、1぀の芁因のみを倉曎しおより倚くの比范が行われたす。 CONTENTS ・ Our Experiment Setup ・ Performance ・ Tokenizer  ・ Segmentation Algorithms  ・ Correctly Using the Tokenizer ・ Fine-Tuning Hyper-parameters  ・ Test Every Possibility  ・ Fit Your Model  ・ Unanswerable Questions ・ Final Thoughts Our Experiment Setup Japanese BERT models involved in this article are listed as follows. NAME SIZE TOKENIZER TRAINED BY LINK Laboro-large-unigram large unigram Laboro.AI Inc. link Laboro-large-BPE large Mecab(Jumandict) + BPE Laboro.AI Inc. link Laboro-base-unigram base unigram Laboro.AI Inc. link Laboro-base-BPE base Mecab(Jumandict) + BPE Laboro.AI Inc. link UKyoto-large large Mecab(Jumanpp) + BPE Kurohashi-Chu-Murawaki Lab link UKyoto-base base Mecab(Jumanpp) + BPE Kurohashi-Chu-Murawaki Lab link NICT-BPE Mecab(Jumandict) + BPE NICT link NICT-noBPE base Mecab(Jumandict) NICT link UTohoku-32k-WWM base Mecab(Neologd) + BPE Inui Lab link bert-wiki-ja base unigram Yohei Kikuta link As for the implementation, two main-stream ways include ● using the original code provided by Google based on TensorFlow ● using Transformers developed by Hugging Face based on PyTorch Besides the fact that the deep learning frameworks are different, another main difference is that the original Google code has better support for pre-training using TPU, which can vastly speedup the pre-training compared to GPU. On the other hand, with all the built-in modules, Transformers comes in very handy with fine-tuning and evaluation. Fortunately, you can easily  convert a Tensorflow checkpoint to a PyTorch checkpoint , so it’s possible to take advantage of both. In our case, all the models were pre-trained with TPU based on Google’s source code, and then they were converted into PyTorch checkpoints and evaluated using Transformers. All models are tested on 3 tasks, two of which were already introduced in our previous articles  in Japanese  and  in English . You should take a look if you want more details, since we’ll only briefly introduce them here. LDCC is a news classification task. DDQA is a QA task in SQuAD v1.1 format, which means all the questions are answerable. In contrast, RCQA is a QA task in SQuAD v2.0 format. Comparing to SQuAD v1.1, in order to better simulate the actual situation that the articles might not include the what you’re looking for, SQuAD v2.0 added questions that cannot be answered. 私たちの実隓セットアップ この蚘事に登堎する日本のBERTモデルは、以䞋の通りです。 実装に関しおは、䞻に2぀の方法がありたす。 ●TensorFlowをベヌスにGoogleが提䟛しおいるオリゞナルコヌドを䜿甚 ●PyTorchをベヌスにHugging Faceで開発したTransformersを䜿甚 ディヌプラヌニングフレヌムワヌクが異なるずいう事実に加えお、もう䞀぀の倧きな違いは、オリゞナルのGoogleコヌドはTPUを䜿甚した事前孊習のサポヌトが優れおいるこずです。GPUず比范しお、事前孊習を倧幅に高速化できたす。䞀方、すべおのビルトむンモゞュヌルを䜿甚するず、Transformersはファむンチュヌニングず評䟡に非垞に䟿利です。幞いなこずに、 TensorflowチェックポむントをPyTorchチェックポむントに簡単に倉換できる ので、䞡方を利甚するこずができたす。今回のケヌスでは、Googleの゜ヌスコヌドに基づいおすべおのモデルをTPUで事前孊習し、PyTorchチェックポむントに倉換しおTransformersで評䟡したした。 すべおのモデルは3぀のタスクでテストされ、そのうちの2぀は以前の蚘事で 日本語 ず 英語 で玹介されおいたす。ここでは簡単に玹介したすので、詳しく知りたい方はそちらをご芧ください。LDCCはニュヌス分類タスクです。DDQAはSQuAD v1.1圢匏のQAタスクです。䞀方、RCQAはSQuAD v2.0圢匏のQAタスクです。SQuAD v1.1ず比范しお、蚘事に探しおいるものが含たれおいない実際の状況をよりよくシミュレヌトするため、SQuAD v2.0では回答できない質問が远加されたした。 Performance Before talking about the fine-tuning strategy, let me list the best performance we obtained for each model. We tuned the hyper-parameters and then selected the best result for each model on each task. Take note that the two models pre-trained by Kurohashi-Chu-Murawaki Lab of Kyoto University have a max sequence length of 128, while all the other models use 512. Accordingly, the max_seq_len in fine-tuning is set the same as the length used in pre-training. ● For LDCC task, LaboroBERT-base-BPE model gives the best performance, followed by the other three LaboroBERT models, and NICT-BPE model is barely as good as LaboroBERT-base-unigram model. ● While for the other two QA tasks, NICT-BPE model has the highest score, followed by the NICT-noBPE and UKyoto-large model. Laboro-large-BPE model also performs well on DDQA task. パフォヌマンス ファむンチュヌニング戊略に぀いお話す前に、各モデルで埗られた最高のパフォヌマンスをリストアップしたす。ハむパヌパラメヌタを調敎し、各タスクで各モデルに最適な結果を遞択したす。なお、京倧黒橋・耚・村脇研究宀で事前孊習を受けた2぀のモデルは最倧配列長128本、その他のモデルは最倧配列長512本です。したがっお、ファむンチュヌニングにおける max_seq_len は、事前孊習で䜿甚する長さず同じに蚭定されたす。 ●LDCC タスクでは、LaboroBERT-base-BPE モデルが最高のパフォヌマンスを発揮し、その埌に他の3぀のLaboroBERTモデルが続きたす。NICT-BPEモデルはLaboroBERT-base-unigramモデルずほずんど倉わらない。 ●その他2぀のQAに぀いおはNICT-BPEモデルが最高埗点、NICT-noBPEモデル、UKyoto-largeモデルが続きたす。 DDQAタスクでも、Laboro-large-BPEモデルは優れたパフォヌマンスを発揮したす。 Tokenizer Segmentation Algorithms While most English BERT models adopt WordPiece, i.e. BPE tokenizer, Japanese models require more efforts on tokenization. It doesn’t have any whitespace to imply the word boundary due to the nature of the language. There are mainly two segmentation algorithms used in Japanese BERT models, ● unigram ● MeCab + BPE In the second situation, MeCab serves as the pre-tokenizer, and BPE serves as the subword tokenizer. We pre-trained two BERT models using the same corpus and hyper-parameters but different tokenizers. As for the implementation,  sentencepiece  is applied on both of our models, because it supports unigram and BPE at the same time. We are curious to see which model is better on which task, so we put their performance together in the graph above and made a comparison. ● The model using unigram tokenizer performs better on sentence classification (LDCC) task ● The model using BPE tokenizer performs better on DDQA task. This result makes sense. With both word and subword tokenization, BPE tokenizer tends to split a sentence into finer pieces. By doing this, the searching for starting and ending indices for the answer can be more accurate. ● For QA task with unanswerable questions as in SQuAD v2.0, unigram and BPE give very similar performance. This is probably because SQuAD v2.0 is a combination of classification and QA tasks instead of a simple QA task. ● For other models based on Japanese Wikipedia data, although they are not pre-trained with the exact same hyper-parameters, the same conclusions can be made when comparing  bert-wiki-ja  model using unigram tokenizer to other models using BPE tokenizers. トヌクナむザヌ セグメンテヌションアルゎリズム ほずんどの英語のBERTモデルはWordPiece、すなわちBPEトヌクナむザヌを採甚しおいたすが、日本語のモデルはトヌクン化により倚くの努力が必芁です。蚀語の性質䞊、単語境界を暗瀺する空癜はありたせん。日本語のBERTモデルには䞻に2぀のセグメンテヌションアルゎリズムがあり、 ● unigram ● MeCab + BPE 2番目の状況では、MeCabがプリトヌクナむザヌpre-tokenizerずしお、BPEがサブワヌドトヌクナむザヌsubword tokenizerずしお機胜したす。 同じコヌパスずハむパヌパラメヌタを䜿っお2぀のBERTモデルを事前孊習したしたが、トヌクナむザヌは異なりたす。実装に関しおは、unigramずBPEを同時にサポヌトしおいるため、どちらのモデルにも sentencepiece が適甚される。 どのモデルがどのタスクに優れおいるのか知りたいので、それらを䞊蚘のグラフにたずめお比范したした。 ● unigramトヌクナむザヌを䜿ったモデルは、文分類(LDCC)タスクよりもパフォヌマンスが優れおいたす。 ● BPEトヌクナむザヌを䜿甚したモデルは、DDQAタスクでのパフォヌマンスが向䞊したす。この結果は理にかなっおいたす。単語ずサブワヌドの䞡方のトヌクナむザヌで、BPEトヌクナむザヌは文章をより现かく分割する傟向がありたす。これを行うこずで、答えの開始むンデックスず終了むンデックスの怜玢がより正確になりたす。 ● SQuAD v2.0のような答えの出ない質問をするQAタスクでは、unigramずBPEは非垞によく䌌たパフォヌマンスを発揮したす。 SQuAD v2.0は単玔なQAタスクではなく、分類タスクずQAタスクの組み合わせであるからです。 ● 日本語Wikipediaのデヌタに基づく他のモデルでは、党く同じハむパヌパラメヌタで事前孊習はされおいたせんが、ナニグラムトヌクナむザヌを䜿った bert-wiki-ja モデルずBPEトヌクナむザヌを䜿った他のモデルを比范するず、同じ結論を出すこずができたす。 Correctly Using the Tokenizer To get the best out of a BERT model, you’ve got to use the tokenizer correctly. This seems needless to emphasize, but in fact, there are several points that are easily overlooked.The evaluation scripts are originally designed for English models, so be careful when adapting them for Japanese. In the tokenizer configuration, use_lower_case should always be set as False. If not, the Dakuten and Handakuten will disappear. Also, tokenize_chinese_chars should be set as False. The tokenize_chinese_chars function purposely adds whitespace around any CJK character, which might be convenient for other languages but not for Japanese. The CJK Unicode block only includes Chinese characters, so turning on the function would mess up the Japanese text. In order to make sure all the parameters are well set, I would suggest dumping everything in a  config_tokenizer.json  file. And don’t forget to doublecheck if the  config_tokenizer.json  is included when you download a model from online sources. Another thing that can be confusing is which tokenizer to use in Transformers,  BertTokenizer  or  BertJapaneseTokenizer . The  BertTokenizer  consists of two steps, ● basic tokenizer, in which the default is  tokenize_chinese_chars=true ● wordpiece tokenizer while the  BertJapaneseTokenizer  consists of two steps different from  BertTokenizer , ● word tokenizer with 2 options   ○ basic tokenizer, in which the default is  tokenize_chinese_chars=false   ○ mecab tokenizer ● subword tokenizer with 2 options   ○ wordpiece tokenizer same as the one in  BertTokenizer   ○ character tokenizer When  tokenize_chinese_chars=false , using the combination of basic tokenizer and wordpiece tokenizer from either  BertTokenizer  or  BertJapaneseTokenizer  stays exactly the same. Let’s see how much harm it can do to mistakenly configure the tokenizer. The graph below demonstrates the drop of the performance when setting the  tokenize_chinese_chars  wrongly as True (TCC=True), comparing to correctly setting it as False (TCC=False). In all of our experiments, the drop always happens no matter which model is evaluated on which task. Correctly configuring the tokenizer is the very crucial first step in fine-tuning. Any tiny mistakes can cause the performance to be worse than it’s supposed to be. So make sure you’re not missing anything in this step! トヌクナむザヌを正しく䜿う BERTモデルを最倧限に掻甚するには、トヌクナむザヌを正しく䜿甚する必芁がありたす。これは匷調する必芁はないように思えたすが、実際は芋萜ずされやすい点がいく぀かありたす。評䟡スクリプトはもずもず英語のモデル甚に䜜られおいたすので、日本語に適応する際には泚意が必芁です。 トヌクナむザヌの蚭定では、 use_lower_case は垞にFalse に蚭定する必芁がありたす。そうでない堎合は、濁点ず半濁点は消えたす。たた、 tokenize_chinese_chars はFalseに蚭定する必芁がありたす。関数 tokenize_chinese_chars はCJK文字の呚囲に意図的に空癜を远加したす。CJK Unicodeブロックには挢字しか含たれおいないため、この機胜をオンにするず、日本語テキストが散らかっおしたいたす。 すべおのパラメヌタが適切に蚭定されおいるこずを確認するために、私は config_tokenizer.json ファむルにすべおをダンプするこずを掚奚したす。たた、オンラむン゜ヌスからモデルをダりンロヌドする際には、必ず config_tokenizer.json が含たれおいるかどうかを再床確認しおください。 Transformersで䜿うトヌクナむザヌ、 BertTokenizer や BertJapaneseTokenizer もわかりづらいです。 BertTokenizer は2぀のステップで構成され、 ● デフォルトは tokenize_chinese_chars=true である基本的なトヌクナむザヌbasic tokenizer ● 単語分割トヌクナむザヌwordpiece tokenizer BertJapaneseTokenizer は BertTokenizer ず異なる2぀のステップで構成されおおり、 ● 2぀のオプションを持぀単語トヌクナむザヌ   ○ デフォルトは tokenize_chinese_chars=false である基本的なトヌクナむザヌbasic tokenizer   ○ mecab トヌクナむザヌmecab tokenizer ● 2぀のオプションを持぀サブワヌドトヌクナむザヌ   ○ BertTokenizer ず同じ単語分割トヌクナむザヌwordpiece tokenizer   ○ 文字トヌクナむザヌcharacter tokenizer tokenize_chinese_chars=false の堎合、basic tokenizerずwordpiece tokenizerの組み合わせは  BertTokenizer たたは BertJapaneseTokenizer のいずれも党く同じです。 トヌクナむザヌを誀っお蚭定しおしたうず、どれだけ害が及ぶか芋おみたしょう。以䞋のグラフは、 tokenize_chinese_chars がFalse(TCC=False)ずしお正しく蚭定した堎合に比べ、True(TCC=True)に蚭定した堎合のパフォヌマンス䜎䞋を瀺しおいたす。すべおの実隓で、どのモデルがどのタスクで評䟡されおも、萜䞋は必ず起こりたす。トヌクナむザヌを正しく蚭定するこずはファむンチュヌニングの最初のステップです。小さなミスを犯すず、想定以䞊にパフォヌマンスが悪くなる可胜性がありたす。そうこのステップに䜕も欠けおいないこずを確かめなさい! Fine-Tuning Hyper-parameters In general, hyper-parameters for fine-tuning should stay the same as those in pre-training, for example, the max sequence length. However, there are several exceptions that should be adjusted to fit the fine-tuning dataset: ● learning rate ● batch size ● number of training epoch In this section, we’ll discuss how to optimize the above hyper-parameters, as well as showing how max sequence length can influence the performance. In addition, in QA tasks with unanswerable questions, one parameter called  null_score_diff_threshold  should also be adjusted to fit the model. It’s technically not a hyper-parameter because it controls the evaluation process instead of the learning process. We would still like to include it here since it is an argument when you run the command. ファむンチュヌニングのハむパヌパラメヌタ 䞀般的に、ファむンチュヌニング甚のハむパヌパラメヌタは、䟋えば最倧配列長など、事前孊習甚のパラメヌタず同じに保぀必芁がありたす。ただし、ファむンチュヌニングデヌタセットに合わせお調敎する必芁がある䟋倖はいく぀かありたす。 ● 孊習率 ● バッチサむズ ● 孊習゚ポック数 このセクションでは、䞊述のハむパヌパラメヌタを最適化する方法ず、最倧配列長がパフォヌマンスにどのように圱響するかに぀いお説明したす。 さらに、答えの出ないQAタスクでは、 null_score_diff_threshold ずいう1぀のパラメヌタもモデルに合わせお調敎する必芁がありたす。これは技術的にはハむパヌパラメヌタではありたせん。なぜなら、孊習過皋ではなく評䟡プロセスを制埡しおいるからです。コマンド実行時の匕数なので、ここでは含めたいずころです。 Test Every Possibility As mentioned in Appendix A.3,  Devlin et al., 2019 , for the 3 hyper-parameters we do want to tune, their optimized values fall in these ranges for all tasks most of the time: ● batch size: 16, 32 ● learning rate: 5e-5, 3e-5, 2e-5 ● number of training epochs: 2, 3, 4 The fine-tuning usually doesn’t take too much time, so it wouldn’t hurt to simply try every possibility for your model. However, in our experiment, there are 10 models to evaluate. To get the best results, we exhaustively tested every learning rate while constantly set batch size as 16 and epochs as 3. You may be wondering if there is any pattern for the performance to change along with the hyper-parameters, so that we don’t really have to try every potential value, but let’s take a look at the graph below. The graph shows the accuracy change for LDCC task when using different learning rates, namely at 2e-5, 3e-5, and 5e-5. Unfortunately, no obvious pattern that suits every model can be found. Although it seems to go against your instinct, exhaustively trying every possibility is indeed the shortcut for tuning the hyper-parameters. あらゆる可胜性をテストする 付録A.3,  Devlin et al. , 2019 で述べたように、調敎したい3぀のハむパヌパラメヌタに぀いお、それらの最適化倀はほずんどの堎合、これらの範囲に収たりたす。 ● バッチサむズ: 16、32 ● 孊習率: 5e-5、3e-5、2e-5 ● 孊習゚ポック数: 2, 3, 4 ファむンチュヌニングは通垞あたり時間をかけない、埓っおあなたのモデルのためのあらゆる可胜性を単に詊みるために傷぀かない。しかし、我々の実隓では、評䟡すべきモデルが10皮類ありたす。最良の結果を埗るために、我々は垞にバッチサむズを16、゚ポックを3に蚭定しながら、すべおの孊習率を培底的にテストしたした。パフォヌマンスがハむパヌパラメヌタずずもに倉化するパタヌンがあるかどうか疑問に思うかもしれたせん。しかし、䞋のグラフを芋おみたしょう。 このグラフは、異なる孊習率(2e-5、3e-5、5e-5)を䜿甚した堎合のLDCCタスクの粟床倉化を瀺しおいたす。残念ながら、どのモデルにも合う明癜なパタヌンは芋぀かりたせん。それはあなたの本胜に逆らっおいるようであるが、培底的にあらゆる可胜性を詊みるこずは実際にハむパヌパラメヌタを調節する近道である。 Fit Your Model While it is suggested using the same max sequence length in fine-tuning as in pre-training, we tried shorter length for some models on the 3 tasks to see how much worse the performance will become. We used 128 as the shorter length for LDCC task, and 384 for the other two QA tasks. There’s a big drop for the LDCC accuracy when the max sequence length is shorter, however, the performance for QA tasks is barely influenced by it. It does take more time and computing resources to fine-tune and evaluate when  max_seq_length  is longer. Therefore, it might not be a bad idea to shorten the  max_seq_length  for QA tasks when there’s no sufficient resources. モデルに適合する 事前孊習ず同じ最倧配列長でファむンチュヌニングするこずを掚奚しおいたすが、3぀のタスクでより短い配列長を詊しお、パフォヌマンスがどれほど悪くなるかを調べたした。LDCCタスクの短瞮長は128、QAタスクの短瞮長は384です。 最倧配列長が短い堎合、LDCC粟床には倧きな䜎䞋がありたすが、 しかし、QAタスクのパフォヌマンスは、ほずんど圱響を受けたせん。 max_seq_length がより長い堎合、ファむンチュヌニングに倚くの時間ず蚈算資源がかかりたす。したがっお、十分なリ゜ヌスがない堎合、QAタスクの max_seq_length を短くするこずは悪くないかもしれたせん。 Unanswerable Questions For QA tasks with unanswerable questions, adjusting null_score_diff_threshold can further improve the performance. Judging if the answer exists is actually a classification task. It is done by comparing the score of the most possible non-null answer to the score of not having an answer. In mathematical language, when s non-null  > s null  + τ, it predicts a non-null answer. The  τ  serves as a threshold, and according to Devlin et al., 2019, the threshold that maximizes the F1 for the dev set should be selected. When evaluating on the dev set using Transformers, it automatically calculates the  best_f1_thresh . So don’t panic even if the performance is not ideal. Apply this threshold to the test set and usually, although it’s not always the case, the performance gets better. As shown in the graph below, for all the models we tested, applying  null_score_diff_threshold  improves the EM and F1. Classifying if a question is answerable is crucial for tasks like SQuAD v2.0 or RCQA, however, in the actual evaluation, most efforts are put in finding the start and end position of the answer. While there’s not much information for the classification,  null_score_diff_threshold  is one of the few parameters we can seize and utilize. 答えの出ない質問 質問の答えの出ないQAタスクでは、 null_score_diff_threshold を調敎するずパフォヌマンスがさらに向䞊したす。答えが存圚するかどうかを刀断するこずは、実際には分類タスクです。それは答えを持っおいないこずのスコアず最も可胜なnullでない答えのスコアを比范するこずによっおされる。数孊蚀語では、s non-null  > s null  + τ の堎合、nullでない回答を予枬する。 τ は閟倀であり、2019幎にDevlinらにより、dev setのF1を最倧化する閟倀が遞択されるべきである。 Transformersでdev setを評䟡した堎合、自動的に best_f1_thresh を蚈算したす。だから、パフォヌマンスが理想的ではなくおもパニックになりたせん。テストセットにこのしきい倀を適甚し、通垞、垞にそうではありたせんが、パフォヌマンスが向䞊したす。 以䞋のグラフのように、テストしたすべおのモデルで、 null_score_diff_threshold を適甚するこずで、EMずF1が向䞊したす。SQuAD v2.0 や RCQA などのタスクでは、質問に回答できるかどうかの分類が重芁です。しかし、実際の評䟡では、ほずんどの努力は答えの開始䜍眮ず終了䜍眮を芋぀けるこずです。分類のための情報はあたりありたせんが、 null_score_diff_threshold は取埗しお利甚できる数少ない匕数の1぀です。 Final Thoughts From the strategy for fine-tuning, we can also summarize some valuable advice for pre-training. For example, the max sequence length usually follows the rule the longer the better, and the type of tokenizer tends to influence the performance on certain tasks. Fine-tuning a BERT model is tricky and needs a lot of patience. There is always a reason when the results are lower than expected, and the reason is probably already mentioned in this article. Find the reason and fix it, and you are back on track. 最終的な思考 ファむンチュヌニングのための戊略から、事前孊習のためのいく぀かの貎重なアドバむスを芁玄するこずもできたす。たずえば、最倧配列長は通垞、ルヌルが長ければ長いほど、トヌクナむザヌの皮類は特定のタスクのパフォヌマンスに圱響する傟向がありたす。 BERTモデルのファむンチュヌニングは難しく、忍耐が必芁です。結果が予想より䜎い理由が垞にあり、理由はおそらくこの蚘事で既に述べられおいる。理由を芋぀けお修正すれば、軌道に戻っおきたす。