TECH PLAY

Laboro.AI

Laboro.AI の技術ブログ

å…š147ä»¶

時系列デヌタに異垞発芋。「時系列異垞怜知」ずは 2020.10.20 株匏䌚瀟Laboro.AI リヌド機械孊習゚ンゞニア 倧堎 孝二 抂 芁 気枩や降氎量をはじめずする気象デヌタや亀通量デヌタなど、時間の倉化に沿っおたずめられた情報は、時系列デヌタず呌ばれたす。時系列デヌタは、時期や時間ごずの倉化を捉えるため䞻に甚いられたすが、ビゞネスシヌンではこうした時系列情報をただ捉えるだけでなく、急激な倉化や異垞が起きた堎合にそれを察知したり、堎合によっおは通知するような仕組みを怜蚎するこずも重芁なポむントになるはずです。 このコラムでは、こうした時系列デヌタに衚れる異垞を怜知するための手法「時系列異垞怜知」の玹介ず、ずくにSR法ず呌ばれる手法の技術解説をしおいきたす。 目 次 ・ 時系列異垞怜知ずは ・ Spectral ResidualSR法 ・ SR法の技術抂芁  ・ 技術解説  ・ SR法を異垞怜知に適甚する  ・ 論文著者たちの工倫  ・ SR法のデヌタぞの適甚䟋 ・ いろいろなデヌタに察しおのSR法の適甚  ・ 怜知できるケヌス  ・ 怜知できないケヌス  ・ その他のケヌス ・ たずめ ・ 参考文献 時系列異垞怜知ずは 安定しおいた株䟡が急倉した、動きを保っおいた機械が急におかしな動きをしだした、䞀定量だったSNSの投皿量が激増炎䞊しおいたなど、「い぀もず違う」で衚されるような急激な倉化は、私たちの身の回りでもしばしば発生したす。 「時系列異垞怜知Time Series Anomaly Detection」は、その名の通り、時系列䞊に䞊べられた倧量のデヌタから、通垞ずは異なる倀や倉化、動きを芋぀け出す技術です。䞊の株䟡デヌタや機械センサヌのデヌタ、SNS投皿のようなトラフィックデヌタはその代衚的な䟋ですが、デヌタ䞊に衚れる急激な倉化を捉えるこずは、ビゞネス䞊の危機管理や安党管理に結び぀く重芁な取り組みず蚀えるでしょう。 今回は、その時系列異垞怜知の手法の䞀぀である、Spectral ResidualSR法ず呌びたすを、その研究論文 Time-Series Anomaly Detection Service at Microsoft をベヌスにしながら玹介したいず思いたす。たた、実際にSR法を甚いおデヌタ分析を行い、どのようなデヌタだず異垞を怜知しやすく、たた怜知しにくいのかずいうこずを芋おいきたす。 Spectral ResidualSR法 SR法は、実はもずもず画像デヌタに察しお甚いられおいた手法です。画像の䞭にある人が感じる特城的な箇所、぀たり際立った傟向がある郚分を捉えるための技術ずしおSR法が甚いられたす。 参考文献 ①  具䜓的には、SR法では次元で衚珟される画像デヌタをフヌリ゚空間呚波数に倉換・衚珟した空間で凊理を行うこずで、特城を捉えたす。䞋の図は、入力された画像むメヌゞにSR法を適甚したものです。×、×、×、぀のフィルタヌlocal averageの幅での結果を瀺しおいたすが、いずれでも家のある䜍眮が匷調されおいるこずがわかりたす。 出兞 参考文献①  このSR法を時系列デヌタに適甚するずいうこずは、䞀次元のデヌタに適甚するずいうこずです。先に結果を瀺すず以䞋のようになりたす。次元の画像デヌタず同じように、次元の時系列デヌタでも赀点の郚分の異垞倀が匷調されおいるこずがわかりたす。 出兞 参考文献②  SR法の技術抂芁 以䞋からは、SR法の詳现に぀いお、論文” Time-Series Anomaly Detection Service at Microsoft “ に基づいお、その技術的な抂芁を解説しおいきたす。 SR法によっお算出される倀をsaliency mapず呌びたす。SR法による異垞怜知は、時系列デヌタに察しおSR法を適甚しおsaliency mapを算出、そしおsaliency mapがある閟倀以䞊の点をanomalyアノマリヌ異垞倀ず刀定するものです。 具䜓的には、時系列デヌタから実空間デヌタをフヌリ゚空間に飛ばし、フヌリ゚空間䞊で“ある凊理”をした埌に、実空間に逆フヌリ゚倉換で匕き戻す手法です。“ある凊理”ずいうのは、䞊で芋たように、呚りず違う呚波数領域を際立たせるずいうもので、そうするこずで実空間での特城的な郚分を際立たせるこずができるず考えられおいたす。 問題蚭定ずしお䞀次元デヌタで考えた堎合の手順を、次に解説しおいきたす。 技術解説 \(\vec{x}\ =(x_1, x_2, \cdots, x_n)\)を実空間のベクトルずしたす。これをフヌリ゚倉換するこずで、\(\vec{f}\ =(f_1, f_2, \cdots, f_n)\)が埗られたす。それぞれの\(f_j\)は耇玠数で、\(f_j = r_j \exp(i \theta_j) (r_j, \theta_j \in \mathbb{R})\)ず衚珟したす。そしお、絶察倀成分である\(r_j\)を倉換しお\(f’_j = r’_j exp(i \theta_j) (r’_j, \theta_j \in \mathbb{R})\)を新たに䜜成したす\(r’_j\)を算出する匏は埌述。\(\vec{f’} \ = (f’_1, f’_2, \cdots, f’_n)\)に察しお逆フヌリ゚倉換を行い、実空間に匕き戻したベクトル\(\vec{x’} \ = (x’_1, x’_2, \cdots, x’_n)\)に察しお絶察倀成分を取り出した\(\vec{S} \ = (\|x’_1\|, \|x’_2\|, \cdots, \|x’_n\|)\)をsailency mapず呌びたす。saliency map は、䞊で曞いたずおり、\(\vec{x}\)の人間が芋お「特城的だなヌ」ず感じる点を際立たせたものです。ここで、\(\log{r’_j}\)は、\(\log{r_j}\)に察しお盎近の平均を匕いたもので、数匏で衚珟するず、\(\log{r’_j} =\log{r_j} – \frac{1}{q}\sum_{i=1}^{q}{\log{r_{j+1-i}}}\)です。\(q\)はハむパヌパラメヌタヌで、local average を算出する際に䜿甚するデヌタ数です。 この手順をたずめるず、次のようになりたす。 1. フヌリ゚倉換 ・  \(\mathcal{F}:\vec{x}\ = (x_1, x_2, \cdots, x_n) \mapsto \vec{f}\ = (f_1, f_2, \cdots, f_n)\) ・  \(f_j = r_j \exp(i \theta_j) (r_j, \theta_j \in \mathbb{R})\) 2. フヌリ゚空間での凊理 ・  \(\vec{f}\ = (f_1, f_2, \cdots, f_n) \mapsto \vec{f’}\ = (f’_1, f’_2, \cdots, f’_n)\) ・  \(f’_j = r’_j exp(i \theta_j) (r’_j, \theta_j \in \mathbb{R})\) ・  \(\log{r’_j} =\log{r_j} – \frac{1}{q}\sum_{i=1}^{q}{\log{r_{j+1-i}}}\) 3. 逆フヌリ゚倉換 ・ \(\mathcal{F}^{-1}:\vec{f’}\ = (f’_1, f’_2, \cdots, f’_n) \mapsto \vec{x’}\ = (x’_1, x’_2, \cdots, x’_n)\) ・  \(\vec{S}\ = (\|x’_1\|, \|x’_2\|, \cdots, \|x’_n\|)\) ・  \(\vec{S}\) : saliency map なお、 \(f’_j = exp(i \theta_j)\) ずしおsaliency map を求めるバヌゞョンも存圚しおおり、ほが同じsaliency map が埗られるこずが知られおいたす 参考文献③ 。蚈算負荷的には、\(f’_j = exp(i \theta_j)\)の方が軜く、論文では、\(f’_j = r’_j exp(i \theta_j) (r’_j, \theta_j \in \mathbb{R})\) の方を甚いおいたす。 SR法を異垞怜知に適甚する 䞊の手順で求めた saliency map に察しおスコアを算出し、anomalyを刀定したす。具䜓的には、SRのスコアを \(\frac{S_i – \overline{S_i}}{\overline{S_i}}\) ず定矩し、この倀が閟倀\(\tau\) を超えた堎合にanomalyず刀定したす。ここで\(S_i\) は \(x_i\) ず同じ䜍眮に察応する saliency map で、\(\overline{S_i} =  \frac{1}{z}\sum_{j=1}^{z}{S_{i+1-j}}\) です。\(\tau\) はanomaly刀定の閟倀で、\(z\) はlocal average を算出する際に䜿甚するデヌタ数です。 論文著者たちの工倫 詳しい方ならご存知のずころですが、フヌリ゚倉換はデヌタ端の圱響を匷く受けたす。SR法でもデヌタ端の圱響を受けおしたい、端のsaliency mapに意図しないピヌクが出る傟向がありたす。䞋の図は、巊が時系列デヌタで、右がそのデヌタにSR法を適甚したものです。元々の時系列デヌタでは特に異垞がなかった端が、saliency map では䞡端の倀が倧きくなっおいるのがわかりたす。 saliency map のデヌタ端の意図しないピヌクのケアのために、著者たちは以䞋のように元々の時系列デヌタに倀を远加する工倫を行っおいたす。\(\vec{x} \ = (x_1, x_2, \cdots, x_n)\)に察しお、右端に\(\kappa\)個のデヌタを远加し、新しく\(\vec{\hat{x}}\ = (x_1, x_2, \cdots, x_n, x_{n+1}, \cdots, , x_{n+\kappa})\)を䜜成したす。ここで、\(x_{n+1} = x_{n+2} = \cdots = x_{n+\kappa}\)で、算出匏は以䞋です。 \(\overline{g}\ = \frac{1}{m}\sum_{i=1}^{m} g(x_n, x_{n-i})\) \(x_{n+1} = x_{n-m+1} + \overline{g} \cdot m\) ここで\(g(x_i, x_j)\)は傟きで、 \(g(x_i, x_j) = \frac{x_i – x_j}{i – j}\)です。 \(\vec{\hat{x}} \)に察しお、saliency map: \(\vec{\hat{S}}\ = (\hat{S}_1, \hat{S}_2, \cdots, \hat{S}_n, \cdots, \hat{S}_{n+\kappa})\)を蚈算し、\((\hat{S}_1, \hat{S}_2, \cdots, \hat{S}_n)\)を取り出すず、デヌタ補間を行わなかった堎合よりもキレむなsaliency map を取埗できるこずが実隓的に明らかになっおいたす。 SR法のデヌタぞの適甚䟋 䞊に瀺した時系列デヌタに察しお、SR法を甚いおデヌタ補間を行わなかった堎合\(\kappa=0, m=0\)、デヌタ補間を行なった堎合\(\kappa=5, m=5\)の2通りで、saliency mapずscore を算出した結果が䞋の図です。䞡者でその他のハむパヌパラメヌタヌは共通のものを甚いおおり、\(\log{r’_i}\)を求める際のlocal average の幅 \(q\)は3, scoreを求める際のlocal average の幅 \(z\)は5ずしおいたす。たた、窓幅はデヌタ区間そのもの、぀たり党デヌタを含む幅ずしおいたす。 この図からわかるこずは、2点ありたす。 1. anomaly点に察しお、saliency map、 score の倀が倧きくなっおいお、anomalyを捉えるこずができおいる。 2. デヌタ補間の有効性が確認できる。぀たり、デヌタ補間を行った\(\kappa=5, m=5\)では、saliency mapの右端の倀のピヌクが消えおいる。それに付随する圢で、scoreの右端のピヌクも消えおいる。 ※saliency mapの巊端のピヌクを消したい堎合は、デヌタ補間を巊端にも行えば良い。ただし、score を求める凊理の性質䞊、scoreの巊端のピヌクは消えるのでデヌタ補間を行う必芁はない。 いろいろなデヌタに察しおのSR法の適甚 今回、YAHOO RESERCHの時系列異垞怜知甚のデヌタセット 参考文献④  の党デヌタに察しおSR法の適甚を詊みたした。その䞭からいく぀か抜粋しお、異垞ずしお怜知できそうなデヌタにどのような傟向があるかを定性的に把握しおみたいず思いたす。 䞋図の芋方各段の、 ・巊の図は、YAHOO デヌタセットの時系列デヌタで、黒䞞がanomalyずしお定矩されたもの ・䞭倮の図は、saliency mapデヌタ ・右の図は、saliency mapを求める際に\(f’_j = \exp(i \theta_j)\)ずしたバヌゞョンでのsaliency map 右の図のsaliency mapの蚈算は、蚈算負荷の芳点から軜量化したものですが、䞭倮のものず倧きく違わないこずがわかりたす。 怜知できるケヌス ・呚蟺の点に察しお、飛び出しおいるケヌス 怜知できないケヌス ・なだらかに倉化しおいるような異垞点や異垞点が局圚するケヌス t=500〜600にある異垞点を怜出できおいない t = 900 ~1000 の異垞点の集合を怜知できおいない その他のケヌス 䞀方、目芖では異垞だず思えない異垞点の怜知がSR法だずできるケヌスもありたす。 t= 1000~1500にある異垞点は目芖では気づけないが、SR法だずわかる。 たずめ 今回は、時系列デヌタからの特城や異垞を怜出するための技術、時系列異垞怜知のうち、SR法を解説したした。 SR法は単䞀の閟倀を甚いおいたしたが、より柔軟な圢で異垞怜出を行うこずを目指したSR-CNNずいうモデルも開発されおいたす。SR-CNNは、その名前の通り、SRにCNNConvolutional Neural Network畳み蟌みニュヌラルネットワヌクを組み合わせたモデルです。 SR-CNNのアヌキテクチャ SR-CNNにはチュヌニングの難しさなど、ただ課題が感じられる郚分もありたす。ですが、時系列異垞怜知の技術は、冒頭で玹介した気象デヌタや株䟡、センサヌ領域などだけでなく、そのほか倚くのビゞネス領域での掻甚可胜性をも぀技術です。今埌たすたすの改善ず進歩が進み、様々なビゞネスシヌンで導入されおいくこずが期埅されたす。 参考文献 ① Saliency detection: A spectral residual approach ② Time-Series Anomaly Detection Service at Microsoft ③ Spatio-temporal saliency detection using phase spectrum of quaternion Fourier transform ④YAHOO RESEARCHデヌタセット A Benchmark Dataset for Time Series Anomaly Detection コラム執筆者 機械孊習゚ンゞニア 倧堎 孝二 東京倧孊倧孊院 工孊系研究科物理工孊専攻 博士前期課皋修了。修士工孊。圚孊䞭は、物理の第䞀原理蚈算を甚いお物質の性質の研究を行う。卒業埌、蚌刞䌚瀟のクオンツずしお金利・為替系のデリバティブのプラむシングモデルの䜜成・怜蚌およびリスク蚈算業務を担圓。その埌、車䞡デヌタを甚いたデヌタ分析業務ずサヌビス䌁画や仮説怜蚌PoCに埓事。2020幎2月よりLaboro.AIに参画。
“朚を芋お森を芋る”ように。「キヌポむント怜出」を解説 2020幎10月7日 機械孊習゚ンゞニア 濱本 雅史 抂 芁 画像に写っおいる人などの察象物の特城点を怜出する「キヌポむント怜出」は、画像解析の領域でも䞻芁なトピックの䞀぀です。オヌプン゜ヌスで公開されおいるモデルも倚くあるほか、ビゞネスシヌンでも人䜓等の骚栌怜出や姿勢掚定に利甚されるなど倚くの事䟋が生たれおいたす。 このコラムでは、キヌポむント怜出の抂芁ず、そこで甚いられる代衚的な手法に぀いお最新の研究も螏たえおご玹介しおいきたいず思いたす。 目 次 ・ キヌポむント怜出ずは ・ キヌポむント怜出のビゞネス応甚䟋 ・ キヌポむント怜出の党䜓像 ・ キヌポむント怜出の぀のアプロヌチ  ・ Top-Downアプロヌチ  ・ Bottom-Upアプロヌチ ・ Top-Downアプロヌチの代衚的な手法  ・ DeepPose  ・ Mask R-CNN  ・ Cascaded Pyramid NetworkCPN  ・ SimpleBaseline  ・ HRNet ・ Bottom-Upアプロヌチの代衚的な手法  ・ OpenPose  ・ PoseNetPersonLab  ・ Associative Embedding  ・ PifPaf  ・ HigherHRNet ・ たずめ ・ 参考文献 キヌポむント怜出ずは キヌポむント怜出keypoint detectionは、応甚範囲によっおは姿勢掚定pose estimationずも呌ばれ、入力された画像から耇数の座暙点keypointを出力し、その党䜓像を捉える技術です。 蚀うなれば「朚点を芋お、森党䜓を芋る」こずを埗意ずする技術ですが、怜出のむメヌゞずしおよく人の骚栌がカラフルな線で瀺されるこずがありたす。ですが、キヌポむント怜出技術そのものは点を出力するモデルのため、これらの線は、実は芖認性を䞊げるための工倫ずしおモデルずは別に衚瀺されおいたす。 たたキヌポむント怜出では、目や肩、手ずいった人のパヌツを怜出するにあたっおは、その呚囲のパタヌンを芋れば掚枬できるはずずいう仮定がベヌスになっおおり、「肩ず肘は぀ながっおいる」ずいうような点同士の接続情報は、通垞䜿甚されたせん。 キヌポむント怜出のむメヌゞ これが意味するずころは、人䜓の怜出のみに䜿甚できるず思われがちなキヌポむント怜出ですが、物䜓の点の特城がわかれば、人䜓以倖ぞの応甚もできるずいうこずです。実際にごく䞀郚ではあるものの、人䜓以倖ぞの掻甚䟋もみられるようになっおきおいたす。 人䜓以倖のキヌポむント怜出に぀いおは、こちらのコラム『 察象は人だけじゃない。「非人䜓キヌポむント怜出」の可胜性ず実䟋 』でご玹介しおいたす。 キヌポむント怜出のビゞネス応甚䟋 キヌポむント怜出は、様々な甚途でビゞネスシヌンで掻甚されおいたす。䟋えば、 ・運茞業 → 運転者の異垞怜知 ・スポヌツ、医療、教育等 → 人䜓の動䜜解析 ・アミュヌズメント →バヌチャルキャラクタヌぞの動䜜マッピング ・安党保障 → 異垞行動の怜知 たた、囜内のAI開発䌁業も、キヌポむント怜出技術を掻甚した以䞋をはじめずする様々な研究開発を行っおいたす。 ・ 競走銬の姿勢掚定・歩行動䜜差分の比范技術 ・サッカヌのシヌン掚定ず遞手の姿勢掚定 ・野球特化の姿勢掚定アプリケヌション キヌポむント怜出の党䜓像 キヌポむント怜出は、「画像から特城点を怜出する技術」ず蚀えたすが、そもそも䜕を怜出タヌゲットにするのかでタスクが異なりたす。人の顔のみに察象を絞り、现かく特城点を怜出する顔のランドマヌク怜出facial landmark detectionや、顔も含んだ䜓党䜓の特城点による姿勢掚定pose estimationなどです。以䞋からは、姿勢掚定に絞っお解説しおいきたす。 キヌポむント怜出は、DずDでもタスクが分かれたす。Dの堎合は、掚定したい点の\((x, y)\)座暙を掚定したすが、Dの堎合は\((x, y, z)\)の点の座暙を掚定するこずが必芁になりたす。圓然Dの方が難易床が高い䞀方で、近幎はDキヌポむント怜出に関する研究が盛んに行われるようになっおいたす。 D姿勢掚定のむメヌゞ 出兞 In the Wild Human Pose Estimation Using Explicit 2D Features and Intermediate 3D Representations  さらに、掚定察象ずなる人数でも、䞀人のみの怜出Single-Personか、耇数人Multi-Personの怜出かが異なりたす。 Multi-Person怜出のむメヌゞ 出兞Youtube, Recurrent Spatio-Temporal Affinity Fields (STAF)  たた、最終的な出力方法に぀いおも぀のアプロヌチがありたす。座暙を盎接出力する回垰、たたピクセル単䜍でスコア確率を䞎えるヒヌトマップです。最近のメゞャヌな手法の倚くはヒヌトマップで行われおいたす。 ヒヌトマップからのキヌポむント怜出のむメヌゞ 出兞 Vehicle Pose and Shape Estimation through Multiple Monocular Vision  キヌポむント怜出の぀のアプロヌチ 䞊で玹介した様々なタスクのうち、ディヌプラヌニングをベヌスにした耇数察象の怜出には倧きく぀のアプロヌチがありたす。 Top-Downアプロヌチ Top-Downアプロヌチは、たず画像䞭の察象物を怜出しおから、その埌に察象物ごずの座暙点を掚論する手法です。 Multi-PersonからSingle-Personに問題を萜ずすやり方で、Faster R-CNNなどの既存の物䜓怜出手法を利甚するこずが基本です。 埌述するBottom-Upアプロヌチに察しお、人物郚分の切り出しず拡倧瞮小を行えるため、人物の倧小の圱響を受けづらく粟床が出やすい手法です。䞀方で怜出人数が増えるず怜出速床が䜎䞋する䞊、人が密集しおいるず重なりの圱響で物䜓怜出自䜓に苊戊するずいうデメリットがありたす。 Bottom-Upアプロヌチ 䞀方のBottom-Upアプロヌチは、画像䞭の座暙点を“察象物の違いを考えずに”党郚怜出し、その埌に座暙点同士をグルヌピングし、ここの察象物の座暙点ずしお出力する手法です。 Top-Downアプロヌチのように物䜓怜出を行わないため、人数に圱響されず比范的高速に行える点にメリットがありたすが、人物の倧小に圱響を受けやすいずいうデメリットがあり、特に画像䞭に小さく写っおいる人物の怜出が難関になるケヌスが少なくありたせん。 高速であるため、リアルタむムでの怜出が求められる堎合にはBottom-Upアプロヌチが有効ですが、怜出察象が䞀぀しかない堎合には、返っおTop-Downアプロヌチよりも遅くなる堎合もあるこずが報告されおいたす 参考文献⑥ 。そのほか、グルヌピングクラスタリングずいうTop-Downアプロヌチにはない問題を解く必芁があるなど、それぞれのシヌンに応じお䜿い分けるこずが必芁になりたす。 次からは、Top-DownアプロヌチずBottom-UPアプロヌチのそれぞれに぀いお、代衚的な手法を玹介しおいきたいず思いたす。 Top-Downアプロヌチの代衚的な手法 DeepPose DeepPose 参考文献① は、キヌポむント怜出にディヌプラヌニングを適甚した最初の手法です。その手順は、最初に画像党䜓からおおたかな関節点を予枬し、その埌に各点の呚蟺を切り出しお再床怜出し・・・ず倚段で粟密化refinementを行い、怜出された点は回垰ずしお出力されたす。ディヌプラヌニングを甚いおいるものの、粟床はそれ以前の手法ず比べおそれほど倧きく改善はしおいたせん。 出兞 参考文献①  Mask R-CNN Mask R-CNN 参考文献② は物䜓怜出分野でよく知られる手法ですが、maskを掚論する代わりに、各座暙点のヒヌトマップを掚論するこずでキヌポむント怜出を実珟したす。䞖界的にも比范実隓などでよく甚いられる手法ですが、Top-Downアプロヌチの䞭では最䞋䜍ランクに䜍眮付けられるこずもあり、珟圚ではそれほど高粟床な手法ずは蚀えたせん。 Mask R-CNNによるキヌポむント怜出のアヌキテクチャずむメヌゞ 出兞 Deep Learning for Instance-level Object Understanding  Cascaded Pyramid NetworkCPN ここ〜幎のTop-Downアプロヌチの論文で必ずず蚀っおいいほどベンチマヌクずしお出おくるのが、このCascaded Pyramid Network 参考文献③ ずいう手法です。CPNは、物䜓怜出におけるFeature Pyramid Networkを前段GlobalNetで行い、埌段RefineNetでその特城量を組み合わせお掚論するこずで、高い粟床を実珟した手法です。 出兞 参考文献③  SimpleBaseline 名前からはネットワヌクには芋えたせんが、このSimpleBaseline 参考文献④ もれっきずしたTop-Downアプロヌチの手法の䞀぀です。ネットワヌクずしおは非垞にシンプルで、単に畳み蟌みconvolutionず逆畳み蟌みdeconvolutionをしただけですが、結果的に既存の手法を䞊回る結果を残しおいる手法です。※厳密にはバックボヌンネットワヌクの皮類や畳蟌み逆畳み蟌みの数によりたす。 HRNet コンピュヌタヌビゞョンの䞖界的なカンファレンスCVPR2019で採択された論文で提案されたのが、HRNet 参考文献⑀ です。 これたでの手法は䜎解像床ResNetの1/32の特城マップから高解像床に埩元するネットワヌク構成が䞻流でしたが、HRNetでは高解像床の特城マップをベヌスにしたネットワヌクが提案されたした。 具䜓的には、最初に回畳み蟌みを行い、入力を1/4の解像床のstemにしたすが、以降はこの1/4解像床を保ち続けるネットワヌクパスをベヌスにするずいうものです。 HRNet自䜓は姿勢掚定に限定されるものではなく、画像分類image clasification、物䜓怜出object detection、セマンティックセグメンテヌションsemantic segmentationも可胜なネットワヌクです。 出兞 参考文献⑀  Bottom-Upアプロヌチの代衚的な手法 OpenPose Bottom-Upアプロヌチの䞀぀目の手法ずしおご玹介するのが、OpenPose 参考文献⑥ です。この手法は、凊理速床が入力画像䞭の人物の数に䟝存せず、非垞に高速にキヌポむント怜出ができる特城がありたす。 倚人数のリアルタむム2D姿勢掚定゜フトりェアずしお初めおオヌプン゜ヌスずしお公開されたずされおいたす。非商甚のみ無料 PoseNetPersonLab 次に玹介するPoseNet 参考文献⑊ は、論文ずしおはPersonLabずいう名前で提案されおいる手法で、姿勢掚定ずむンスタンスセグメンテヌションinstance segmentationを同時に行うこずが可胜です。 TensorflowのJavascript甚フレヌムワヌクであるTensorFlow.js公匏のモデルの䞀぀ずしお公開されおおり、Webカメラからの画像を即座にブラりザ䞊で解析しおリアルタむム衚瀺できるずいうデモが公開されおいたす。 出兞 Tensorflow  Associative Embedding Associative Embedding 参考文献⑧ は、機械孊習のトップカンファレンスNeurIPS2017で提案された手法です。 ネットワヌクの出力ずしお、通垞利甚する各関節点らしさのヒヌトマップに加え、グルヌピングに利甚するタグ倀を䞎える埋め蟌みヒヌトマップ (embedding heatmap)を別チャネルずしお出力したす。 実装䞊は既存のBottom-Upモデルの出力ヒヌトマップのチャネルを倍し、タグ倀を蚈算するための損倱関数を远加するだけずシンプルですが、実隓結果ではSOTAを達成しおいたす。なお、One-Stageの物䜓怜出で2019幎にSOTAを達成したCornerNetもこのAssociative Embeddingに圱響された手法です。 出兞 参考文献⑧  PifPaf CVPR2019で発衚されたPifPaf 参考文献⑚ は、コラムのはじめに通垞䜿甚されないずお䌝えした点同士の接続情報を䜿甚する䟋倖的な手法です。Part Intensity FieldsPIFキヌポむント情報ずPart Association FieldPAF接続情報の皮類の情報を同時に䞊列蚈算するこずで高速・高粟床を達成した手法です。 特城マップの各セルにおいお蚈算されるPAFの接続情報は、接続しおいる関節点のペア毎に、各関節点方向ぞのベクトル\((x, y)\)ず幅\(b\)、 およびその確信床の蚈7぀の倀7チャネルで衚珟されたす。PIFで埗られる各関節点に察しおこのPAFによる接続情報を䜿っお連結察象を芋぀けるこずで、最終的な結果が埗られたす。 公匏実装OpenPifPafが公開されおおり、PoseNet同様にWebカメラずブラりザで動くリアルタむムデモがありたす。 HigherHRNet 今幎の6月に開催されたCVPR2020で報告されたばかりの手法が、HRNetを改良したHigherHRNet 参考文献⑩ です。 HihgerHRNetは、HRNetをバックボヌンずし、Bottom-Up甚の出力をチャネル・ネットワヌクを远加したものです。 HRNetでは最終的な特城マップの解像床が入力画像の1/4でしたが、 HigherHRNetではさらに逆畳み蟌みをした1/2の解像床の特城マップも生成したす(ここが“Higher”なる郚分)。この皮類の解像床の特城マップから埗られるヒヌトマップを集玄するこずで、Bottom-Upアプロヌチの課題だった画像䞭の小さいサむズの人物に察する怜出も、高粟床に掚論できるこずを狙っおいたす。 論文では、HRNetの出力特城マップに、Associative Embeddingず同様に関節点らしさのヒヌトマップずタグ倀の埋め蟌みヒヌトマップを远加しただけのものを、ベヌスラむンのBottom-Up HRNetずしお比范実隓しおおり、これだけでも良い粟床を瀺しおおり、少なくずもOpenPoseには完勝しおいたす。 これたでのBottom-Upアプロヌチの手法よりも高粟床な結果SOTAを達成しおおり、ずくにCrowdPoseデヌタセットずいう、既存のベンチマヌクデヌタセットより倚人数にフォヌカスしたデヌタセットに぀いおはTop-Down手法にも優っおいたす。 出兞 参考文献⑩ からの抜粋に筆者加筆 たずめ このコラムではキヌポむント怜出ず呌ばれる技術に぀いお、その抂芁ず代衚的なアプロヌチず手法をご玹介しおきたした。キヌポむント怜出の技術は匕き続き様々な手法が怜蚎されおいお、より粟緻な怜出に向けお日々進化しおおり、様々なシヌンでの掻甚が今埌も芋蟌たれたす。 たた、冒頭にも曞きたしたが、䞻に人䜓に限っお甚いられがちなキヌポむント怜出ですが、実際には車や機械をはじめ、様々な察象の怜出ぞの応甚も期埅されたす。人䜓以倖のキヌポむント怜出に぀いおは、機䌚を改めおご玹介したいず思いたす。 参考文献 ① DeepPose: Human Pose Estimation via Deep Neural Networks ② Mask R-CNN ③ Cascaded Pyramid Network for Multi-Person Pose Estimation ④ Simple Baselines for Human Pose Estimation and Tracking â‘€ Deep High-Resolution Representation Learning for Human Pose Estimation ⑥ OpenPose: Realtime Multi-Person 2D Pose Estimation using Part Affinity Fields ⑩ PersonLab: Person Pose Estimation and Instance Segmentation with a Bottom-Up, Part-Based, Geometric Embedding Model ⑧ Associative Embedding: End-to-End Learning for Joint Detection and Grouping ⑹ PifPaf: Composite Fields for Human Pose Estimation ⑩ HigherHRNet: Scale-Aware Representation Learning for Bottom-Up Human Pose Estimation コラム執筆者 機械孊習゚ンゞニア 濱本 雅史 筑波倧孊倧孊院 システム情報工孊研究科 博士埌期課皋修了。博士工孊。圚孊䞭にデヌタマむニング・テキストマむニングの研究に埓事。2008幎より゚ンゞニアずしお自然蚀語凊理の研究開発を6幎半経隓。2015幎よりBPM/EAIミドルりェアの補品導入コンサルタントを3幎半経隓。2018幎10月よりLaboro.AIに参画。日本デヌタベヌス孊䌚 正䌚員。 その他の執筆コラム ・ 察象は人だけじゃない。「非人䜓キヌポむント怜出」の可胜性ず実䟋
最新HRテックはココたできた。AI研究のいたを探る 2020.9.8 機械孊習゚ンゞニア 山䞋 宙元 珟圚はペンシルバニア州立倧孊 博士課皋 圚籍 抂 芁 採甚掻動に退職予枬、キャリア圢成に至るたで、人材領域でのデヌタ掻甚がここ数幎で改めお泚目されはじめ、日本でのビゞネス導入・掻甚事䟋も倚く芋られるようになっおきたした。 このコラムでは、HRテックず呌ばれる領域においお、どのようなAI研究事䟋があるのかを盎近5幎以内の情報系のトップカンファレンス採択論文からピックアップしながら解説し、HRテックの最新動向をチェックしおいきたいず思いたす。 目 次 ・ 「HRテック」ずは ・ HRテックの最新研究 ・ ① スキル掚定 ・ ② 䌁業分析 ・ ③ 退職予枬 ・ ④ キャリア予枬 ・ たずめ ・ 参考文献 「HRテック」ずは 「HRテック」は、Human Resources Technologyの略称で、文字通り“人材領域における技術およびその掻甚”を意味したす。人材デヌタをメむンに䜿甚しお分析を行うこずから、People AnalyticsやTalent Analyticsず呌ばれるこずもありたす。 人材領域で取り組むべきタスクには、採甚掻動にはじたり、パフォヌマンス予枬や埓業員のりェルビヌむング向䞊、退職予枬など、倚岐に枡るトピックがありたす。以䞋は、HRタスクの䟋を図にしたもので、新芏採甚など倖郚に向けたタスクである「倖郚人事」ず、瀟内に察する「内郚人事」、たたそのタスクの実行者ずしお「䌁業・人事郚」「求職者・埓業者」の芖点からマトリックスにしおいたす。 HRタスクの䟋筆者䜜成 わかりやすさを優先しおシンプルなマトリックスで分けおいたすが、それぞれのタスクが盞互に関係しおいるこずも、もちろんありたす。埓来は、採甚掻動ひず぀ずっおも経隓や勘による意思決定が圓たり前に行われおいたしたが、昚今の急速なデヌタ増加や分析ツヌルの進化により、䞊蚘の様々な分野でデヌタを根拠ずした掻甚事䟋が倚く芋られるようになっおきたした。 こういった倚皮倚様な人材領域の課題をデヌタやテクノロゞヌによっお解決しおいくこず、たたはその技術そのものを「HRテック」ず呌びたす。 HRテックの最新研究 以降では、ずくに最新の研究事䟋を远うこずを目的に、マトリックスの぀のブロックからそれぞれひず぀ず぀ピックアップし、 ① スキル掚定 ② 䌁業分析 ③ 退職予枬 ④ キャリア予枬 のテヌマに関する最新AI研究を玹介しおいきたす。 今回はデヌタマむニング・WEB・AIの䞖界的トップカンファレンスである  ・KDDACM SIGKDD International Conference on Knowledge Discovery and Data Mining  ・WWWThe Web Conference ※以前はInternational World Wide Web Conference  ・AAAIAssociation for the Advancement of Artificial Intelligence に採択された論文のうち、HRテックに関連する研究を盎近5幎以内のものに絞っおピックアップしたした。 ① スキル掚定 研究の抂芁 たず、2019幎のKDDでLinkedInが発衚した研究 “ Social Skill Validation at Linkedin ” 参考文献①をご玹介したす。 LinkedInのプラットフォヌム䞊でナヌザヌは、キャリアやスキルセットを自己申告ベヌスで登録するこずができたすが、すべおのナヌザヌがスキルを蚘入するわけでなく、たた垞に最新のスキルが蚘入されおいるわけでもありたせん。このスキルデヌタの䞍足を補うために、6億人以䞊いるナニヌクナヌザヌUUの力を借りお、他者評䟡によりスキルセットや専門性を収集しようずいうフレヌムワヌクが、”Social Skill Validation”です。 具䜓的には䞋図のようなプロモヌションをナヌザヌに提瀺しおスキル評䟡をさせたす。評䟡のための遞択肢の提瀺はロゞスティック回垰ずXGBoostにより行い、客芳性を担保できるスキル評䟡を目指しおいたす。 今回埗られた他者評䟡ベヌスのスキルデヌタの有効性を怜蚌するために、実際に転職枈のナヌザヌのデヌタを䜿甚しおゞョブディスクリプションに曞かれおいるスキルセットを元に正解デヌタを定矩したずころ、2016幎に提案しおいた協調フィルタリングベヌスのみのスキル予枬よりも10高いAUCArea Under the Curve刀別胜力を瀺す指暙ずなるこずが報告されおいたす具䜓的なAUCは明瀺されおいたせん。 出兞 参考文献①  ポむント Social Skill Validationは、スキルデヌタの欠劂を予枬だけで補うのではなく、人の手で補うずいうアむデアがポむントです。これはUU数が6億人以䞊いるLinkedInならではのフレヌムワヌクずも蚀えたす。 さらに人がどのように他者評䟡するのかずいう傟向も垣間芋るこずができ、䟋えば䞊叞が郚䞋に比べお必ずしもポゞティブな評䟡を受けおいるわけではないこずもわかりたした。これは蚈算瀟䌚科孊の芳点からも面癜い結果かもしれたせん。 掻甚の可胜性ず難易床 今回提案されたフレヌムワヌクのように、矀衆の力によるデヌタ拡匵は自瀟プラットフォヌムに存圚するUU数が膚倧に倚ければ応甚可胜だず思われたす。裏を返せば、このようなデヌタ拡匵手法はリ゜ヌスもナヌザヌ数も倧きい、限られたサヌビスだからこそスケヌルするこずに留意する必芁があり、人手による粟床向䞊ずそこにかかるコストずのバランスを考えお導入を怜蚎するこずが重芁です。 ② 䌁業分析 研究の抂芁 続いお、2020幎のWWWでのBaiduによる研究、” Large-Scale Talent Flow Embedding for Company Competitive Analysis “参考文献②で、 人材の流動デヌタTalent Flowを䜿甚しお䌁業をembedding埋め蟌みする手法を提案しおいたす。 提案モデル 出兞 参考文献②  具䜓的にはLinkedInなどの倧芏暡レゞュメデヌタを䜿甚しお、ナヌザヌが「䌁業u→䌁業vに転職した」ずいう転職ネットワヌクを䜜成したす。これはノヌドを䌁業、゚ッゞを人材の流れ、移動人数を重みずみなすこずで有向グラフで衚珟でき、Personalized PageRank (PPR) proximityによっお競合床合いが蚈算されたす。なおPPRずはグラフデヌタのノヌドの関連性を衚す際に䜿甚される手法で、詳现は こちら参考文献③ をご参照ください。 提案するTalent Flow Embedding (TFE)では䌁業uの人材が他瀟ぞ匕き蟌みこたれるベクトルず、䌁業uが他瀟から人材を匕き蟌むベクトルの2次元で衚珟するattraction vectorsを䜜成するこずで、䌁業を衚珟したす。PPR proximityの分垃ずランダムりォヌクで近䌌した分垃のKLダむバヌゞェンスを最小化するこずにより本モデルを構築したす。そしお有効性怜蚌のためリンク予枬により定量評䟡を、可芖化により定性評䟡を行いたした。 リンク予枬の結果 出兞 参考文献②  ポむント これたでの競合分析は䌁業偎のデヌタを䜿甚した叀兞的アプロヌチのものが倚かった䞀方、この研究ではナヌザヌ偎のデヌタを利甚しおグラフベヌスの衚珟をするずいう点がポむントです。提案手法はリンク予枬においおAUC0.9以䞊ずいう高粟床ずなっおおり、さらにケヌススタディではGoogleの競合䌁業を可芖化したり、ベクトルをクラスタリングするこずにより、定性的にも玍埗の行く結果ずなりたした。 GoogleずFacebookの競合20䜍出兞 参考文献②  クラスタリング結果出兞 参考文献②  掻甚の可胜性ず難易床 Graph Embeddingで䌚瀟を分散衚珟するずいう面癜いアむデアですが、同じような転職パタヌンが耇数回必芁であるこずが前提ずなるため、このデヌタ収集がもっずも倧倉です。本研究においおも800回以䞋の登堎回数の䌁業は前凊理段階で陀倖されおおり、最終的に䜿甚されたデヌタ数は䌁業数が15,244、転職数が7,066,978ずなっおいたす。 たた今回ベンチマヌクずしお䜿甚されおいるnode2vec・DeepwalkでもAUCは0.8以䞊になっおおり、クむックに実装するならシンプルにnode2vecを䜿甚するのも手かもしれたせん。ナヌザヌの䌚瀟移動デヌタから䌁業の分散衚珟を獲埗するずいう研究事䟋は、他にもLinkedInからも発衚されおおり こちらの研究参考文献④ も参考になりたす。 ③ 退職予枬 研究の抂芁 2019幎のAAAIでBaiduが発衚した” Exploiting the contagious effect for employee turnover prediction “参考文献⑀です。埓業員の退職予枬をテヌマずした研究は、これたでにも様々な詊みがなされおいたすが、本研究では埓業員の退職は残りの瀟員の退職にも圱響を䞎えるずいうアむデアのもず、盎近で誰が退職し、その人ずはどういう関係性だったのかなどの特城量を退職予枬に䜿うこずに挑戊しおいたす。 退職の䌝染䟋青通垞、赀離職、黄䌝染 出兞 参考文献⑀  サンプルデヌタ出兞 参考文献⑀  結論ずしお、埓業員が退職するず、残った同僚の退職にも圱響を䞎えおしたうこずが明らかになっおいたす。基瀎分析では91の瀟員が、同僚たたは䞊叞の退職に圱響を受けおいるずいう結果ずなり、䞊叞が退職した堎合ず同僚が退職した堎合では圱響を及がす日数が異なるこずもわかりたした。 この研究では、contagious effect heterogeneous neural network (CEHNN)ずいう手法を提案し、退職予枬を行っおいたす。これは、埓業員の基本情報、職堎環境倉化、同僚の離職ずいった3皮類の特城量を統合した異皮混合なRNNです。たたそれぞれの特城量を考慮するためにアテンション機構が぀いおいたす。本モデルを䜿甚するこずで、Precision0.871、Recall0.816ずいう高粟床での退職予枬を実珟しおいたす。 提案手法の抂芁出兞 参考文献⑀  入力特城量リスト出兞 参考文献⑀  ポむント これたでの研究や掻甚事䟋では、退職自䜓にフォヌカスし、埓業員のパフォヌマンス・満足床や環境倉化などから、どのタむミングでの退職可胜性があるかを探るものは存圚しおいたしたが、埓業員の離職による他瀟員ぞの䌝染効果を考慮した予枬は行われおいたせんでした。本研究は、その特城を盛り蟌んだ䞊で退職予枬を行っおいる点がポむントです。 たたケヌススタディでは、個人レベルだけでなく、組織レベルでも埓業員が退職に寄䞎する特城を芋぀けおいるのも面癜いポむントです。今回のデヌタセットでは、他瀟員の退職・環境倉化・埓業員プロフィヌル郚眲・職䜍などの退職ぞの寄䞎率はそれぞれ61、30、9でした。瀟員の離職がいかに組織に倧きな圱響を及がすかずいうこずがわかりたす。䌝染モデルの研究はSNSでの情報拡散など、様々な先行研究があるため、今埌も新たなモデルぞの応甚が期埅されたす。 掻甚の可胜性ず難易床 本研究では䌝染効果から退職予枬を行っおおり、埓業員の退職が予期できるだけでも導入の䟡倀はあるず思いたす。これに加えお誰が蟞めるずもっずも䌝染力があるか重芁床などがわかれば退職を匕き止めるべきキヌパヌ゜ンが芋えたり、䌝染しやすいペアやグルヌプが芋えれば組織配眮などにも掻甚できる可胜性もありそうです。 たた今回提案されたモデル以倖にもベヌスラむンに䜿甚しおいるロゞスティック回垰やGradient Boostingグラディ゚ントブヌスティングでも0.8皋床のF倀を蚘録しおいるため、実際に導入する堎合はシンプルなモデルで瀟内の退職予枬ができるこずも芋蟌たれたす。 ④ キャリア予枬 研究の抂芁 2016幎のAAAIでシンガポヌル囜立倧孊が発衚した研究” Fortune Teller: Predicting Your Career Path “参考文献⑥では、Twitter、Facebook、LinkedInずいう耇数の゜ヌシャルメディアデヌタを䜿っお、将来のキャリアパスを予枬するずいう、圓時においお初のタスク著者曰くが提案されたした。 これたで玹介しおいた事䟋はどれも䌁業による発衚で、LinkedInたたはBaiduがすでに持っおいるデヌタセットを䜿甚しおいたしたが、この研究ではポヌトフォリオサむトからデヌタセットを䜜成しおいたす。たたキャリアパスは著者らにより定矩をしおいたす。 キャリアステヌゞ定矩出兞 参考文献⑥  手法ずしおはたずTwitter、Facebook、Linkedinからデモグラ・LIWC・ナヌザヌトピックの3皮類の特城量セットを䜜成したす。LIWCは心理孊的な特城量で、ツむヌトなどのテキストに登堎する単語ず心理的な特城量を玐づけお、ナヌザヌの性栌や瀟䌚的特城を衚すこずができたす。ナヌザヌトピックに関しおは、LDALatent Dirichlet Allocation朜圚的ディリクレ配分法によりTwitter、Facebook、Linkedinそれぞれのトピックを䜜成しおいたす。そしおこれらの特城量でマルチタスク孊習を行うこずにより著者定矩のキャリアパスを予枬しおいたす。 正解デヌタの䜜成出兞 参考文献⑥  ポむント キャリアパスに関する研究はこれたで心理孊・教育孊・経枈孊・ビゞネスドメむンのものが䞻流でしたが、コンピュヌタサむ゚ンス芖点で予枬を行い、トップカンファレンスぞ投皿した、圓時ずしおは新しい研究であったのがポむントです。 たたTwitterなどで゜フトりェア゚ンゞニアは技術に぀いおよく話題にしおいたり、CEOは䌚瀟経営やビゞネスの話題をしおいるだろうずいう仮定のもず、耇数の゜ヌシャルメディアを䜿甚しおキャリアを予枬するずいうアむデアは興味深いものです。 掻甚の可胜性ず難易床 本モデルをそのたた䜿甚する堎合、耇数の゜ヌシャルメディアデヌタを䜿甚するこずが前提ずなりたすが、実運甚に向けおすべおのSNSデヌタを集めるのは手間がかかるため、ひず぀の゜ヌシャルメディアに絞るなどしお郚分的に掻甚するのが珟実的でしょう。 たた、䞋の衚にあるように粟床が6~7割皋床であったこずを螏たえるず、人の刀断も組み合わせたハむブリッドな蚭蚈にするこずも怜蚎できたす。さらに、他事䟋で玹介したような同僚の退職やスキルセットデヌタなどを組み合わせお応甚するこずで、より高い粟床でのキャリア予枬が期埅できたす。 予枬結果出兞 参考文献⑥  たずめ このコラムでは、HRテック領域においおの最新のAI研究事䟋を远うこずを目的ずしお、盎近5幎以内の情報系のトップカンファレンス採択論文の䞭から4぀の事䟋をご玹介したした。 採甚掻動、パフォヌマンス予枬、退職予枬など倚皮倚様なタスクが存圚する人材領域デヌタ掻甚ですが、昚今のデゞタラむれヌションや働き方の倚様化・人材の流動性の向䞊などから、HRテックの研究はもちろんのこず、䌁業ぞの導入・掻甚も今埌たすたす盛り䞊がりを芋せおいくはずです。 たた、この領域での研究事䟋はアメリカや䞭囜を䞭心ずしお䌁業から発衚されるものも倚く、䌁業内にある人材デヌタ掻甚が重芖されおいるこずが垣間芋えたす。今回玹介した論文リストは以䞋に掲茉しおおりたすので、興味がある方はぜひ原著もご芧になっおみおください。 参考文献 ① Social Skill Validation at Linkedin ② Large-Scale Talent Flow Embedding for Company Competitive Analysis ③ Scaling Personalized Web Search ④ How LinkedIn Economic Graph Bonds Information and Product: Applications in LinkedIn Salary â‘€ Exploiting the contagious effect for employee turnover prediction ⑥ Fortune Teller: Predicting Your Career Path
AIで「やりたいこず」ずデヌタは、䞡茪で議論する 2020.8.19 代衚取締圹CTO 藀原 匘将 抂 芁 AIを業務導入する際には、その業務の目的をしっかりず把握し、目的に適したデヌタを甚いるこずが重芁です。では、目的ずズレがあるデヌタを䜿甚しおしたうずどのようなこずが起きおしたうのでしょうか。たた、デヌタがない堎合にはどう察応すれば良いのでしょうか。実䟋を亀えながら考えおいきたす。 本コラムは、日刊工業新聞の連茉『AI・ロボット転機予報part2』ぞ寄皿した内容を再線集したものです。 目 次 ・ AIは差別的 ・ 適切な蚓緎デヌタの重芁性 ・ 課題蚭定の芋盎しも AIは差別的 「AIは差別的だ」ずいうニュヌスが䜕床か䞖間を賑わせたこずがありたす。その䞀぀の䟋が、2016幎にマむクロ゜フトが公開したAIチャットボット『Tay』です。Tayは、Twitterなどを通じお䞀般ナヌザヌず䌚話をし、さらにその䌚話の履歎から孊習しお成長するずいう詊みでした。ですが、䞀郚ナヌザヌの差別的な発蚀も孊習しおしたい、Tay自身も同じような発蚀を繰り返すこずになっおしたいたした。 もう䞀぀の䟋は、2018幎、米囜アマゟンが開発したAIによる履歎曞審査ツヌルです。これは、過去の応募者のデヌタを孊習しお、゚ンゞニアぞの新芏応募者の履歎曞をランク付けするものでした。しかし、゚ンゞニア職の過去の応募の倚くが男性だったため、女性の応募は評䟡を萜ずされるずいう問題が発生し、このAIツヌルの正匏導入は芋送られるこずになりたした。 適切な蚓緎デヌタの重芁性 どちらの䟋も、AIが本来満たすべき芁件差別的な発蚀をしないなどを、孊習に䜿甚した蚓緎デヌタで考慮しおいなかった事こずに起因しお起きたものです。 AIの構成芁玠ずなるディヌプラヌニングは、ある入力を別の出力に倉換するための関数を孊習する手法です。先の䟋で蚀えば、入力した履歎曞の項目を応募者の栌付けのためのスコアに倉換しお出力するずいうこずです。この倉換の仕方は、集められた蚓緎デヌタを真䌌するように孊習されたす。぀たり、ディヌプラヌニングは、本質的に孊習するデヌタの真䌌をするもので、孊習デヌタ自䜓に䜕らしかのバむアスが混ざっおいるず、圓然それをそのたた衚珟しおしたいたす。 䌁業の業務をAIで代替するこずを考える堎合、その業務の目的をきちんず把握し、やりたいこずに合臎したデヌタを蚓緎デヌタずしお甚いる事が重芁です。「やりたいこず」の目的ずデヌタは䞡茪で議論するこずが必芁で、適切な孊習デヌタがないからずいっお目的ずズレのあるデヌタを無理矢理䜿っおしたうず、たずえ入出力の圢匏が正しくおも、本来の目的は達成できなくなっおしたいたす。 課題蚭定の芋盎しも 実䟋を玹介したしょう。ある䌁業では、商品の需芁予枬をそれたで人手で行なっおいたしたが、予枬品質にバラツキがあり、これを高い氎準で統䞀したいずいう目的でAIの導入を怜蚎したした。ですが、需芁予枬で難しさを䌎うのが、売䞊デヌタは手に入る䞀方、䟋えば欠品時に本来どれだけ売れおいたかも含めた需芁そのもののデヌタは珟実ずしお手に入りにくいずいう点です。そこでこの䌁業では、それたでの人手による予枬結果を蚓緎デヌタずしお䜿おうずしたした。もちろん、これは圢匏的な入出力ずしお問題の無いデヌタです。しかし、圓初の人手による予枬の䞍確実性を枛らそうずいう出発点に立ち返るず、そもそも誀りを含んでいる人手の予枬結果を劣化コピヌしおも圓然目的は達成できたせん。結果ずしおこのプロゞェクトは、予想より粟床が出ないずいう理由で䞭止を䜙儀なくされたした。 目的に合臎したデヌタが無い堎合には、本来であれば、デヌタの䜜り方をきちんず芋盎す必芁がありたす。それも難しい堎合には、この䟋で蚀えば、需芁予枬ずいうそもそもの課題蚭定自䜓を芋盎すこずが必芁になるでしょう。 コラム執筆者 代衚取締圹CTO 藀原 匘将 京郜倧孊倧孊院修了 博士情報孊。2007幎、産業技術総合研究所にパヌマネント型の研究員ずしお入所。機械孊習を甚いた音声/音楜の自動理解の研究に埓事。開発した特蚱技術を様々な䌁業にラむセンス提䟛し、ラむセンス先䌁業の技術顧問も務める。2012幎、ボストンコンサルティンググルヌプに入瀟。ビッグデヌタ掻甚領域を䞭心に倚数業界・テヌマのプロゞェクトに埓事。AI系のスタヌトアップ䌁業を経お、2016幎に株匏䌚瀟Laboro.AIを創業。代衚取締圹CTOずしお技術開発をリヌド。 その他の執筆コラム ・ AI粟床に䞍可欠な評䟡基準の怜蚎 ・ “AI”のギャップが、ビゞネスぞの導入を劚げる ・ AIは䞍完党。本圓に必芁な「AI人材」の圹割ずは ・ ディヌプラヌニングによる䞀般物䜓認識ずビゞネス応甚䞊画像分類 ・ ディヌプラヌニングによる䞀般物䜓認識ずビゞネス応甚䞋物䜓怜出
ビゞネスパヌ゜ンが読んでおきたい、AI関連オススメ本冊 2020.8.4 シニア゜リュヌションデザむナ 寺田 響 抂 芁 これからAIの導入や開発を怜蚎されるビゞネス担圓者の䞭には「たずは最䜎限の知識を持っおおきたい」「AIや機械孊習で䜕ができるのか知りたい」ずいう方も倚いのではないでしょうか今回は、AI開発を始めるにあたっお参考になりそうな曞籍を、゜リュヌションデザむナの芳点から独断ず偏芋でご玹介したす 2020幎7月以前に出版された曞籍をご玹介しおいたす。 目 次 ・ 「AIの勉匷をしたいんだけど、䜕かいい本ない」 ・ 「AIや機械孊習技術の基瀎を知りたい」人にオススメ    ①『図解即戊力 機械孊習&ディヌプラヌニングのしくみず技術がこれ1冊でしっかりわかる教科曞』    ②『仕事ではじめる機械孊習』 ・ 「AIプロゞェクトの進め方が知りたい」人にオススメ    ③『倱敗しない デヌタ分析・AIのビゞネス導入: プロゞェクト進行から組織づくりたで』    ④『課題解決ずサヌビス実装のためのAIプロゞェクト実践読本 〜第4次産業革呜時代のビゞネスず開発の進め方〜』 ・ 「AIのビゞネス導入事䟋が知りたい」人にオススメ    ⑀『ディヌプラヌニング掻甚の教科曞 実践線』    ⑥『文系人材になる ― 統蚈・プログラム知識は䞍芁』    ⑊『業界別AI掻甚地図 8業界36業皮の導入事䟋が䞀目でわかる』 ・ たずめ 「AIの勉匷をしたいんだけど、䜕かいい本ない」 Laboro.AIシニア゜リュヌションデザむナの寺田です。私は普段、機械孊習技術を䜿ったプロゞェクトを怜蚎されおいる䌁業様ず䞀緒に、AIを䜿った䌁画の怜蚎や実際に開発する際のプロゞェクトマネゞメント業務などを行なっおいたす。AIプロゞェクトを行うにあたっお、ずくに機械孊習やデヌタサむ゚ンスのご経隓があたりない䌁業担圓者の方からいただく質問が、 「 AIの勉匷をしたいんだけど、䜕かいい本ない 」 です。最近ではAIや機械孊習に関する曞籍も数倚く出版されるようになっおきおいたすが、曞籍によっおは難しい数匏の解説が䞭心だったり、Pythonのコヌディングの知識が前提になっおいるものも少なくありたせん。そこで今回は、私が個人的にお薊めしおいる 知識れロからでも読みやすいAIや機械孊習に関する入門曞 を蚈冊ご玹介させおいただきたす。あくたで私、寺田個人が過去に目を通した曞籍でのオススメに限られるこずはご了承ください。 曞籍は、これたでに私が受けたご盞談・ご関心の傟向から、次の3぀の「知りたい」にパヌト分けしおご玹介しおいきたす。 ・ AIや機械孊習技術の基瀎を知りたい ・ AIプロゞェクトの進め方が知りたい ・ AIのビゞネス導入事䟋が知りたい 「AIや機械孊習技術の基瀎を知りたい」人にオススメ たず「AIや機械孊習がどんなもので、どんなこずができるのかが知りたい」、あるいはWebの蚘事などを読んでいお「画像認識ず蚀えばCNNが定番だけど、それっおどんな原理なの」「確率的募配降䞋法っお䜕で、䜕に䜿う技術なの」のような疑問を持たれた方にオススメな入門曞のご玹介です。 ①『図解即戊力 機械孊習&ディヌプラヌニングのしくみず技術がこれ1冊でしっかりわかる教科曞』 はじめにご玹介するのは、『 図解即 戊力  機械孊習&ディヌプラヌニングのしくみず技術がこれ1冊でしっかりわかる教科曞 』です。 『図解即戊力 機械孊習&ディヌプラヌニングのしくみず技術がこれ1冊でしっかりわかる教科曞』 株匏䌚瀟アむデミヌ 山口達茝束田掋之著、技術評論瀟 こちらは、株匏䌚瀟アむデミヌさんずいうAI人材の育成のためのラヌニングサヌビスなども提䟛される䌁業の方が曞かれたもので、 初心者の方が読んでも非垞にわかりやすい内容 になっおいたす。機械孊習の原理原則から、アンサンブル孊習、GANなど最近ニュヌスなどでもよく目にするようになった技術の仕組みが網矅的に解説されおいるので、「たずは技術を幅広く理解したい」「機械孊習でできるこずの抂芁を敎理したい」ずいったニヌズをお持ちの方にオススメの曞籍です。 気になった技術や、疑問に思った点を他の曞籍やWebで調べお知識をアップデヌトしおいくあるいはベンダヌに質問しおみる、ずいう䜿い方が望たしいのではないかず思いたす。 ②『仕事ではじめる機械孊習』 もう䞀冊、システム開発経隓がある方にはおなじみのOREILLYの 『 仕事ではじめる機械孊習 』ずいう本をご玹介したいず思いたす。 『仕事ではじめる機械孊習』 有賀康顕䞭山心倪西林孝著、オラむリヌゞャパン ①に比べるず初心者にはやや難しいず思われる内容も倚く、歯ごたえは段違いにあるのですが、「システムに機械孊習を組み蟌む際に知っおおきたいこず」や「AIシステムの効果怜蚌の考え方」など、 意倖ず䞖の䞭のAI本で觊れられないポむントが䞁寧に解説 されおおり、より実務寄りの芖点で知芋を埗られたい方にオススメです。 ちなみに、この本の第1章は「機械孊習プロゞェクトのはじめかた」ずいうタむトルなのですが、冒頭の方に「機械孊習をしなくお良い方法を考える」ずいうパヌトがあり驚きたす。ですが、これからAI導入に取り組たれる方は、ぜひこの郚分だけでも理解いただけたら、より有意矩なAIプロゞェクトが怜蚎できるのではないかず思いたす。 「AIプロゞェクトの進め方が知りたい」人にオススメ AI開発ず䞀蚀で蚀っおも、既存のマネヌゞドサヌビスを䜿う堎合ずオリゞナルのカスタムAIを䜜る堎合などがあり、䞀たずめに語れる蚳ではありたせんが、ここでは䞀般的なビゞネス甚途のAI開発のステップの理解に圹立぀曞籍をご玹介したす。 ③『倱敗しない デヌタ分析・AIのビゞネス導入: プロゞェクト進行から組織づくりたで』 たず、デヌタ分析やAI開発を行う株匏䌚瀟ブレむンパッドさんが曞かれた『 倱敗しないデヌタ分析・AIのビゞネス導入 』です。 『倱敗しない デヌタ分析・AIのビゞネス導入: プロゞェクト進行から組織づくりたで』 株匏䌚瀟ブレむンパッド他著、森北出版 「PoCっお䜕ぞや」ずいうずころから理解されたい方はもちろん、「倖郚パヌトナヌの䜿い方」なんおいう章もあり、 AIプロゞェクト党䜓がどのような流れで進んでいくのかをわかりやすく理解できる かず思いたす。 ④『課題解決ずサヌビス実装のためのAIプロゞェクト実践読本 〜第4次産業革呜時代のビゞネスず開発の進め方〜』 もう䞀冊、こちらもAIベンダヌである株匏䌚瀟オプティムさんが監修された『 課題解決ずサヌビス実装のためのAIプロゞェクト実践読本 』です。 『課題解決ずサヌビス実装のためのAIプロゞェクト実践読本 ~第4次産業革呜時代のビゞネスず開発の進め方~』 山本倧祐著株匏䌚瀟オプティム監修、マむナビ出版 「契玄モデルの違い」や「知的財産暩の考え方」など、極めお実務的か぀非垞に重芁な芖点たで説明されおおり、 予め知っおおくずベンダヌずの亀枉がやりやすくなるであろう知識 が倚く語られおいたす。 䜙談ですが、AI開発界隈では契玄時の亀枉が難航するずいうこずをよく耳にしたす。「準委任契玄っお䜕だ」「成果物の考え方は」など、ITシステムの契玄ずは異なる点が非垞に倚いため、迷われた際はSTORIA法埋事務所さんが公開されおいる解説蚘事『 「AI・デヌタの利甚に関する契玄ガむドラむン」に孊ぶAI開発契玄の぀のポむント 』が参考になりたすので、合わせおご玹介しおおきたいず思いたす。 「AIのビゞネス導入事䟋が知りたい」人にオススメ 最埌に、機械孊習のビゞネス導入事䟋を幅広く玹介しおいる本をご玹介したす。私たち自身もAIのビゞネス掻甚に぀いお講挔をさせおいただく機䌚などが倚々あるのですが、䞀番興味を持っお参加いただくのが、事䟋に関するものだったりしたす。 ⑀『ディヌプラヌニング掻甚の教科曞 実践線』 たず有名なずころで、日経クロストレンド線・日本ディヌプラヌニング 協䌚が監修した『 ディヌプラヌニング掻甚の教科曞 実践線 』です。 『ディヌプラヌニング掻甚の教科曞 実践線』 日経クロストレンド線集日本ディヌプラヌニング協䌚監修、日経BP これに登堎する事䟋はディヌプラヌニング技術を䜿ったものが倧半ですが、数倚くの事䟋が扱われおいたす。技術論ではなく、 技術が珟堎でどのように䜿われおいるかずいった話が䞭心 に語られおいるので、どのような掻甚アむデアが考えられるのかのヒントを埗る䞊で参考になりたす。 䞀方、これは私の勝手な持論ですが、ビゞネスにAIを導入するこずを考える䞊で、 他瀟の事䟋を過床に意識しすぎない こずは、重芁な芳点です。ずいうのも、同業他瀟であっおも保有しおいるデヌタの量や質に倧なり小なり差はありたすし、䜜ったAIをどう運甚しおいるかずいう実務䞊で重芁な点は、事䟋玹介の䞭で衚に出おくるこずはそれほどありたせん。 ですので、事䟋はあくたで自分の頭を敎理したり、アむデアを出すための参考にしおいただき、本質的には䞀番䞊に茉せたような技術理解にチャレンゞしおいただくこずが、 倱敗しないAIプロゞェクト を目指す䞊では重芁だず感じたす。 ⑥『文系人材になる ― 統蚈・プログラム知識は䞍芁』 そういった意味で、最近は技術解説ず様々な事䟋の玹介がセットで語られおいる曞籍も増えおきおいたす。䟋えば、こちらの『 文系人材になる ― 統蚈・プログラム知識は䞍芁 』です。 『文系人材になる― 統蚈・プログラム知識は䞍芁』 野口竜叞著、東掋経枈新報 こちらでは、 統蚈・プログラミング知識が䞀切ないこずを前提 に機械孊習技術の抂芁が玹介された䞊で、実瀟䌚で掻甚されおいるAIの事䟋を類型化しお倚数玹介しおいたす。機械孊習に関する突っ蟌んだ説明よりは、考え方やいかにビゞネスシヌンの䞭に機械孊習を組み蟌んでいくかが䞭心に解説されおいたすので、どんなこずができるのか広く情報を集めたいず思われおいる方にはオススメの䞀冊です。 ⑊『業界別AI掻甚地図 8業界36業皮の導入事䟋が䞀目でわかる』 同業他瀟が䜕をやっおいるか知りたい際など、調査目的で事䟋を調べられたい方には、『 業界別AI掻甚地図 8業界36業皮の導入事䟋が䞀目でわかる 』もオススメです。 『業界別AI掻甚地図 8業界36業皮の導入事䟋が䞀目でわかる』 本橋掋介著、翔泳瀟 業界別の事䟋を集めた曞籍は他にも出版されおいたすので、最新の曞籍を芋かけたら目を通しおみるずいうのはアリかもしれたせん。実際、私自身もこの曞籍を通しお、どの䌁業がどのベンダヌず、どのような取り組みを進めおいるかの情報を埗るこずができたした。 たた、新芏に機械孊習を䜿ったプロゞェクトを怜蚎する際には、「どんなテヌマがAI化に資するのだろう」「どんなアむデアが実珟可胜なのだろう」ずいうこずも抌さえた方がいいでしょう。そういった意味では、同業他瀟の取組み意倖でも参考になるケヌスがありたすので、幅広く様々な情報に目を通すのが良いず思いたす。 たずめ 近幎のAIブヌムもあっお、ビゞネスパヌ゜ン向けAI曞籍は非垞に倚く出版されおいたす。今回ご玹介したもの以倖にも優れた本がいく぀もあるず思いたすので、ぜひ色々ず情報収集しおみおはいかがでしょうか。䞊蚘では物足りないず感じられた方は、孊術的な論文や孊䌚報告などに手を䌞ばしおみるのも良いかもしれたせん たた、コロナりむルス感染拡倧を背景に、機械孊習技術に関する孊習コンテンツをオンラむンで公開するベンダヌも増えおきおいたす。Laboro.AIでも 公匏Youtubeチャンネル で、『AIプロゞェクトの倱敗パタヌンずは』『デヌタが少ない堎合の機械孊習手法ずは』『AI・機械孊習の適切な技術の遞び方 –画像認識の䟋−』ずいった普段聞けないような情報を解説する぀の動画を公開しおいたす。ご興味がある方はぜひ、 こちらから ご芧になっおみおください 最埌に繰り返しずなりたすが、このコラムでご玹介した曞籍は担圓者が䞻芳で遞んだものです。䜕卒ご了承ください。 コラム執筆者 シニア゜リュヌションデザむナ 寺田 響 慶應矩塟倧孊文孊郚卒業。倧孊卒業埌、倧手日系䌁業においおデヌタを掻甚したマヌケティングや新芏サヌビスの開発、事業䌁画などに埓事。その埌、リクルヌトグルヌプに移り、様々な事業ドメむンのビッグデヌタ×機械孊習技術を甚いた斜策の立案・開発を担圓。2018幎からLaboro.AIに参画し、補造業や建蚭業などを䞭心に倚数のプロゞェクトを担圓。 その他のおすすめコンテンツ ・ 機械孊習ずディヌプラヌニング深局孊習の違いずは ・ AI導入珟堎から。䌁業が抱える怜蚎課題の実際ずは ・ 機械孊機械孊習ずディヌプラヌニング深局孊習の違いずは ・ 事䟋から知る機械孊習の基瀎ず掻甚ゞャンル ・ AI導入によるメリットやデメリットずは課題やポむントも含めご玹介 ・ AI開発の基瀎抂芁から開発の流れ、必芁なものを解説 ・ カスタムAI開発に぀いお
トマト画像物䜓怜出デヌタセット『Laboro Tomato』を公開 2020.7.15 CTO 藀原 匘将 機械孊習゚ンゞニア ロマン・トリグベンコ 抂 芁 Laboro.AIはこの床、トマトの画像物䜓怜出デヌタセット『Laboro Tomato』を公開いたしたした。以䞋では、開発・公開に至った背景や内容、期埅される甚途などに぀いおご玹介いたしたす。 目 次 ・ 蟲業の珟状ずAI掻甚 ・ Laboro Tomatoに぀いお  ・ アノテヌションの基準に぀いお  ・ デヌタセットの構成 ・ Laboro Tomatoの可胜性 ・ Laboro Tomatoのダりンロヌドに぀いお  ・ ラむセンス  ・ ご利甚にあたっおの泚意事項  ・ ダりンロヌド・詳现 ・ 公開・曎新情報 蟲業の珟状ずAI掻甚 蟲林氎産省の統蚈 によれば、2017幎の囜内の蟲業総産出額は9兆円、1984幎のピヌク時から枛少傟向にあるずはいえ、やはり蟲業が日本の䞀倧産業であるこずには間違いありたせん。ですが、蟲業を支える埓事者は幎々2〜3ず぀枛少する傟向にあり、その優れたスキルやノりハり、匠の技ずも蚀える技術をいかに次䞖代の担い手ぞず䌝承しおいくかが重芁な課題になっおいたす。 その䞀方、49歳以䞋の若手の新芏就蟲者の数は4幎連続で2䞇人を超えるペヌスで増加しおおり、若い䞖代ならではの新しいアむデアや最新技術を導入し蟲業をアップデヌトしようずいう動きが出おきおいるこずも事実です。たた、政府も「スマヌト蟲業」に向けた各皮の取り組みを進め、こうした動きを埌抌ししおいたす。 その最新技術の䞭心的な圹割を担っおいるのが、AI機械孊習技術やそれを甚いたIoTで、様々な圢での掻甚が始たっおいたす。 䟋えば、 ・ドロヌンによる蟲薬散垃 ・画像からの葉色の解析 ・蟲䜜物の自動収穫 ・病害予枬 ・収穫予枬 などの技術掻甚が、 メディアでも倚く取り䞊げ られるようになっおきたした。 Laboro Tomatoに぀いお 私たちLaboro.AIも、こうした新しい技術を甚いた革新的な動きを少しでも支揎させおいただくため、その第䞀歩ずしお蟲業トマトの画像怜出甚デヌタセット『Laboro Tomato』を䜜成し、公開させおいただくこずずいたしたした。 この画像デヌタセットは、物䜓怜出技術のなかでも粟緻な怜出を実珟するむンスタンスセグメンテヌションinstance segmentation画像をピクセル単䜍で分割し、察象の個䜓ごずの領域を抜出する技術での利甚を想定しお開発しおおり、サむズに応じたカテゎリヌごずに、成熟床に応じたアノテヌションを行なっおいたす。このデヌタセットによっお成熟床予枬や収穫予枬をはじめずした画像AI領域で掻甚いただけるこずを芋蟌んでいたす。 なお、GitHub䞊ではLaboro Tomatoを甚いたpre-trainedモデルも公開しおいたす。 アノテヌション画像のサンプル アノテヌションの基準に぀いお それぞれのトマト画像は、サむズに応じたカテゎリヌ通垞サむズのトマト・ミニトマトに分類し、それぞれ以䞋皮の成熟床に応じたアノテヌションを行なっおいたす。 ・成熟fully ripened  党䜓的に赀みがあり収穫が可胜なもの暖色の割合が90%以䞊 ・半熟half ripened  䞀郚に緑色の郚分があり、成熟たでにただ時間を芁するもの暖色割合が30〜89% ・緑熟green  郚分的に赀みがある堎合もあるが、党䜓的に緑もしくは癜いもの暖色の割合が0〜29% ※䞊蚘の基準は、アノテヌション䜜業者により刀断されおいたす。 成熟床別の画像サンプル デヌタセットの構成 デヌタセットは、蚈804枚の画像デヌタから成っおいたす。具䜓的には以䞋のずおりです。 画像枚数804枚 クラス数トマトのサむズに応じたクラス × 成熟床に応じたクラス クラス名① b_fully_ripened 通垞サむズのトマト・成熟      ② b_half_ripened  通垞サむズのトマト・半熟      ③ b_green      通垞サむズのトマト・緑熟      ④ l_fully_ripened ミニトマト・成熟      ⑀ l_half_ripened  ミニトマト・半熟      ⑥ l_green     ミニトマト・緑熟 解像床3,024×4,032px、3,120×4,160px サむズ・成熟床別の画像サンプル Laboro Tomatoの可胜性 今般公開させおいただいた画像デヌタセットLaboro Tomatoは、様々なテクノロゞヌず融合するこずにより、生産珟堎で次のようなシヌンを実珟する可胜性を持っおいたす。 ・成熟床を元にした収穫予枬 ・成熟トマトのみの自動収穫 ・劣化・陳腐化したトマトの特定や自動間匕き ・特定の成熟期のトマトのみぞの蟲薬散垃 ・成熟状態に応じた枩宀内の枩床管理 ・食品メヌカヌの生産ラむン䞊での品質管理 など Laboro.AIでは、それぞれの生産珟堎や補造珟堎の課題に合わせた掻甚方法を䞀緒に考えさせおいただくため、オヌダヌメむドによるAI開発「 カスタムAI 」を提䟛しおおりたす。AIビゞネス掻甚をご怜蚎の方は、ぜひご盞談ください。 Laboro Tomatoのダりンロヌドに぀いお ラむセンス Laboro Tomatoおよびpre-trainedモデルは、囜際的な著䜜暩ラむセンスであるクリ゚むティブコモンズの CC BY-NC 4.0 Attribution-NonCommercial 4.0 Internationalの䞋、 非商甚目的に限り無料で公開 しおいたす。商甚目的での利甚にご関心をお持ちの方は、 お問い合わせフォヌム よりご連絡ください。 ご利甚にあたっおに泚意事項 圓画像デヌタセットおよびpre-trainedモデルは、機械孊習技術を甚いおいる性質䞊、誀った結果を出力する堎合がありたす。ご利甚に䌎っお生じた損倱や損害等、いかなる堎合においおも匊瀟では䞀切責任を負いたせんので十分ご理解・ご泚意の䞊、自己責任の䞋でご利甚をお願いいたしたす。 詳现・ダりンロヌド ダりンロヌドおよび詳现に぀いおは、 こちらGitHub よりご確認ください。 公開・曎新情報 ・2020幎7月14日 Laboro Tomatoを公開したした。 謝蟞 ベヌスラむンモデルの孊習にあたっおは、株匏䌚瀟NTTPCコミュニケヌションズ様のInnovation Labの蚈算資源を䜿甚させお頂きたした。 撮圱ご協力 井出トマトファヌム 様神奈川県 藀沢垂 参考・匕甚 蟲林氎産省 平成30幎床 é£Ÿæ–™ãƒ»èŸ²æ¥­ãƒ»èŸ²æ‘癜曞 Ledge.ai 【蟲業AI泚目䌁業9遞】人工知胜で蟲家の働き方改革は実珟するか
“AI”のギャップが、ビゞネスぞの導入を劚げる 2020.6.22 代衚取締圹CTO 藀原 匘将 抂 芁 “AI”ず聞いお、「人の代わりになるもの」ず思う人もいれば、「限られたこずだけできるもの」ず思う人がいるように、そのむメヌゞは人によっお異なっおいるのが珟状です。こうした認識の䞀臎がないたた瀟内で“AI”プロゞェクトが進んでしたえば、その結果がどうなるかは明らかです。AIをどう捉え、どう䜿うか、基本的ながら重芁な点を考えおいきたす。 本コラムは、日刊工業新聞の連茉『AI・ロボット転機予報part2』ぞ寄皿した内容を再線集したものです。 目 次 ・ “AI”ずいう蚀葉の認識違い ・ AIは単機胜で捉える ・ カスタマむズ発想で組み合わせる ・ 単機胜さを俯瞰しお、共有する “AI”ずいう蚀葉の認識違い ビゞネスの文脈で“AI”ずいう蚀葉が䜿われる時、それが䜕を指しおいるかずいう認識にギャップを感じるこずが少なくありたせん。2012幎以降、ディヌプラヌニングが䞀気に泚目を集めるようになっおからずくに聞かれるようになった「AIは䞇胜なもの」「AIが仕事を奪う」ずいう極端なむメヌゞは枛っおきおいるようです。ですが、今なおAI技術ができるこずに぀いおは、過倧なむメヌゞを持たれおいる方が倚いようにも感じたす。 ビゞネスにAIを導入するずなった堎合、瀟内倖のステヌクホルダヌ間でこの“AI”ずいう蚀葉が意味するずころの認識が合っおいないず、同床異倢になっおしたい、AI導入の成功率は䞋がっおしたいたす。 AIは単機胜で捉える 少なくずもビゞネス掻甚ずいう文脈では、AIは単機胜の様々な技術の集合䜓ず捉えるべきものです。そしおその単機胜の床合いは、䟋えば、音声をテキストに倉える技術音声認識や、画像を芋お䜕が写っおいるかを刀定する画像識別ずいったレベルで、䞀般的に想定される範囲よりずっず狭いのが実際です。各技術ができるこずは非垞にシンプルで、単䜓では必ずしも珟実のビゞネス課題が解決できるずは限りたせん。 もう少し具䜓的な䟋で確認しおみたしょう。䟋えばfacebookなどで写真をアップロヌドするず、写っおいる人が誰かを瀺すタグが自動的に付けられる機胜がありたす。これはナヌザヌ䜓隓ずいう芖点から芋るず䞀぀の機胜ですが、技術的には耇数の単機胜AIが組み合わさっおいたす。写真の䞭で顔がどこにあるかを探すAI顔怜出ず、顔で目や錻などのパヌツを探すAIキヌポむント怜出、顔同士を比べお同じ人かどうかを刀断するAI顔照合の぀から構成されるのが䞀般的で、それぞれは個別の孊習デヌタを䜿っお個別に構築されたす。 カスタマむズ発想で組み合わせる 人間の感芚では䞀芋シンプルそうなこずでも、AIで代替しようずするず予想倖に耇雑な構成になっおしたう堎合もあれば、逆に耇雑そうに芋えおも実はシンプルな構成のAIシステムで実珟できる堎合もありたす。぀たり、ナヌザヌ目線でのAIができるこずず、技術的な芳点でどのような技術をどう組み合わせお実珟するかにはギャップがあるずいうこずです。 この前提に基づくず、ビゞネスにAIを導入する堎合には、AI技術を「遞定する」ずいう発想ではなく、AI゜リュヌションを「カスタマむズする」ずいう発想、蚀い換えれば、どんな技術をどう組み合わせお解くのかを創造的に考えるこずが重芁になっおきたす。 もちろん、パッケヌゞAI補品など汎甚性を売りに発売されおいるような゜リュヌションで解決できる課題であれば、それを導入するのが近道です。ですが、解くべき課題が䌁業にずっお重芁性が高いもの、競争力に関わるものなど、䌁業の本業・コア業務に近づくほど、汎甚的なパッケヌゞAIでは察応できるケヌスは少なくなり、カスタマむズが必芁になっおきたす。 単機胜さを俯瞰しお、共有する AIをカスタマむズするためには、解決すべき課題の深い理解に加えお、AI技術に関する党䜓像を捉えられる知識も必芁になりたす。これは、゚ンゞニアや研究者のレベルで技術的詳现を理解すべきずいうこずではありたせん。単機胜のAI技術が、どんな入出力でどの皋床の粟床が達成されおいるかを広く俯瞰的に把握するずいうこずです。 この理解がステヌクホルダヌ間で正しく共有できれば、AI導入の成功確率が栌段に䞊がるはずです。 コラム執筆者 代衚取締圹CTO 藀原 匘将 京郜倧孊倧孊院修了 博士情報孊。2007幎、産業技術総合研究所にパヌマネント型の研究員ずしお入所。機械孊習を甚いた音声/音楜の自動理解の研究に埓事。開発した特蚱技術を様々な䌁業にラむセンス提䟛し、ラむセンス先䌁業の技術顧問も務める。2012幎、ボストンコンサルティンググルヌプに入瀟。ビッグデヌタ掻甚領域を䞭心に倚数業界・テヌマのプロゞェクトに埓事。AI系のスタヌトアップ䌁業を経お、2016幎に株匏䌚瀟Laboro.AIを創業。代衚取締圹CTOずしお技術開発をリヌド。 その他の執筆コラム ・ AI粟床に䞍可欠な評䟡基準の怜蚎 ・ AIで「やりたいこず」ずデヌタは、䞡茪で議論する ・ AIは䞍完党。本圓に必芁な「AI人材」の圹割ずは ・ ディヌプラヌニングによる䞀般物䜓認識ずビゞネス応甚䞊画像分類 ・ ディヌプラヌニングによる䞀般物䜓認識ずビゞネス応甚䞋物䜓怜出