日立ハイテクのデータサイエンティストが語る「AI・データサイエンス」に求められる本質とは
アーカイブ動画
未経験からAI・データサイエンスの専門性を身につけるには
「計測・分析・解析」をコア技術とし、半導体製造装置や医療用検査システムといったハイテク、デジタルソリューション領域でビジネスを展開する日立ハイテク。今回のイベントでは「AI×データビジネス」の領域で活躍する4人のデータサイエンティストが登壇した。
最初に登壇した加藤諒也氏は、2018年に日立ハイテクソリューションズ入社後、アメリカでAI・データサイエンスを学び、データサイエンティストとして数々のAIプロジェクトに携わってきた。2022年4月に日立ハイテクに出向。現在は、半導体検査装置向けの画像処理AIの開発に取り組んでいる。
まず加藤氏は、「データサイエンティストは企業が抱えるさまざまな課題をデータを元に解決する人材であり、AIはあくまで手段。AIを使うことが目的となってはいけない」と切り出す。そして近年では、機械学習の中でもディープラーニングが注目を浴びていると続ける。
また、貸付審査の高度化を例に、機械学習適用におけるデータサイエンティストの役割を説明した。
ある金融機関では、これまでベテラン担当者の経験則により行っていた業務を、データ・機械学習を活用することで不履行のリスクを減らす取り組みを実施。さらには、スピーディーな審査、属人化解消の実現を目指している。
人であればデータが明らかな間違いに気づくが、機械は柔軟ではないため、そのまま作業を進めてしまう危険性がある。そこで、データサイエンティストがデータ加工やモデリングなどを行う必要がある。機械学習のデータ加工はデータサイエンティストにとっては腕の見せどころともいえる。
加工のひとつが、特徴量の選択や追加である。機械学習ではすべてのデータを扱うのではなく、課題解決につながるデータのみを選定する必要がある。このように数多くある変数から選ばれたデータ列を特徴量という。
「契約時の年齢が課題解決につながると思えば、特徴量に追加します。特徴量はかける(×)、割る(÷)などの手を加えて新たに作成することで、精度を高めることができるかを検討します」(加藤氏)
他のデータを比べて明らかに異なる数値のデータを外れ値といい、同データを除去する作業も行う。例えば、「20歳より若い」「他社で多額の融資を受けている」などである。
ただし、外れ値であるかどうかの判断は「基準が難しい」と加藤氏。そのためプロジェクトのメンバーとはもちろん、顧客とも議論をする必要がある。
性別や独歴欄のローマ字や漢字も機械は認識できないため、01(ゼロイチ)に変換する必要がある。このエンコーディングはPythonで容易に求めることが可能だ。
データの加工が済んだら、機械学習を行う。ただし、計算手法(アルゴリズム)は複数あるため、さまざまな計算式で実施し、定量的な評価を行うことが重要となる。
また、AI開発や機械学習の練習環境としては、無料で使える「ANACONDA DISTRIBUTION」、データ収集にはKaggleがお勧めとのことである。
加藤氏は、データサイエンティストとして日立ハイテクで働くやりがいを次のように語っている。
「データ加工などの試行錯誤が精度という形で見えること、ノウハウを身につけていくことで、エンジニアとして価値が高まることがやりがいです。日立ハイテクでは、医療や半導体といった領域に対してグローバルを飛び回りながら、社会貢献に携わっていることを実感してます」(加藤氏)
日立ハイテクが取り組むアメリカでの最新AI×データビジネス
続いて登壇したのは、2017年に米国ボストンに渡り、Hitachi High-Tech America, Inc.で新規事業開発や北米のスタートアップの調査に取り組む秋元芽依氏。シリコンバレーのスタートアップが参加するミートアップにも積極的に参加し、MITやハーバード大学にも足を運びながら、人脈を築いてきた人物である。
アメリカにおけるデータ活用のビジネストレンドについては、導入する狙いと対象という観点から、これまでの事例・これからの傾向について言及した。
これまでの事例については、データをもとに未来の事象を予測するケースが多かった。例えば、工場の稼働状況などを見える化することで、保守費用や生産コストの改善を狙う。
そのため対象は、大型機器のエンジンやモーター、工場の生産ラインの機器といった、物理的にも経済効果的にも大きなものであった。日本でも広まりつつあるスマートファクトリー、遠隔監視といったトレンドと重なる。
一方で、昨今のトレンドは生産ラインを超えた先のサプライチェーンまでに及ぶという。実際、サプライチェーンを可視化するプラットフォームが多く登場している。
「アメリカ企業とビジネスを続けるためには、サプライヤーはこうしたプラットフォームに登録する必要があります」(秋元氏)
SDGs 、社会的義務の遂行、コンプライアンス遵守といったキーワードも注目されているといい、温室効果ガスの排出量を算定し計算する、カーボンアカウンティング(炭素会計)関連のサービスを手掛けるスタートアップの事例も紹介された。
「将来は義務化されることもあり、すでに大手から投資を集めており、導入実績も生まれています」(秋元氏)
対象となるデータにおいては、従来どおり生産ラインなどのデータは活用していく。一方で、これまでブラックボックスであった判断基準が不明なアルゴリズムによるモデリングは、人種差別や航空機の事故といったトラブルが発生することがあった。
欧米では大きな損失となっており、罰金対象にもなっているという。そこで今後は透明性の高いAIが求められている。
IT人材の多くがITベンダーに所属する日本とは真逆で、アメリカではユーザー企業に所属している。そのため「情報へのリーチが早く、デジタルマーケティング力を最速で強化できることもアメリカの強み」と語り、秋元氏はセッションをまとめた。
本質が問われる時代のサイバー×フィジカル的思考とは
続いては、多くの特許や論文発表ならびに受賞歴を持ち、大学院の非常勤講師、製造業関連の各種委員会の委員長、講師など、技術者として幅広いフィールドで活躍・実績を持つ今井伸一氏が登壇した。まずは、次のようなメッセージを投げかけた。
「AIツールの進化によって、素人と専門家の境界線が曖昧になってきた環境下でエンジニアとして生き残るためには、数学・統計的な考え方や基礎力、データの本質を見ることが重要です」(今井氏)
例えば半導体の製造プロセスにおいて、ウェハーを加熱するホットプレートの温度は机上でも現場の専門家でも、一定だとされていた。だが、データを詳しく見ていくと、以下のスライドのように変化している。逆に、一定温度の場合は異常であることがわかったという。
また、今井氏は半導体製造におけるサイバーとフィジカルに関する概念を提唱してきた。フィジカル空間での工程がすべて終わっていなくとも、その工程をサイバー空間で置き換え、プロセスの特性予測からデバイスの特性を予測する取り組みだ。
その手法(概念)はVM技術(Virtual Metrology:仮想計測技術)と呼ばれ、今井氏は実用化も達成している。ウェハーの膜研磨だ。
リアル、フィジカル空間で行っていた工程をサイバー空間に持っていく。例えば研磨速度をサイバー空間で予測し、膜厚のばらつきが出ない研磨時間を算出する。そうして得られた数値を用い、実際に研磨を行った結果、ばらつきが見事に抑えられている。
結果だけ見るとスマートであり、コストや時間削減などに貢献していることがわかると今井氏。だが、サイバーでの情報を現実に実装するには困難な課題があるなど労力が必要となる。そこを超えるのが技術者であり、素人とプロの境界でもあると強調した。
データならびにVMを活用したフィールドは製造現場に限らず、今後の潮流は人の能力拡張に広がると今井氏は語る。
「例えば、人の手を4本にしたり、義足においても通常の足よりも高いパフォーマンスを発揮するようになるだろう。人間の能力は拡張し続け、空を飛ぶ時代が来るかもしれない」(今井氏)
最後は次のようにまとめ、セッションを締めた。
「ムーアの法則のように、データは今後も増え続けます。そして中には、人が気づかない現象が潜むデータもあるかもしれません。そのようなデータをAIが発見することで、科学はさらに変化していくでしょう」(今井氏)
データを通じて顧客と価値創造を生み出すやりがいや苦労
ここからは、日立ハイテクソリューションズのリュウ イリョウ氏が加わり、加藤氏、今井氏とパネルディスカッションを展開した。
●海外プロジェクトで苦労したことは?
今井:まずは海外とのやり取りにおいて、コミュニケーションなどで苦労した点について、聞かせてください。
リュウ:中華圏、アジア圏のメンバーで進めるグローバルネットワーク切り替えプロジェクトに参画したときのことです。デジタルサービスを強みとした企業との協業案件で、現地の人の理論や物理的な状況を把握する必要がありました。
現地ITの部門とのやり取りも発生したため、現地の言葉を日本語へ翻訳したり、中国語でやり取りするなど、苦労というよりは自分の言語能力が活かされていると感じました。
今井:プロジェクトの中身を理解しないと、本当の意味でのコミュニケーションは取れませんよね。
リュウ:社長直下のプロジェクトだったので、最初は緊張していました。しかし、社長をはじめとするメンバーはみなやさしく、落ち着いて進めることができました。プロジェクト終了後の打ち上げも楽しかったですね(笑)。
今井:私も2019年から日立ハイテクグループに加わっていますが、風通しがいい社風ですね。加藤さんはどのプロジェクトが印象に残っていますか。
加藤:3年ほど前に携わった、台湾政府と提携した企業との国家プロジェクトです。役員クラスも参画するビッグプロジェクトであったので、当時は若かったこともあり、携わることができただけで感無量でした。
緊張はしていましたし、失敗したらどうしようと考えなかったわけではありません。仮に自分が失敗しても誰かが取り返してくれる風土があったので、安心して臨んでいました。
●学習対象や勉強時間の確保について
今井:最近勉強している技術について教えてください。
リュウ:ネットワークスペシャリスト、ベンダーの各種資格、DevOps関連の勉強をしています。API連携を使いプログラムを取り込み、作業を自動化する方法を考えるなど、楽しみながら学んでいます。
加藤:最近は統計やアルゴリズムについて、仕組みや理論をきちんと理解することを意識しながら勉強しています。仕事中にわからないことがあれば、その場で調べて学ぶという流れが多いですね。ただし技術系資格については、業務が終わった後に学ぶことが多いです。
【Q&A】視聴者からの質問に答えるセッションも実施
視聴者からの質問に答えるQ&Aセッションも設けられた。その一部を紹介する。
Q.データ加工のコツは?
加藤:どんな問題を抱えているのか、データの本質や特性を把握しておくことです。
今井:外れ値や特徴量を出すツールやテクニックはありますが、やはり本質を見ることに尽きますね。
Q.データサイエンスに取り組むようになったきっかけは?
今井:前職の研究所でサンプル出荷のプロジェクトに参加した際、研究だけではなく、顧客視点を持つ重要性を感じました。また、2000年に大規模プロジェクトに参加したことで、データの重要性を実感しました。
Q.日立ハイテクで働く魅力は何か
リュウ:最新技術を次々と取り入れています。私はネットワーク・インフラまわりの案件に携わっていますが、Ciscoの最新コントローラーやクラウドなどもベンダーと一緒に勉強しながら導入しています。
加藤:日立のグループ企業である点です。グループ会社の担当者とやり取りすることも多いですし、異動もあります。私は日立製作所にいたこともあります。グループ内の多くの技術を知る人や、技術と出会う機会があることが刺激となっています。
Q.データサイエンティストの業務範囲はどこまでか
今井:単に解析するだけでなく、コンサルティング業務も含め、ビジネス課題の解決まで担っています。他社ではエバンジェリストと呼ばれることもあるようですが、日立の中ではソリューション提供もデータサイエンティストが行っています。