広告業界のデータサイエンティストが東京経済大学で語る、機械学習を活用したビジネスの面白さと挑戦
データサイエンスやAIへの関心を高め、将来のキャリアを広げる
「私を通して、皆さんがデータサイエンティストの世界を少しでも覗くことができたら嬉しいです」と、学生の前で語り始めたのは、博報堂テクノロジーズのデータサイエンティスト、王直(WANG ZHI/オウ チョク)氏だ。講義が行われたのは、東京都国分寺市にある東京経済大学(東経大)。「経営情報システム論」の授業だ。
株式会社博報堂テクノロジーズ プロダクト開発センター 王直氏
中国広東省出身の王氏は、子どもの頃から日本文化に興味を持ち、独学で日本語をマスターした。中国の最難関大学、北京大学では有機化学を専攻。2015年に卒業後、米シカゴ大学大学院に留学し、修士・博士合計5年間で計算化学について研究。その後日本の大手電機メーカーに就職し、大規模学習のアルゴリズムを開発してきた。
2023年に博報堂テクノロジーズに転職。いまはプロダクト開発センターAI研究開発部に所属し、画像・言語の関係性を理解するモデルの構築を主に担当している。
経営学部の「経営情報システム論」はデータサイエンスやAIへの関心を高め、それを活用する基礎的な能力を育成するための教育プログラムの一環だ。今年度からは、4月に東経大に着任したばかりの岩田聖徳専任講師(前・東京理科大助教)が担当している。企業で活躍しているビジネスパーソンを、こうした授業のゲストスピーカーに招くのは王氏が3人目だ。
「理系学部ではなく経営学部に設置されているため、社会科学・企業経営の文脈におけるデータ分析・利活用について学ぶことに主眼を置いています。文系学生が今後のビジネスとしての情報系分野とどう関わっているかというキャリアの観点からも、実際の企業で活躍している王さんの話は有意義だと考えました」(岩田氏)
東京経済大学 経営学部 専任講師 岩田聖徳氏
実は、岩田講師と王氏はプライベートでも、以前から繋がりがあり、岩田氏が声をかけると、王氏は二つ返事で引き受けてくれたのだという。
「会社のPRになるということも、もちろんありましたけれど、それ以上に、未来のために種をまいていきたい。私の話を聞いてくれる学生の中から、この分野を目指す人材が育ってくれればうれしいという思いもありました」(王氏)
データサイエンティストは就職・転職市場でも引っ張りだこ
理系の学生向けにデータサイエンスの講義をする際は、テクノロジーの細かい話になりがちだが、今回は文系学生が対象ということで、数式はほとんど使わず、王氏の語り口も丁寧でわかりやすい内容だった。
まずはデータサイエンティストに必要なスキルを、データ、解析、活用に分けて説明を行った。それを仕事にするためには、データ蓄積、統計解析、機械学習、レポーティングなど、どれか一つは専門的な知識が求められる。
しかし、「必要なスキルを全部習得する必要はないのです」と説明すると、学生たちはホッとしたような表情を見せる。
「大手企業では、複雑なプロセスを複数の専門家が分業することが必要となります。つまり、一つの分野さえ極めればOKなのです」(王氏)
データ分析は、従来から企業活動を支える重要な作業だった。ただ、昔は手作業でそれを行い、人の経験と勘で分析していたが、現在はデータサイエンスでデータ処理を自動化し、ファクトを元に分析ができるようになった。つまり「データドリブン(データ駆動)」が企業活動の中心に据えられるようになっている。
そのためデータサイエンティストへのニーズは高まっているが、人材不足は顕著であり、採用にあたって好条件を提示する会社が増えている。それらの状況を王氏は、データサイエンティストの求人検索結果などデータをもって示すと共に、自身の就職・転職体験での実感をこめて語った。
経営学部の学生が、データサイエンスを学ぶことの意義はどこにあるのか。講義の主眼はそこにあった。王氏が強調するのは、企業活動とデータ分析を掛け合わせた「ビッグデータ利活用」の可能性が広がり、それが「ビジネスでも重要になっている」という視点だ。
博報堂DYグループの統合マーケティングプラットフォーム「CREATIVITY ENGINE BLOOM」で変わったこと
その具体的な説明として、王氏が日常的に接している広告業の業務を紹介してくれた。
「広告業界では常にクライアントの意向を汲み取って、どんな広告をどのタイミングで出すかという選択肢を迫られます。これまでは過去の経験などに頼るところもありました。しかし今はデータドリブンという考え方で、膨大な実績データを分析して、最も適切な解を探り、ニーズに合った広告を選ぶという方法に進化しています」(王氏)
王氏が自身の仕事の一部として紹介したのは、博報堂DYグループが、マーケティングからクリエイティブ、生活者との新たな関係性を構築するエンゲージメントに至るまで、総合的に活用するプラットフォーム「CREATIVITY ENGINE BLOOM」だ。
その中で王氏は、広告クリエイティブの質を高めるために活用される<CREATIVE BLOOM>と呼ばれるエンジンの開発に携わっている。広告の効果を事前に予測したり、自動でペルソナ(典型的なユーザー像)を生成したり、広告の質を管理するシステムだ。
博報堂テクノロジーズのプロダクト開発センターでは、クライアントだけでなく、生活者や社会にとっても「うれしい広告」を追求している。そのために高品質の広告を大量に制作する必要があるが、人材獲得が課題となっていた。そこで現在はAIが広告制作を支援することが増えてきた。
例えば、新車の広告を撮影するために、どんな背景がいいか。これまではクリエイターたちが人手を使って過去や市販画像を探したり、何枚もスケッチを描いたり、実際にロケを繰り返したりと、大変な苦労をしていた。
その苦労を軽減するため、王氏は一つの機械学習モデルを開発した。画像検索をAIで加速させたのだ。例えば、Google画像検索で検索すると、以下スライドのように湾岸の道路をブルーの新車が疾走している画像が出てきたとする。
王氏の開発したシステムを活用すると、背景にはメインの被写体を際立たせるように、赤い車と黒い車がぼんやりと写っていて、その先には海が見えるというプロンプトを打ち込むと、ぴったりの画像を検索してくれるのだ。
これまでの画像検索などでは、ここまでの精度はかなりの困難だった。
なぜそれが可能になったかといえば、画像検索システムのコアである機械学習モデルが、視覚・言語情報を理解した上で、その関係性をもとに画像を検索するからだ。
例えば「犬」という文字と、犬の画像を一つの空間にマッピングする。そうすると、「犬」という文字から意味的に一番近いイメージの犬の画像を検索してくれる。
さらにこれを発展させれば、従来の機械学習モデルが単にアルファベットの並びの違いとしか認識できなかった似たような社名の区別もできるようになるかもしれない。
このようなモデルを、専門用語では「VLPモデル」(Vision-Language Pre-training=視覚言語事前学習の略)と呼ぶ。英語圏では盛んに開発されており、日本語モデルもあるが、精度が低かった。
王氏は日本語に特化する形でその精度を向上させ、一般的な英語モデルよりも高い検索精度を実現した。その成果は「日本語特化VLPモデル」として、研究者コミュニティに広く公開されている。データサイエンティストの仕事は、自社の事業に貢献するだけでなく、ときに社会全体にも貢献しうるという一例でもある。
「内容領域専門家」としてデータ活用をより豊かにする道
王氏は、文系学生がデータサイエンティストを目指す意味を次のように語った。一つは文系学生ならではの特性がそこで活かせるからだ。データ活用には業務や市場、消費者心理など特定のドメインに関する専門知識が不可欠だ。
「こうしたドメイン知識に優れた人を“内容領域専門家(Subject Matter Expert)”と呼びますが、現在のデータサイエンスには、その知識が不可欠になっています」(王氏)
もしも社内に「内容領域専門家」がいなければ 、データ分析の結果を何に適用するか、どのように効果を予測するのか、どのようなタイプの施策を講じればいいのかさえわからなくなる。そもそも何のためにデータを分析するのかという動機さえもが曖昧になってしまう。
ドメイン知識は、機械学習モデルの精度を高めることにも貢献する。機械学習モデルがよく陥りがちな 「過学習」をあらかじめ避けることができ、より学習効率の高い、品質の高いモデルを作ることも可能になるからだ。
また、データ活用にあたって、データから得られた知見を利害関係者に伝え、広く共感を得る必要がある。単に「データはこう語っています」だけでは、人は動かないだろう。難しい言葉をわかりやすく伝えるコミュニケーション能力や、それを製品やサービスに実装するビジネス能力が不可欠なのだ。
「ドメイン知識、コミュニケーション能力、ビジネス能力は、いずれも文系の得意なところだと思います。文系人材はこれらを武器にして、データサイエンスの発展に貢献してもらいたいと願っています」(王氏)
参入障壁を低くし、若い人材の“盾”になる
王氏は講義でこのようにも語っている。
「データサイエンティストになるためには、何かの課題に向けて解決する姿勢が不可欠ですし、課題解決する社会的責任の自覚も求められます。ぜひ、自分の力で社会に関係し、課題解決のためにデータサイエンスを活用してください。そのために欠かせないのが好奇心。そして、自分の長所を伸ばしつつ、短所を補っていくという構えです。
今はプログラミングスキルがないからといって諦めないでください。プログラミングスキルは学生のうちに十分キャッチアップできるものです。コンピュータは不得手だが、ビジネススキルはありそうだという人は、それを強みにしたらいいでしょう。無理にエンジニア職に応募しなくても、他の道からもデータサイエンスに寄与できるのです」(王氏)
王氏がこう呼びかけると、学生たちの表情がさらに明るくなるのが伝わってきた。
講義の最後には、あらかじめ学生たちから寄せられた質問に王氏が答える時間も設けられた。例えば、その中には「大規模学習モデル(LLM)が人間の仕事を奪うという主張があるが、AIと人間の棲み分けは今後どうなるのか」「LLMを研究する人たちは、著作権やプライバシーと技術発展の両立についてどう考えているのか」など、鋭いものもあった。
それらに対して、王氏が「会社の立場ではなく、あくまでもサイエンティストの一人」として真摯に答えていたのが印象的だった。
「私自身、大学の学部時代は有機化学を専攻していて、そこからデータサイエンティストに転向した、いわば境界を越えた人間です。製造業の会社から博報堂テクノロジーズという広告の会社に転職したのも、自分の力を違う分野で発揮したかったからです。
それまで広告の知識は皆無に等しいものでした。そういう人間でも好奇心と努力さえあれば、なんでもできるのだということが、今日の講義で話したかった最大のポイント。境界の壁をできるだけ低くして、これからこの道に進む学生の“盾”になれれば幸いです」と、王氏は最後にメッセージを送ってくれた。
(プロフィール)
株式会社博報堂テクノロジーズ プロダクト開発センターAI研究開発部 王直氏
2015年、北京大学卒業。2020年、シカゴ大学 博士課程修了後、大手電機メーカーに入社。大規模機械学習のアルゴリズムの開発を担当。2023年、博報堂テクノロジーズに入社。画像・言語の関係性を理解するモデルの構築を行っている。