CounterFactual Machine Learning勉強会 #5（オンライン）

2020/08/27(木)19:00 〜 21:00 開催

ブックマーク

#アルゴリズム, #機械学習

イベント内容

概要

近年因果推論の知識を機械学習に応用したり、逆に因果推論の為に機械学習を応用するといった方法論が提案されています。この勉強会はCounterfactual Machine Learning (CFML) と呼ばれるこれらの手法に関する研究や実例の紹介を行う事を目的としたものです。

機械学習 and/or 因果推論に関する論文を普段読んでいる研究者、学生、エンジニア、データサイエンティストの方を想定しておりますが、誰でもご参加いただけます。

なお、CFMLに馴染みのない方は以下のサーベイを見てみると良いかもしれません。

齋藤優太.
私のブックマーク：反実仮想機械学習 (Counterfactual Machine Learning, CFML).
人工知能, Vol.35, No.4, pages 579–587, 2020.
https://www.ai-gakkai.or.jp/my-bookmark_vol35-no4/

実施方法

ZOOMを使用します。各自インストールをお願いします。 URLは当日（8/27）に、connpassのメッセージ機能で登録者に事前にお送りいたします。一つの発表時間は約40分で、発表資料（日本語 or 英語）はイベント後に公開する予定です。

質疑応答は、sli.doを使用して行います。使用方法は以下の通りです。

connpassのメッセージ機能でお知らせしたURLにアクセスしてください
発表者に質問があれば、都度ここに書き込んでください（匿名可）。
質問は他の方も閲覧可能です。自分も聞きたいという質問があれば「いいね」ができます。
発表終了後時間が許す限り、発表者が「いいね」が多いものから優先して回答していきます。

注意事項

技術交流が目的の勉強会ですので、知識の共有および、参加者同士の交流を目的としない参加はお断りしています。参加目的が不適切だと判断される場合には、運営側で参加をキャンセルさせていただく場合がございます。

タイムテーブル

時間	内容
19:00 - 19:05	挨拶・諸連絡
19:05 - 19:45	発表①：過去の配信方策に囚われない広告配信アルゴリズムの紹介
19:45 - 20:35	発表②：Off-Policy Evaluationの基礎とOpen Bandit Dataset & Pipelineの紹介
20:35 - 21:15	発表③：社会をデータでデザインする：市場設計・因果推論・機械学習を融合した統一アプローチ

※ 適宜休憩を取ります。当日予告なく時間配分、内容が変更になる可能性がございます。

発表の詳細

タイトル：過去の配信方策に囚われない広告配信アルゴリズムの紹介

発表者：柳沼傑

プロフィール： SMN株式会社 a.i lab. Data Scienceチーム、VALIS Cockpitチーム兼任データサイエンティスト。SMNではネット広告のオークションを行うDSPとして広告配信サービスのR&Dに力を入れていますが、私は特にCounterfactualを利用したマーケティング最適化のR&Dに取り組んでいます。

発表資料：https://drive.google.com/file/d/1vZsbHV6w4FvDGOJxdHjIi1sfdfLqspKr/view

発表概要：広告配信を行うDSPでは予算の範囲内で購入数を最大化するために、広告商品に興味を持つユーザーをターゲティングしています。このためクリックや購入ログデータから、ユーザーの商品への興味を推定します。しかし一般的にこのようなログは過去の配信方策に依存したバイアスを含むため、過去にターゲティングされて商品を購入したユーザーの特徴を過大評価します。この結果、本来商品を購入してくれたはずのユーザーでも既存の購入ユーザーに似ていない場合とりこぼしてしまいます。これはランキング学習や推薦で有名な過去の推薦方策によるバイアスを取り除く問題設定と同一のものとして考えることができます。この発表では、DSPが取り組むビジネス課題からスタートし、過去の配信方策によって生じたバイアスを取り除いて商品に興味をもつユーザーを取りこぼすことなく広告配信するアルゴリズムについてお話させていただきます。

タイトル： Off-Policy Evaluationの基礎とOpen Bandit Dataset & Pipelineの紹介

発表者：齋藤優太

プロフィール：半熟仮想株式会社 co-founder・東京工業大学学士課程4年。主に因果推論と機械学習の融合技術を用いた情報検索システムのバイアス除去に関する研究を行う。また、CyberAgent・Sony・ZOZO・SMNなどの国内企業と連携して、因果推論 x 機械学習領域の社会実装や理論と実践の溝を埋めるための研究を進めている。

発表資料：https://speakerdeck.com/usaito/off-policy-evaluationfalseji-chu-toopen-bandit-dataset-and-pipelinefalseshao-jie

発表概要：テック企業における機械学習応用の場面においては、機械学習による予測をそのまま用いるのではなく、「それぞれのユーザーにどのファッションアイテムを推薦すべきか？」などの意思決定を下すための情報として用いることが多い。このような場合に、予測精度をオフライン評価指標として用いてしまうと、最終的なモデル選択に失敗してしまうことがある。本発表では、機械学習による予測に基づいて作った意思決定policyの性能を直接オフラインで評価するためのOff-Policy Evaluationの基礎について解説する。また、国内最大のファッションECサイトであるZOZOTOWNにおいて私を含む研究チームが行った実験に基づき研究用に公開した大規模実データ（Open Bandit Dataset）とパッケージ（Open Bandit Pipeline）について特徴や、使用方法について解説する。

参考資料
論文: https://arxiv.org/abs/2008.07146
Open Bandit Pipeline: https://github.com/st-tech/zr-obp
Open Bandit Dataset: https://research.zozo.com/data.html
プレスリリース: https://corp.zozo.com/news/20200818-11223/

タイトル：社会をデータでデザインする：市場設計・因果推論・機械学習を融合した統一アプローチ

発表者：成田悠輔

プロフィール：経済学者・データ科学者・教育学者・事業者・物書き。専門は、データ・アルゴリズム・数学を使ったビジネスと政策（特に教育）のデザイン。イェール大助教授、半熟仮想株式会社代表、一橋大特任准教授、経済産業研究所客員研究員などを兼任。東京大学卒業後、MITでPh.D.を取得。事業者として、サイバーエージェント、ZOZO、Yahoo!、メルカリ、日本ユニシスなどとの共同研究・事業に携わり、日本経済新聞やForbesなどにも取りあげられた。研究者として、多分野の国際学術誌に査読付論文を出版。大学生時代の黒歴史的共訳著に『ゲーム理論による社会科学の統合』『学校選択制のデザイン』など。Forbes Japan、共同通信、Yahoo!ニュースのコラムニストも気分次第で務める。

発表概要：公共政策からビジネスまで、機械学習や市場設計などのアルゴリズムを利用した意思決定が広がっている。その際に重要になるのが、過去に使われたことのない新しい意思決定アルゴリズムの性能を予測することだ。正確な性能予測はよりよいアルゴリズムの発見につながる。この発表では、過去に使われたアルゴリズムが自然に蓄積したデータを用いて、未知のアルゴリズムの性能を予測する技法を提案する。この方法は幅広いアルゴリズムに適用可能で、使える場面はウェブコンテンツ配信・価格設定・金融機関の審査のようなビジネスから、裁判の判決、データ駆動教育・医療、そして学校入試・労働市場設計やオークションなどの公共政策まで多岐にわたる。これらの例を見渡すことで、様々な社会制度・政策・ビジネスの評価・設計・予測を統一技術で行えることを示す。最後に、そのような試みを展開する場所として私たちがはじめた新会社を紹介する。