CounterFactual Machine Learning勉強会 #6（オンライン）

2022/07/02(土)13:00 〜 17:30 開催

ブックマーク

#Google BigQuery, #オープンイノベーション, #機械学習

イベント内容

概要

近年因果推論の知識を機械学習に応用したり、逆に因果推論の為に機械学習を応用するといった方法論が提案されています。この勉強会はCounterfactual Machine Learning (CFML) と呼ばれるこれらの手法に関する研究や実例の紹介を行う事を目的としたものです。

機械学習 and/or 因果推論に関する論文を普段読んでいる研究者、学生、エンジニア、データサイエンティストの方を想定しておりますが、誰でもご参加いただけます。

なお、CFMLに馴染みのない方は以下のサーベイ/チュートリアルを見てみると良いかもしれません。

実施方法

ZOOMを使用します。各自インストールをお願いします。 URLは当日（7/2）に、connpassのメッセージ機能で登録者に事前にお送りいたします。一つの発表時間は約40~60分で、発表資料（日本語 or 英語）はイベント後に公開する予定です。

質疑応答は、sli.doを使用して行います。使用方法は以下の通りです。

connpassのメッセージ機能でお知らせしたURLにアクセスしてください
発表者に質問があれば、都度ここに書き込んでください（匿名可）。
質問は他の方も閲覧可能です。自分も聞きたいという質問があれば「いいね」ができます。
発表終了後時間が許す限り、発表者が「いいね」が多いものから優先して回答していきます。

注意事項

技術交流が目的の勉強会ですので、知識の共有および、参加者同士の交流を目的としない参加はお断りしています。参加目的が不適切だと判断される場合には、運営側で参加をキャンセルさせていただく場合がございます。

タイムテーブル

時間	内容
13:00 - 13:10	挨拶・諸連絡・発表ラインナップ紹介
13:10 - 14:10	発表①：複数のアイテムを扱う「ランキング推薦」のためのオフライン方策評価技術の紹介 (WSDM'22)
14:10 - 14:20	休憩
14:20 - 15:00	発表②： BigQuery“だけ”で因果推論
15:00 - 15:40	発表③：ランダム欠損データに依存しない推薦システムのバイアス除去 (IJCAI'22)
15:40 - 16:20	発表④：推薦の因果効果にもとづくランキング手法と評価手法
16:20 - 16:30	休憩
16:30 - 17:30	発表⑤：Off-Policy Evaluation for Large Action Spaces via Embeddings (ICML'22)

※ 適宜休憩を取ります。当日予告なく時間配分、内容が変更になる可能性がございます。

発表の詳細

タイトル：複数のアイテムを扱う「ランキング推薦」のためのオフライン方策評価技術の紹介

発表者：清原明加

プロフィール：東京工業大学学士課程4年（経営工学）。人々の経済活動や行動選択を支援する意思決定システムでの機械学習・最適化技術の応用に興味があり、主に強化学習領域のアルゴリズム開発・評価に関する研究を行う。現在は特に、半熟仮想、Yahoo、Sony、negociaと共同研究を行い、推薦システム・広告入札アルゴリズムの評価技術開発に携わる。

発表概要：You TubeやYahoo!ショッピングなど、複数のアイテムを順序付けてユーザーに提示する「ランキング推薦」システムでは、ユーザーに有益なランキングを提示するためのアルゴリズム（方策）開発が日々行われている。この方策開発において、新たな方策の性能をデプロイ前にオフラインで評価することは、方策の有用性や安全性を保証する上で必要不可欠な工程である。本発表では、過去に別の方策によって蓄積されたログデータを用い、新たな方策のオフライン評価を行う研究を紹介する。まず前半では、既に多く研究されている単一のアイテムのみを推薦する場合と比較した、ランキング推薦設定における技術課題を解説する。後半では、前述の課題を克服するため私を含む研究チームが開発しWSDM2022にてBest Paper Award Runner-Upを受賞した、新たなオフライン評価手法について解説する。

参考資料
論文: https://arxiv.org/abs/2202.01562

タイトル：BigQuery“だけ”で因果推論

発表者：今井優作

プロフィール：データサイエンティスト/機械学習エンジニア/データエンジニアを経験し、現在はマーケティングDX推進に従事。

発表概要：本発表ではアナリスト向けにBigQuery“だけ”で因果推論(傾向スコア補正、Uplift Modeling)を実施する方法について紹介します。

タイトル：ランダム欠損データに依存しない推薦システムのバイアス除去

発表者：野村将寛

プロフィール：サイバーエージェント株式会社 AI Lab リサーチサイエンティスト。ブラックボックス最適化や機械学習に関する研究を行う。

発表概要：推薦システムにおいては、ユーザーに関連のあるアイテムを適切に推薦できるよう予測器を高精度で学習することが重要となる。これが推薦システムにおいて困難になる理由としては、一般にデータの欠損メカニズムがランダムではない（missing-not-at-random; MNAR）ことが挙げられる。具体的には、過去の推薦システムが人気のアイテムをより高い確率で推薦していたり、ユーザーが好みのアイテムを評価しやすいといった理由から、観測されるデータは一般にバイアスを持ったものになってしまう。これに対する既存手法（例えばIPS）ではある程度のランダム欠損（missing-completely-at-random; MCAR）データを必要としており、MNARデータから効率的な学習をしたいという元々の目的と矛盾するものになっていた。本研究では、そのようなMCARデータを必要としないバイアス除去手法を提案する。提案手法では、ドメイン適応的な方法により導出された汎化誤差の上界を最小化することでモデルの学習を行う。MCARデータが全く存在しないという現実的な設定において、提案手法が既存手法よりも高精度にモデルを学習できることを実験により確認する。

タイトル：推薦の因果効果にもとづくランキング手法と評価手法

発表者：佐藤政寛

プロフィール：主に情報推薦技術の研究開発を行なっている。因果推論やアップリフトモデリングを推薦に応用した研究が多い。

発表概要：推薦システムの重要な目的の一つは、ユーザーのポジティブな行動（閲覧や購入など）を増やし、エンゲージメントや売り上げを向上することである。一般に推薦システムはユーザーの興味関心を推定して行動確率が高いアイテムを推薦し、推薦したアイテムをユーザーが閲覧・購入するとその推薦は成功とみなされる。しかしそのユーザーは推薦しなくてもそのアイテムを閲覧・購入していたかもしれない。そこで推薦による閲覧・購入の増加（＝推薦の因果効果）に着目した研究を行ってきた。本発表では期待される因果効果順にアイテムをランキングする手法や、推薦システムの因果効果をオンラインで比較評価する手法を紹介する。

タイトル： Off-Policy Evaluation for Large Action Spaces via Embeddings (ICML'22)

発表者：齋藤優太

プロフィール： 2021年3月東京工業大学工学院経営工学系にて学士号取得。同年8月よりコーネル大学大学院コンピュータサイエンス専攻博士課程にて反実仮想学習やランキングシステムの公平性に関する研究を行う。これまでにNeurIPS・ICML・KDD・RecSys・WSDMなどの国際会議にて学術論文を発表。また、複数の国内企業と連携して、反実仮想学習領域の応用研究に従事。2021年に日本オープンイノベーション大賞内閣総理大臣賞を受賞。著書に『施策デザインのための機械学習入門』（技術評論社）。

発表概要：文脈付きバンディットにおけるオフ方策評価は、過去のログデータのみを用いた新しい方策の性能評価を可能にするため、多くの実応用で急速に採用されている。しかし、行動数が多くなる場合に、既存の推定量（多くは傾向スコア重み付けに基づく）の精度が著しく悪化してしまう問題がある。これは、推薦システムや言語モデルなど、行動数が多くなりがちな応用において特に深刻な未解決問題である。本講演では、この問題を解決するために、行動の埋め込み情報を活用した新たな推定量MIPSを提案する。またMIPSの重要な統計的性質を分析し、特に行動数が多い状況において、従来の推定量に対して統計的な利点をもたらすことを示す。最後に、MIPSが既存の推定量よりも行動数の増加に対して頑健であることを示す実験結果を紹介する。

参考資料
論文: https://arxiv.org/abs/2202.06317