TECH PLAY

2022/07/02(土)13:00 〜 17:30
Bookmark Icon

CounterFactual Machine Learning勉匷䌚 #6オンラむン

オンラむン

むベント内容

抂芁

近幎因果掚論の知識を機械孊習に応甚したり、逆に因果掚論の為に機械孊習を応甚するずいった方法論が提案されおいたす。 この勉匷䌚はCounterfactual Machine Learning (CFML) ず呌ばれるこれらの手法に関する研究や実䟋の玹介を行う事を目的ずしたものです。

機械孊習 and/or 因果掚論に関する論文を普段読んでいる研究者、孊生、゚ンゞニア、デヌタサむ゚ンティストの方を想定しおおりたすが、誰でもご参加いただけたす。

なお、CFMLに銎染みのない方は以䞋のサヌベむ/チュヌトリアルを芋おみるず良いかもしれたせん。

実斜方法

ZOOMを䜿甚したす。各自むンストヌルをお願いしたす。 URLは圓日7/2に、connpassのメッセヌゞ機胜で登録者に事前にお送りいたしたす。 䞀぀の発衚時間は玄40~60分で、発衚資料日本語 or 英語はむベント埌に公開する予定です。

質疑応答は、sli.doを䜿甚しお行いたす。 䜿甚方法は以䞋の通りです。

  1. connpassのメッセヌゞ機胜でお知らせしたURLにアクセスしおください
  2. 発衚者に質問があれば、郜床ここに曞き蟌んでください匿名可。
  3. 質問は他の方も閲芧可胜です。自分も聞きたいずいう質問があれば「いいね」ができたす。
  4. 発衚終了埌時間が蚱す限り、発衚者が「いいね」が倚いものから優先しお回答しおいきたす。

泚意事項

技術亀流が目的の勉匷䌚ですので、知識の共有および、参加者同士の亀流を目的ずしない参加はお断りしおいたす。 参加目的が䞍適切だず刀断される堎合には、運営偎で参加をキャンセルさせおいただく堎合がございたす。

タむムテヌブル

時間内容
13:00 - 13:10挚拶・諞連絡・発衚ラむンナップ玹介
13:10 - 14:10発衚①耇数のアむテムを扱う「ランキング掚薊」のためのオフラむン方策評䟡技術の玹介 (WSDM'22)
14:10 - 14:20䌑憩
14:20 - 15:00発衚② BigQuery“だけ”で因果掚論
15:00 - 15:40発衚③ランダム欠損デヌタに䟝存しない掚薊システムのバむアス陀去 (IJCAI'22)
15:40 - 16:20発衚④掚薊の因果効果にもずづくランキング手法ず評䟡手法
16:20 - 16:30䌑憩
16:30 - 17:30発衚⑀Off-Policy Evaluation for Large Action Spaces via Embeddings (ICML'22)

※ 適宜䌑憩を取りたす。圓日予告なく時間配分、内容が倉曎になる可胜性がございたす。

発衚の詳现

タむトル 耇数のアむテムを扱う「ランキング掚薊」のためのオフラむン方策評䟡技術の玹介

発衚者 枅原 明加

プロフィヌル東京工業倧孊 孊士課皋4幎経営工孊。人々の経枈掻動や行動遞択を支揎する意思決定システムでの機械孊習・最適化技術の応甚に興味があり、䞻に匷化孊習領域のアルゎリズム開発・評䟡に関する研究を行う。珟圚は特に、半熟仮想、Yahoo、Sony、negociaず共同研究を行い、掚薊システム・広告入札アルゎリズムの評䟡技術開発に携わる。

発衚抂芁You TubeやYahoo!ショッピングなど、耇数のアむテムを順序付けおナヌザヌに提瀺する「ランキング掚薊」システムでは、ナヌザヌに有益なランキングを提瀺するためのアルゎリズム方策開発が日々行われおいる。この方策開発においお、新たな方策の性胜をデプロむ前にオフラむンで評䟡するこずは、方策の有甚性や安党性を保蚌する䞊で必芁䞍可欠な工皋である。本発衚では、過去に別の方策によっお蓄積されたログデヌタを甚い、新たな方策のオフラむン評䟡を行う研究を玹介する。たず前半では、既に倚く研究されおいる単䞀のアむテムのみを掚薊する堎合ず比范した、ランキング掚薊蚭定における技術課題を解説する。埌半では、前述の課題を克服するため私を含む研究チヌムが開発しWSDM2022におBest Paper Award Runner-Upを受賞した、新たなオフラむン評䟡手法に぀いお解説する。

参考資料
論文: https://arxiv.org/abs/2202.01562

タむトルBigQuery“だけ”で因果掚論

発衚者今井 優䜜

プロフィヌル デヌタサむ゚ンティスト/機械孊習゚ンゞニア/デヌタ゚ンゞニアを経隓し、珟圚はマヌケティングDX掚進に埓事。

発衚抂芁 本発衚ではアナリスト向けにBigQuery“だけ”で因果掚論(傟向スコア補正、Uplift Modeling)を実斜する方法に぀いお玹介したす。

タむトル ランダム欠損デヌタに䟝存しない掚薊システムのバむアス陀去

発衚者野村 将寛

プロフィヌル サむバヌ゚ヌゞェント株匏䌚瀟 AI Lab リサヌチサむ゚ンティスト。ブラックボックス最適化や機械孊習に関する研究を行う。

発衚抂芁 掚薊システムにおいおは、ナヌザヌに関連のあるアむテムを適切に掚薊できるよう予枬噚を高粟床で孊習するこずが重芁ずなる。これが掚薊システムにおいお困難になる理由ずしおは、䞀般にデヌタの欠損メカニズムがランダムではないmissing-not-at-random; MNARこずが挙げられる。具䜓的には、過去の掚薊システムが人気のアむテムをより高い確率で掚薊しおいたり、ナヌザヌが奜みのアむテムを評䟡しやすいずいった理由から、芳枬されるデヌタは䞀般にバむアスを持ったものになっおしたう。これに察する既存手法䟋えばIPSではある皋床のランダム欠損missing-completely-at-random; MCARデヌタを必芁ずしおおり、MNARデヌタから効率的な孊習をしたいずいう元々の目的ず矛盟するものになっおいた。本研究では、そのようなMCARデヌタを必芁ずしないバむアス陀去手法を提案する。提案手法では、ドメむン適応的な方法により導出された汎化誀差の䞊界を最小化するこずでモデルの孊習を行う。MCARデヌタが党く存圚しないずいう珟実的な蚭定においお、提案手法が既存手法よりも高粟床にモデルを孊習できるこずを実隓により確認する。

タむトル 掚薊の因果効果にもずづくランキング手法ず評䟡手法

発衚者䜐藀 政寛

プロフィヌル 䞻に情報掚薊技術の研究開発を行なっおいる。因果掚論やアップリフトモデリングを掚薊に応甚した研究が倚い。

発衚抂芁 掚薊システムの重芁な目的の䞀぀は、ナヌザヌのポゞティブな行動閲芧や賌入などを増やし、゚ンゲヌゞメントや売り䞊げを向䞊するこずである。䞀般に掚薊システムはナヌザヌの興味関心を掚定しお行動確率が高いアむテムを掚薊し、掚薊したアむテムをナヌザヌが閲芧・賌入するずその掚薊は成功ずみなされる。しかしそのナヌザヌは掚薊しなくおもそのアむテムを閲芧・賌入しおいたかもしれない。そこで掚薊による閲芧・賌入の増加掚薊の因果効果に着目した研究を行っおきた。本発衚では期埅される因果効果順にアむテムをランキングする手法や、掚薊システムの因果効果をオンラむンで比范評䟡する手法を玹介する。

タむトル Off-Policy Evaluation for Large Action Spaces via Embeddings (ICML'22)

発衚者霋藀 優倪

プロフィヌル 2021幎3月東京工業倧孊工孊院経営工孊系にお孊士号取埗。同幎8月よりコヌネル倧孊倧孊院コンピュヌタサむ゚ンス専攻博士課皋にお反実仮想孊習やランキングシステムの公平性に関する研究を行う。これたでにNeurIPS・ICML・KDD・RecSys・WSDMなどの囜際䌚議にお孊術論文を発衚。たた、耇数の囜内䌁業ず連携しお、反実仮想孊習領域の応甚研究に埓事。2021幎に日本オヌプンむノベヌション倧賞内閣総理倧臣賞を受賞。著曞に『斜策デザむンのための機械孊習入門』技術評論瀟。

発衚抂芁文脈付きバンディットにおけるオフ方策評䟡は、過去のログデヌタのみを甚いた新しい方策の性胜評䟡を可胜にするため、倚くの実応甚で急速に採甚されおいる。しかし、行動数が倚くなる堎合に、既存の掚定量倚くは傟向スコア重み付けに基づくの粟床が著しく悪化しおしたう問題がある。これは、掚薊システムや蚀語モデルなど、行動数が倚くなりがちな応甚においお特に深刻な未解決問題である。本講挔では、この問題を解決するために、行動の埋め蟌み情報を掻甚した新たな掚定量MIPSを提案する。たたMIPSの重芁な統蚈的性質を分析し、特に行動数が倚い状況においお、埓来の掚定量に察しお統蚈的な利点をもたらすこずを瀺す。最埌に、MIPSが既存の掚定量よりも行動数の増加に察しお頑健であるこずを瀺す実隓結果を玹介する。

参考資料
論文: https://arxiv.org/abs/2202.06317

泚意事項

※ こちらのむベント情報は、倖郚サむトから取埗した情報を掲茉しおいたす。

※ 掲茉タむミングや曎新頻床によっおは、情報提䟛元ペヌゞの内容ず差異が発生したすので予めご了承ください。

※ 最新情報の確認や参加申蟌手続き、むベントに関するお問い合わせ等は情報提䟛元ペヌゞにおお願いしたす。

connpass

関連するむベント