[The 86th TrustML Young Scientist Seminar] Talk by Yuta Saito (Cornell University) "意思決定システムのためのデータに基づく報酬関数設計"
イベント内容
Date and Time:
December 19, 2024: 11:00 - 12:00 (JST)
Venue: Online and Open Space at the RIKEN AIP Nihonbashi office*
*Open Space is available to AIP researchers only
Title: 意思決定システムのためのデータに基づく報酬関数設計
*The talk will be in Japanese.
Speaker: Yuta Saito (コーネル大学)
Abstract:
言語モデルや推薦モデルなどの意思決定モデルの学習を行うためにはまず、何らかの報酬関数を定める必要がある。報酬関数はモデルの学習が進む方向を決定付ける重要な関数であり、この設計を誤ってしまうと、ユーザー満足や収益などの改善につながらない問題を解き続けてしまうことになりかねない。本発表では、データに基づいて報酬関数を設計する方法論と実例を紹介する。特に、誰もが知るプラットフォームで行われた大規模実験の結果をもとに、報酬関数設計の重要性や報酬関数すらも個別化してしまう新たなアイデアの威力を示す。
Bio:
2021年3月に東京工業大学(当時)にて学士号を取得。在学中から、反実仮想学習の推薦システムへの応用に関する共同研究・社会実装に取り組む。2021年8月からは米コーネル大において反実仮想学習に関する研究を継続し、国内外の企業と連携しながら国際会議で論文を多数発表。IBIS2024では、関連領域に関するチュートリアルを行う。著書に『施策デザインのための機械学習入門』『反実仮想機械学習』
注意事項
※ 掲載タイミングや更新頻度によっては、情報提供元ページの内容と差異が発生しますので予めご了承ください。
※ 最新情報の確認や参加申込手続き、イベントに関するお問い合わせ等は情報提供元ページにてお願いします。
新規会員登録
このイベントに申し込むには会員登録が必要です。
アカウント登録済みの方はログインしてください。
※ ソーシャルアカウントで登録するとログインが簡単に行えます。
※ 連携したソーシャルアカウントは、会員登録完了後にいつでも変更できます。