BEGIN:VCALENDAR
VERSION:2.0
PRODID:-//https://techplay.jp//JP
CALSCALE:GREGORIAN
METHOD:PUBLISH
X-WR-CALDESC:Algorithmic Learning ＆ Optimization勉強会#1
X-WR-CALNAME:Algorithmic Learning ＆ Optimization勉強会#1
X-WR-TIMEZONE:Asia/Tokyo
BEGIN:VTIMEZONE
TZID:Asia/Tokyo
BEGIN:STANDARD
DTSTART:19700101T000000
TZOFFSETFROM:+0900
TZOFFSETTO:+0900
TZNAME:JST
END:STANDARD
END:VTIMEZONE
BEGIN:VEVENT
UID:908220@techplay.jp
SUMMARY:Algorithmic Learning ＆ Optimization勉強会#1
DTSTART;TZID=Asia/Tokyo:20230624T172000
DTEND;TZID=Asia/Tokyo:20230624T210000
DTSTAMP:20260725T221633Z
CREATED:20230612T141611Z
DESCRIPTION:イベント詳細はこちら\nhttps://techplay.jp/event/90822
 0?utm_medium=referral&utm_source=ics&utm_campaign=ics\n\n概要\nこの
 イベントは意思決定アルゴリズムの学習・最適化（Algo
 rithmic Learning & Optimization)をテーマにしたAI Lab主催 の勉
 強会です。\n第1回目の本勉強会では、AI Labの研究者で
 ある​​蟻生 開人と阿部 拳之、ならびにコーネル大
 学の齋藤 優太さんにご登壇いただきます。\n聴講者に
 は下記キーワードに関連する論文を普段読まれている
 研究者、学生、エンジニア、データサイエンティスト
 の方を想定しておりますが、誰でもご参加いただけま
 す。\nキーワード：組合せ最適化 / 連続最適化 / 情報
 検索 / 推薦システム / 強化学習 / バンディット問題 / 
 マルチエージェント学習 / オンライン学習 / ゲーム理
 論 / etc\n実施方法\nZOOMを使用します。各自インストー
 ルをお願いします。 \nURLは当日6月24日 16時30分に、connp
 assのメッセージ機能で登録者に事前にお送りいたしま
 す。 一つの発表時間は約60分です。\n質疑応答は、sli.d
 o を使用して行います。 使用方法は以下の通りです。\
 n\nconnpassのメッセージ機能でお知らせしたURLにアクセ
 スしてください\n発表者に質問があれば、都度ここに
 書き込んでください（匿名可）。\n質問は他の方も閲
 覧可能です。自分も聞きたいという質問があれば「い
 いね」ができます。\n発表終了後時間が許す限り、発
 表者が「いいね」が多いものから優先して回答してい
 きます。\n\n注意事項\n技術交流が目的の勉強会ですの
 で、知識の共有および、参加者同士の交流を目的とし
 ない参加はお断りしています。 参加目的が不適切だと
 判断される場合には、運営側で参加をキャンセルさせ
 ていただく場合がございます。\nタイムテーブル\n\n\n\n
 時間\n内容\n\n\n\n\n17:20 - 17:30\n挨拶・諸連絡\n\n\n17:30 - 18
 :40\n発表①： Stochastic Block Modelにおけるコミュニティ検
 出: 確率的最適化の観点から\n\n\n18:40 - 19:50\n発表②： L
 earning in games: ゲーム理論とオンライン学習\n\n\n19:50 - 21
 :00\n発表③： 回帰ベースと勾配ベースのアプローチを
 融合した新たなオフ方策学習アルゴリズム\n\n\n\n※ 適
 宜休憩を取ります。当日予告なく時間配分、内容が変
 更になる可能性がございます。\n発表の詳細\nタイトル
 ：Stochastic Block Modelにおけるコミュニティ検出: 確率的
 最適化の観点から\n発表者：蟻生 開人 \nプロフィール
 ： 2021年にサイバーエージェントに入社。多腕バンデ
 ィット問題・コミュニティ検出・確率的最適化、それ
 らの広告配信技術への応用等の研究に従事。東京大学
 学部・修士卒業(航空宇宙工学)。スウェーデン王立工
 科大学 Licentiate of Engineering (Electrical Engineering) 取得・同
 大学博士課程在学。\n発表概要：ラベル付きStochastic Blo
 ck Model（LSBM）におけるコミュニティ検出問題を考える
 。この問題は、アイテムのペアに対して独立に観測さ
 れるラベルを利用して、クラスタを復元することを目
 指すものである。まず、この問題に対して、多腕バン
 ディット問題等で用いられる手法を応用し、どのよう
 なクラスタリングアルゴリズムに対しても成り立つ誤
 判定アイテム数の期待値に関する下限を証明する。次
 に、この下限を基に、Instance-Adaptive Clustering (IAC) アル
 ゴリズムを提案し、その性能保証を行う。このアルゴ
 リズムは、スペクトルクラスタリングの結果を基に、
 情報幾何を考慮しながら尤度ベースのクラスタ割り当
 て改善を行う。IACは、期待値と高確率で下限に一致す
 る性能保証を持つ最初のアルゴリズムである。最後に
 、今後の展開や強化学習における全探索問題との関連
 について説明する。\nタイトル：Learning in games: ゲーム
 理論とオンライン学習\n発表者：阿部 拳之 \nプロフィ
 ール：2017年に東京工業大学大学院総合理工学研究科を
 修了後、株式会社ハル研究所でゲーム開発に携わる。2
 018年にサイバーエージェント入社。AI Labでは強化学習
 、アルゴリズム的ゲーム理論、凸最適化に関する研究
 に従事。Twitter: @bakanaouji\n発表概要： GANやマルチエー
 ジェント強化学習の発展によって、ミニマックス最適
 化問題を中心としたゲームのナッシュ均衡解を効率的
 に近似するアルゴリズムの開発に大きな関心が寄せら
 れています。\nしかし、多くの研究者及び実務家にと
 って有用な話題である一方で、ゲームの均衡学習に関
 する資料や解説は国内において極めて限られています
 。\nそこで本発表では、ゲームにおける均衡学習のた
 めのアルゴリズムとその理論的な性質について解説を
 行います。\n特に、代表的なリグレット最小化アルゴ
 リズムの均衡解への収束性がどのようにして与えられ
 るのか、について説明を行います。\nまた、これらの
 アルゴリズムが抱える問題について解説し、それに対
 処した近年の理論研究の発展について発表者らの研究
 を混じえて紹介します。\n最後に、この分野において
 未解決かつ重要な問題についても解説を行います。\n
 タイトル：回帰ベースと勾配ベースのアプローチを融
 合した新たなオフ方策学習アルゴリズム\n発表者：齋
 藤 優太 \nプロフィール：2021年東京工業大学にて学士
 号取得。同年よりコーネル大学コンピュータサイエン
 ス専攻博士課程にて反実仮想学習や推薦システムの公
 平性に関する研究を行う。NeurIPS・ICML・KDD・RecSys・WSDM
 などの国際会議にて学術論文を発表。また複数の国内
 企業と連携して、反実仮想学習の応用にも従事。2021年
  日本オープンイノベーション大賞内閣総理大臣賞を受
 賞。2022年 Forbes Japan 30 Under 30及び孫正義育英財団第6期
 生に選出。著書に『施策デザインのための機械学習入
 門』（技術評論社）。Twitter: @usait0\n発表概要： オフ方
 策学習は、すでに運用中の方策により収集されたログ
 データのみを用いた新たな意思決定方策の学習を可能
 し、安全で堅実なシステムの改善に役立つ。しかし行
 動数が多くなる場合に、既存の回帰ベースと勾配ベー
 スのアプローチが共に方策をうまく学習できない問題
 がある。これは、推薦・検索システム・組み合わせ介
 入など、行動空間が大きくなりがちな大規模応用にお
 いて特に深刻な未解決問題である。そこで本発表では
 、既存のアプローチを融合した"第三のアプローチ"を
 提案し、大規模問題におけるオフ方策学習の活用を可
 能にする。具体的に提案する"POCEMアルゴリズム"は2段
 階の構造をしており、1段階目の方策は有望な行動クラ
 スタを特定し、2段階目の方策は有望クラスタ内で最良
 のアクションを選択する。特に1段階目の方策を勾配ベ
 ースで、2段階目の方策を回帰ベースでそれぞれ学習す
 ることで、2つのアプローチの利点を活かし個別に抱え
 ていた問題点がうまく解決されることを示す。我々のP
 OCEMアルゴリズムは大規模問題におけるオフ方策評価を
 実現する上で実践上有用であるだけでなく、回帰ベー
 スと勾配ベースのアプローチを融合した初めてのアル
 ゴリズムであり、この第三のアプローチに関する新た
 な研究の方向性を打ち出すものである。
LOCATION:オンライン
URL:https://techplay.jp/event/908220?utm_medium=referral&utm_source=ics&utm
 _campaign=ics
END:VEVENT
END:VCALENDAR