2024/10/17(木)18:00 〜 20:00

INTERSPEECH2024論文読み会(東京&オンライン)

ワークショップ, 機械学習, セキュリティ

イベント内容

概要

2024年9月開催の国際学術会議 INTERSPEECH2024 に関する論文読み会です．機械学習に関する論文を普段読んでいる研究者、学生、エンジニアの方を想定しておりますが、誰でもご参加いただけます．

発表者について

先着で募集いたします．ご自身がINTERSPEECH2024で発表された論文の紹介も可能です．
論文は，音声合成，認識，知覚，パラ言語，対話，音源分離，音声強調などに関するものとします．ジャンルの配分は調整する場合がございます．
INTERSPEECH2024 main conference だけでなく，関連ワークショップやコンペティションの論文でも可です．

現地会場案内

前回（ICASSP2024読み会）と同様に現地（株式会社サイバーエージェント AI Lab 渋谷スクランブルスクエア）とオンライン(Zoom)のハイブリッド開催となります．
現状の現地参加枠は暫定的に50名としていますが，希望者が多い場合は様子をみつつ枠を増やすかもしれません．→ (10/04 追記) 74名まで増やしました．
受付は17:30~18:15までの対応となります。
遅刻する方は必ず村田(@Muramasa_2)までDMやリプライ等で連絡をいただくようよろしくお願いします。
会場や受付開始時間の詳細は後日追記いたします．

会場へのアクセス

会場であるサイバーエージェント渋谷スクランブルスクエアオフィスの住所は
〒150-6121　東京都渋谷区渋谷2丁目24番12号
です。

アクセス方法はこちらのページからも確認いただけます。

渋谷駅の各路線から通路や地下よりアクセスが可能です。

渋谷駅から渋谷スクランブルスクエア 17F受付まで

渋谷スクランブルスクエアのオフィス入口はB2Fまたは2Fエレベータからのみとなっております。
商業施設入口とは異なるため, ご注意ください。
エレベータに乗って, 17Fまでお越しください。

JR各線, 東京メトロ銀座線, 京王線よりお越しの方
2Fのご利用が便利です。
東京メトロ各線, 東急線よりお越しの方
B2Fの利用が便利です。渋谷駅地下出入口番号 B6からお進みください。

17F受付から会場まで

オフィスロビーに机を出して受付を設置しますので、そちらで受付をしゲスト入館カードを受け取ってください。
ゲストカードを使って、一番左側の「19-27」と書かれたゲートをお進みください。
会場は21Fにありますので、21Fまでエレベーターでお上がりください。
21Fにつきましたら、エレベータホールすぐ横にあるセミナールームにお越しください。

退館方法

ご利用になったゲストカードは17Fのセキュリティーゲートにありますゲストカード返却機へ投入してください。
カードが回収されるとともにゲートが開き退館ができます。

オンライン会場案内

ZOOMを使用します．各自インストールをお願いします．
17:30 open （Zoom URL）
質問は Dory にご記入下さい． （Dory URL）
発表資料は Google slide を編集する形でお願いします．

発表形式

Lighting talk形式で5分とし，質問時間は合間でまとめて取る予定です．
セッション後にディスカッション・質疑応答の時間を取っておりますので，そちらでも議論頂けます．
講演者は，お手数ですが各セッション終了後までは待機頂く様，よろしくお願いします．
質問事項はDoryに記載して頂き，答えて行く形式とします．
現地参加の方は，会場のマイクで直接ご質問いただいても構いません．
スライドは1枚目に 自己紹介スライド をご用意頂き，論文紹介の内容は2-3枚程度に納めてください．

キャンセル

参加は先着順になりますが，より多くの方へご参加いただきたいと考えています．
大まかな参加人数を把握するために，当日都合が悪くなって参加できないことが判明した方は，お手数ですが速やかにキャンセル処理をお願いします．

その他

本勉強会は，技術交流が目的です．知識の共有や参加者同士の交流を目的としない方の参加はお断りします．
参加目的が不適切だと判断される場合には，運営側で参加をキャンセルさせていただく場合がございます．
読み会終了後，現地会場で懇親会（軽食・ドリンクあり）を開催します．懇親会への参加を希望する方は参加申し込み時のアンケートでその旨をお伝えください．

スケジュール

時刻	講演者 (所属)	タイトル
18:00-18:05	橘健太郎 (LY)	開会挨拶 & 諸注意
18:05-18:10	村田雅人 (CA)	XTTS: a Massively Multilingual Zero-Shot Text-to-Speech Model
18:10-18:15	高道慎之介 (慶応大)	GSQA: An End-to-End Model for Generative Spoken Question Answering
18:15-18:20	阪井瞭介 (慶応大)	An Investigation of Group versus Individual Fairness in Perceptually Fair Speech Emotion Recognition
18:20-18:30		質疑応答
18:30-18:35	神藤駿介 (東大)	Self-Supervised Speech Representations are More Phonetic than Semantic
18:35-18:40	水野友暁 (電通大)	Toward Fully-End-to-End Listened Speech Decoding from EEG Signals
18:40-18:45	濱田誉輝 (東大)	Unified Framework for Spoken Language Understanding and Summarization in Task-Based Human Dialog processing
18:45-18:55		質疑応答
18:55-19:00		break time
19:00-19:10	中村泰貴 (東大/Parakeet)	音声変換総括セッション
19:10-19:15		質疑応答
19:15-19:25	中込優 (LINE WORKS)	音声認識総括セッション
19:25-19:30		質疑応答
19:30-19:35		break time
19:35-19:40	大中緋慧 (NAIST/理研)	Joint Learning of Context and Feedback Embeddings in Spoken Dialogue
19:40-19:45	栗原清 (NHK)	Enhancing Japanese Text-to-Speech Accuracy with a Novel Combination Transformer-BERT-based G2P: Integrating Pronunciation Dictionaries and Accent Sandhi
19:45-19:50	郡山知樹 (CA)	Assessing the impact of contextual framing on subjective TTS quality
19:50-20:00		質疑応答
20:00	高道慎之介 (慶応大）	閉会挨拶
20:00 - 21:30	懇親会
21:30 - 22:00	片付け
22:00	撤収