INTERSPEECH2024論文読み会(東京&オンライン)
イベント内容
概要
2024年9月開催の国際学術会議 INTERSPEECH2024 に関する論文読み会です.機械学習に関する論文を普段読んでいる研究者、学生、エンジニアの方を想定しておりますが、誰でもご参加いただけます.
発表者について
- 先着で募集いたします.ご自身がINTERSPEECH2024で発表された論文の紹介も可能です.
- 論文は,音声合成,認識,知覚,パラ言語,対話,音源分離,音声強調などに関するものとします.ジャンルの配分は調整する場合がございます.
- INTERSPEECH2024 main conference だけでなく,関連ワークショップやコンペティションの論文でも可です.
現地会場案内
- 前回(ICASSP2024読み会)と同様に現地(株式会社サイバーエージェント AI Lab 渋谷スクランブルスクエア)とオンライン(Zoom)のハイブリッド開催となります.
- 現状の現地参加枠は暫定的に50名としていますが,希望者が多い場合は様子をみつつ枠を増やすかもしれません.→ (10/04 追記) 74名まで増やしました.
- 受付は17:30~18:15までの対応となります。
遅刻する方は必ず村田(@Muramasa_2)までDMやリプライ等で連絡をいただくようよろしくお願いします。 - 会場や受付開始時間の詳細は後日追記いたします.
会場へのアクセス
会場であるサイバーエージェント渋谷スクランブルスクエアオフィスの住所は
〒150-6121 東京都渋谷区渋谷2丁目24番12号
です。
アクセス方法はこちらのページからも確認いただけます。
渋谷駅の各路線から通路や地下よりアクセスが可能です。
渋谷駅から渋谷スクランブルスクエア 17F受付まで
渋谷スクランブルスクエアのオフィス入口はB2Fまたは2Fエレベータからのみとなっております。
商業施設入口とは異なるため, ご注意ください。
エレベータに乗って, 17Fまでお越しください。
-
JR各線, 東京メトロ銀座線, 京王線よりお越しの方
2Fのご利用が便利です。 -
東京メトロ各線, 東急線よりお越しの方
B2Fの利用が便利です。渋谷駅地下出入口番号 B6からお進みください。
17F受付から会場まで
オフィスロビーに机を出して受付を設置しますので、そちらで受付をしゲスト入館カードを受け取ってください。
ゲストカードを使って、一番左側の「19-27」と書かれたゲートをお進みください。
会場は21Fにありますので、21Fまでエレベーターでお上がりください。
21Fにつきましたら、エレベータホールすぐ横にあるセミナールームにお越しください。
退館方法
ご利用になったゲストカードは17Fのセキュリティーゲートにありますゲストカード返却機へ投入してください。
カードが回収されるとともにゲートが開き退館ができます。
オンライン会場案内
- ZOOMを使用します.各自インストールをお願いします.
- 17:30 open (Zoom URL)
- 質問は Dory にご記入下さい. (Dory URL)
- 発表資料は Google slide を編集する形でお願いします.
発表形式
- Lighting talk形式で5分とし,質問時間は合間でまとめて取る予定です.
- セッション後にディスカッション・質疑応答の時間を取っておりますので,そちらでも議論頂けます.
- 講演者は,お手数ですが各セッション終了後までは待機頂く様,よろしくお願いします.
- 質問事項はDoryに記載して頂き,答えて行く形式とします.
- 現地参加の方は,会場のマイクで直接ご質問いただいても構いません.
- スライドは1枚目に 自己紹介スライド をご用意頂き,論文紹介の内容は2-3枚程度に納めてください.
キャンセル
- 参加は先着順になりますが,より多くの方へご参加いただきたいと考えています.
- 大まかな参加人数を把握するために,当日都合が悪くなって参加できないことが判明した方は,お手数ですが速やかにキャンセル処理をお願いします.
その他
- 本勉強会は,技術交流が目的です.知識の共有や参加者同士の交流を目的としない方の参加はお断りします.
- 参加目的が不適切だと判断される場合には,運営側で参加をキャンセルさせていただく場合がございます.
- 読み会終了後,現地会場で懇親会(軽食・ドリンクあり)を開催します.懇親会への参加を希望する方は参加申し込み時のアンケートでその旨をお伝えください.
スケジュール
時刻 | 講演者 (所属) | タイトル |
---|---|---|
18:00-18:05 | 橘 健太郎 (LY) | 開会挨拶 & 諸注意 |
18:05-18:10 | 村田 雅人 (CA) | XTTS: a Massively Multilingual Zero-Shot Text-to-Speech Model |
18:10-18:15 | 高道 慎之介 (慶応大) | GSQA: An End-to-End Model for Generative Spoken Question Answering |
18:15-18:20 | 阪井 瞭介 (慶応大) | An Investigation of Group versus Individual Fairness in Perceptually Fair Speech Emotion Recognition |
18:20-18:30 | 質疑応答 | |
18:30-18:35 | 神藤 駿介 (東大) | Self-Supervised Speech Representations are More Phonetic than Semantic |
18:35-18:40 | 水野 友暁 (電通大) | Toward Fully-End-to-End Listened Speech Decoding from EEG Signals |
18:40-18:45 | 濱田 誉輝 (東大) | Unified Framework for Spoken Language Understanding and Summarization in Task-Based Human Dialog processing |
18:45-18:55 | 質疑応答 | |
18:55-19:00 | break time | |
19:00-19:10 | 中村 泰貴 (東大/Parakeet) | 音声変換総括セッション |
19:10-19:15 | 質疑応答 | |
19:15-19:25 | 中込 優 (LINE WORKS) | 音声認識総括セッション |
19:25-19:30 | 質疑応答 | |
19:30-19:35 | break time | |
19:35-19:40 | 大中 緋慧 (NAIST/理研) | Joint Learning of Context and Feedback Embeddings in Spoken Dialogue |
19:40-19:45 | 栗原 清 (NHK) | Enhancing Japanese Text-to-Speech Accuracy with a Novel Combination Transformer-BERT-based G2P: Integrating Pronunciation Dictionaries and Accent Sandhi |
19:45-19:50 | 郡山 知樹 (CA) | Assessing the impact of contextual framing on subjective TTS quality |
19:50-20:00 | 質疑応答 | |
20:00 | 高道 慎之介 (慶応大) | 閉会挨拶 |
20:00 - 21:30 | 懇親会 | |
21:30 - 22:00 | 片付け | |
22:00 | 撤収 |
注意事項
※ 掲載タイミングや更新頻度によっては、情報提供元ページの内容と差異が発生しますので予めご了承ください。
※ 最新情報の確認や参加申込手続き、イベントに関するお問い合わせ等は情報提供元ページにてお願いします。
新規会員登録
このイベントに申し込むには会員登録が必要です。
アカウント登録済みの方はログインしてください。
※ ソーシャルアカウントで登録するとログインが簡単に行えます。
※ 連携したソーシャルアカウントは、会員登録完了後にいつでも変更できます。