ICASSP2024論文読み会(東京&オンライン)
2024/06/19(水)18:00
〜
20:00
開催
ブックマーク
イベント内容
概要
2024年4月開催の国際学術会議 ICASSP2024 に関する論文読み会です.機械学習に関する論文を普段読んでいる研究者、学生、エンジニアの方を想定しておりますが、誰でもご参加いただけます.
発表者について
- 先着で募集いたします.ご自身がICASSP2024で発表された論文の紹介も可能です.
- 論文は,音声合成,認識,知覚,パラ言語,対話,音源分離,音声強調などに関するものとします.ジャンルの配分は調整する場合がございます.
- ICASSP2024 main conference だけでなく,関連ワークショップやコンペティション (e.g., Self-supervision in Audio, Speech and Beyond (SASB))の論文でも可です.
現地会場案内
- 前回(INTERSPEECH2024読み会)と同様に現地(LINEヤフー株式会社 東京オフィス)とオンライン(Zoom)のハイブリッド開催となります.
- 現状の現地参加枠は暫定的に50名としていますが,希望者が多い場合は様子をみつつ枠を増やすかもしれません.
- 会場や受付開始時間の詳細は後日追記いたします.
オンライン会場案内
- ZOOMを使用します.各自インストールをお願いします.
- 17:30 open (zoom URL = TBA)
- 質問は Dory にご記入下さい. (Dory URL)
- 発表資料は Google slide を編集する形でお願いします.
発表形式
- Lighting talk形式で5分とし,質問時間は合間でまとめて取る予定です.
- セッション後にディスカッション・質疑応答の時間を取っておりますので,そちらでも議論頂けます.
- 講演者は,お手数ですが各セッション終了後までは待機頂く様,よろしくお願いします.
- 質問事項はDoryに記載して頂き,答えて行く形式とします.
- 現地参加の方は,会場のマイクで直接ご質問いただいても構いません.
- スライドは1枚目に 自己紹介スライド をご用意頂き,論文紹介の内容は2-3枚程度に納めてください.
キャンセル
- 参加は先着順になりますが,より多くの方へご参加いただきたいと考えています.
- 大まかな参加人数を把握するために,当日都合が悪くなって参加できないことが判明した方は,お手数ですが速やかにキャンセル処理をお願いします.
その他
- 本勉強会は,技術交流が目的です.知識の共有や参加者同士の交流を目的としない方の参加はお断りします.
- 参加目的が不適切だと判断される場合には,運営側で参加をキャンセルさせていただく場合がございます.
- 読み会終了後,現地会場で懇親会(軽食・ドリンクあり)の開催を検討しております(ただし,変更となる可能性がございます).懇親会への参加を希望する方は参加申し込み時のアンケートでその旨をお伝えください.
スケジュール
時刻 | 講演者 | タイトル |
---|---|---|
18:00-18:05 | 橘 健太郎 (LY) | 開会挨拶 & 諸注意 |
18:05-18:10 | 関 健太郎 (東大) | Diversity-based core-set selection for text-to-speech with linguistic and acoustic features |
18:10-18:15 | 高道 慎之介 (慶応大) | Longitudinal Modeling of Depression Shifts Using Speech and Language |
18:15-18:20 | 井上 聖 (CUHK) | Hierarchical Emotion Prediction and Control in Text-to-Speech Synthesis |
18:20-18:30 | 質疑応答 | |
18:30-18:35 | break time | |
18:35-18:40 | 山本 克彦 (CyberAgent) | Speech Foundation Models on Intelligibility Prediction for Hearing-Impaired Listeners |
18:40-18:45 | 二見 颯 (SONY) | Exploring Speech Recognition, Translation, and Understanding with Discrete Speech Units: A Comparative Study |
18:45-18:50 | 神藤 駿介 (東大) | Do self-supervised speech and language models extract similar representations as human brain? |
18:50-19:00 | 質疑応答 | |
19:00-19:05 | break time | |
19:05-19:15 | 中村 泰貴 (東大/Parakeet) | 音声変換総括セッション |
19:15-19:20 | 質疑応答 | |
19:15-19:25 | XX XX (XX) | XXX総括セッション |
19:25-19:30 | 質疑応答 | |
19:30-19:35 | break time | |
19:35-19:40 | 平野 雄太 (NAIST) | ENHANCING SPEAKER DIARIZATION WITH LARGE LANGUAGE MODELS: A CONTEXTUAL BEAM SEARCH APPROACH |
19:40-19:45 | 高城 巽成 (豊橋技科大) | Stateful Conformer with Cache-based Inference for Streaming Automatic Speech Recognition |
19:45-19:50 | 荒川 陸 (CMU) | Quantifying the Effect of Simulator-Based Data Augmentation for Speech Recognition on Augmented Reality Glasses |
19:50-20:00 | 質疑応答 | |
20:00 | 高道 慎之介 (慶応大) | 閉会挨拶 |
注意事項
※ こちらのイベント情報は、外部サイトから取得した情報を掲載しています。
※ 掲載タイミングや更新頻度によっては、情報提供元ページの内容と差異が発生しますので予めご了承ください。
※ 最新情報の確認や参加申込手続き、イベントに関するお問い合わせ等は情報提供元ページにてお願いします。
※ 掲載タイミングや更新頻度によっては、情報提供元ページの内容と差異が発生しますので予めご了承ください。
※ 最新情報の確認や参加申込手続き、イベントに関するお問い合わせ等は情報提供元ページにてお願いします。
情報提供元ページ(connpass)へ
新規会員登録
このイベントに申し込むには会員登録が必要です。
アカウント登録済みの方はログインしてください。
※ ソーシャルアカウントで登録するとログインが簡単に行えます。
※ 連携したソーシャルアカウントは、会員登録完了後にいつでも変更できます。