INTERSPEECH2022音声読み会(オンライン)
2022/10/07(金)18:00
〜
20:00
開催
ブックマーク
イベント内容
概要
2022年9月開催の国際学術会議 INTERSPEECH2022 の音声に関する論文読み会です.機械学習に関する論文を普段読んでいる研究者、学生、エンジニアの方を想定しておりますが、誰でもご参加いただけます.
発表者について
先着で募集いたします.
論文は,音声合成,認識,知覚,パラ言語,対話など音声に関するものとします.ジャンルの配分は調整する場合がございます。
オンライン会場案内
ZOOMを使用します.各自インストールをお願いします.
17:30 open (zoom URL)
質問は Dory にご記入下さい.
(Dory URL)
発表資料は Google slide を編集する形でお願いします.
発表形式
- Lighting talk形式で5分とし、質問時間は合間でまとめて取る予定です。
- セッション後にディスカッション・質疑応答の時間を取っておりますので、そちらでも議論頂けます。
- 講演者は、お手数ですが各セッション終了後までは待機頂く様、よろしくお願いします。
- 質問事項はDoryに記載して頂き、答えて行く形式とします。
- スライドは1枚目に 自己紹介スライド をご用意頂き、内容は2-3枚に納めてください。
キャンセル
- 参加は抽選(先着順)になりますが、より多くの方へご参加いただきたいと考えています。
- 大まかな参加人数を把握するために,当日都合が悪くなって参加できないことが判明した方は、お手数ですが速やかにキャンセル処理をお願いします。
その他
- 本勉強会は、技術交流が目的です。知識の共有や参加者同士の交流を目的としない方の参加はお断りします。
- 参加目的が不適切だと判断される場合には、運営側で参加をキャンセルさせていただく場合がございます。
スケジュール
時刻 | 講演者 | タイトル |
---|---|---|
18:00-18:05 | 開会挨拶 & 諸注意 | 橘 健太郎(LINE) |
18:05-18:10 | 齋藤佑樹(東大) | Towards Automated Dialog Personalization using MBTI Personality Indicators |
18:10-18:15 | 佐久間仁(早稲田大) | Turn-Taking Prediction for Natural Conversational Speech |
18:15-18:20 | 高道慎之介(東大) | Investigating phonetic convergence of laughter in conversation |
18:20-18:25 | 大西弘太郎(電通大) | Daft-Exprt: Cross-Speaker Prosody Transfer on Any Text for Expressive Speech Synthesis |
18:25-18:30 | 小口純矢(明治大) | End-to-end LPCNet: A Neural Vocoder With Fully-Differentiable LPC Estimation |
18:30-18:35 | 園部良介 (DeNA) | Towards Improved Zero-shot Voice Conversion with Conditional DSVAE |
18:35-18:45 | 質疑応答 | |
18:45-18:55 | break time | |
18:55-19:00 | 二見颯 (SONY) | Tree-constrained Pointer Generator with Graph Neural Network Encodings for Contextual Speech Recognition |
19:00-19:05 | ヘンチェル・ミヒャエル (LINE) | Text-Only Domain Adaptation Based on Intermediate CTC |
19:05-19:10 | 高島悠樹(日立) | Updating Only Encoders Prevents Catastrophic Forgetting of End-to-End ASR Models |
19:10-19:15 | 永瀬亮太郎(立命館大) | Improving Speech Emotion Recognition Using Self-Supervised Learning with Domain-Specific Audiovisual Tasks |
19:15-19:20 | 坂東宜昭(産総研) | Weakly-Supervised Neural Full-Rank Spatial Covariance Analysis for a Front-End System of Distant Speech Recognition |
19:20-19:25 | 西城耕平(早稲田大) | Spatial Loss for Unsupervised Multi-channel Source Separation |
19:25-19:35 | 質疑応答 | - |
19:35-19:40 | 閉会挨拶 | 高道 慎之介 (東京大学) |
注意事項
※ こちらのイベント情報は、外部サイトから取得した情報を掲載しています。
※ 掲載タイミングや更新頻度によっては、情報提供元ページの内容と差異が発生しますので予めご了承ください。
※ 最新情報の確認や参加申込手続き、イベントに関するお問い合わせ等は情報提供元ページにてお願いします。
※ 掲載タイミングや更新頻度によっては、情報提供元ページの内容と差異が発生しますので予めご了承ください。
※ 最新情報の確認や参加申込手続き、イベントに関するお問い合わせ等は情報提供元ページにてお願いします。
