INTERSPEECH2022音声読み会(オンライン)

2022/10/07(金)18:00 〜 20:00 開催

ブックマーク

#機械学習

イベント内容

概要

2022年9月開催の国際学術会議 INTERSPEECH2022 の音声に関する論文読み会です．機械学習に関する論文を普段読んでいる研究者、学生、エンジニアの方を想定しておりますが、誰でもご参加いただけます．

発表者について

先着で募集いたします．

論文は，音声合成，認識，知覚，パラ言語，対話など音声に関するものとします．ジャンルの配分は調整する場合がございます。

オンライン会場案内

ZOOMを使用します．各自インストールをお願いします．

17:30 open （zoom URL）

質問は Dory にご記入下さい．

（Dory URL）

発表資料は Google slide を編集する形でお願いします．

発表形式

Lighting talk形式で5分とし、質問時間は合間でまとめて取る予定です。
セッション後にディスカッション・質疑応答の時間を取っておりますので、そちらでも議論頂けます。
講演者は、お手数ですが各セッション終了後までは待機頂く様、よろしくお願いします。
質問事項はDoryに記載して頂き、答えて行く形式とします。
スライドは1枚目に 自己紹介スライド をご用意頂き、内容は2-3枚に納めてください。

キャンセル

参加は抽選(先着順)になりますが、より多くの方へご参加いただきたいと考えています。
大まかな参加人数を把握するために，当日都合が悪くなって参加できないことが判明した方は、お手数ですが速やかにキャンセル処理をお願いします。

その他

本勉強会は、技術交流が目的です。知識の共有や参加者同士の交流を目的としない方の参加はお断りします。
参加目的が不適切だと判断される場合には、運営側で参加をキャンセルさせていただく場合がございます。

スケジュール

時刻	講演者	タイトル
18:00-18:05	開会挨拶 & 諸注意	橘健太郎（LINE）
18:05-18:10	齋藤佑樹（東大）	Towards Automated Dialog Personalization using MBTI Personality Indicators
18:10-18:15	佐久間仁（早稲田大）	Turn-Taking Prediction for Natural Conversational Speech
18:15-18:20	高道慎之介（東大）	Investigating phonetic convergence of laughter in conversation
18:20-18:25	大西弘太郎（電通大）	Daft-Exprt: Cross-Speaker Prosody Transfer on Any Text for Expressive Speech Synthesis
18:25-18:30	小口純矢（明治大）	End-to-end LPCNet: A Neural Vocoder With Fully-Differentiable LPC Estimation
18:30-18:35	園部良介 (DeNA)	Towards Improved Zero-shot Voice Conversion with Conditional DSVAE
18:35-18:45	質疑応答
18:45-18:55	break time
18:55-19:00	二見颯 (SONY)	Tree-constrained Pointer Generator with Graph Neural Network Encodings for Contextual Speech Recognition
19:00-19:05	ヘンチェル・ミヒャエル (LINE)	Text-Only Domain Adaptation Based on Intermediate CTC
19:05-19:10	高島悠樹（日立）	Updating Only Encoders Prevents Catastrophic Forgetting of End-to-End ASR Models
19:10-19:15	永瀬亮太郎（立命館大）	Improving Speech Emotion Recognition Using Self-Supervised Learning with Domain-Specific Audiovisual Tasks
19:15-19:20	坂東宜昭（産総研）	Weakly-Supervised Neural Full-Rank Spatial Covariance Analysis for a Front-End System of Distant Speech Recognition
19:20-19:25	西城耕平（早稲田大）	Spatial Loss for Unsupervised Multi-channel Source Separation
19:25-19:35	質疑応答	-
19:35-19:40	閉会挨拶	高道慎之介 (東京大学)