ICASSP2021音声読み会(オンライン)
イベント内容
概要
2021年6月開催の国際学術会議 ICASSP2021 の音声に関する論文読み会です. 今年は 平日に zoom 開催 となります.
URLはこちら https://2021.ieeeicassp.org/
機械学習に関する論文を普段読んでいる研究者、学生、エンジニアの方を想定しておりますが、誰でもご参加いただけます. 終了後にバーチャル懇親会をやるかもしれません.
発表者について
先着で募集いたします.
紹介したい論文に沿って、ジャンル(音声生成・認識・知覚(パラ言語を含む)・対話)を選択頂きますようお願いします.
ジャンルの配分は調整する場合がございます。
オンライン会場案内
ZOOMを使用します.各自インストールをお願いします。 開始1時間前より開場しておきます。
ZOOM URL: https://u-tokyo-ac-jp.zoom.us/j/82784411905?pwd=TDFBVktZcklKaWVmUFJVaGNUZDRkUT09
発表形式
- Lighting talk形式で5分とし、質問時間は合間でまとめて取る予定です。
- 音声、音楽などを再生させる場合は画面共有時に音声も共有するを選択ください。
- セッション後にディスカッション・質疑応答の時間を取っておりますので、そちらでも議論頂けます。
- 講演者は、お手数ですが各セッション終了後までは待機頂く様、よろしくお願いします。
- 質問事項はDoryに記載して頂き、答えて行く形式とします。
- 発表資料は開催者側が用意したGoogle slideに共同編集する形式で作成していきます。スライドURL
- スライドは2-3枚に納めてください。
Dory URL: https://www.dory.app/c/6e72877e/b8ab9a98_icassp2021-yomi
キャンセル
- 参加は抽選(先着順)になりますが、より多くの方へご参加いただきたいと考えています。
- 大まかな参加人数を把握するために,当日都合が悪くなって参加できないことが判明した方は、お手数ですが速やかにキャンセル処理をお願いします。
その他
- 本勉強会は、技術交流が目的です。知識の共有や参加者同士の交流を目的としない方の参加はお断りします。
- 参加目的が不適切だと判断される場合には、運営側で参加をキャンセルさせていただく場合がございます。
スケジュール
時刻 | 講演者 | タイトル | |
---|---|---|---|
18:00-18:05 | 開会挨拶 & 諸注意 | 橘 健太郎(LINE) | - |
18:05-18:10 | 音声合成 | 斎藤佑樹(東大) | #01 STABLE CHECKPOINT SELECTION AND EVALUATION IN SEQUENCE TO SEQUENCE SPEECH SYNTHESIS |
18:10-18:15 | 音声認識 | 篠原雄介(ヤフー株式会社) | #02 FastEmit: Low-latency streaming ASR with sequence-level emission regularization |
18:20-18:25 | 音響信号処理(音源分離・音声強調) | 最上 伸一(ヤフー株式会社) | #03 Blind and Neural Network-Guided Convolutional Beamformer for Joint Denoising, Dereverberation, and Source Separation |
18:25-18:30 | 音声認識 | 山口僚平(ヤフー株式会社) | #04 Training Speech Recognition Models with Federated Learning: A Quality/Cost Framework |
18:30-18:35 | 音声認識 | 二見 颯(京都大学) | #05 INTERNAL LANGUAGE MODEL TRAINING FOR DOMAIN-ADAPTIVE END-TO-END SPEECH RECOGNITION |
18:35-18:45 | 質疑応答 & ディスカッション | - | - |
18:45-18:50 | break | - | - |
18:50-18:55 | 音声合成 | 白旗悠真(LINE) | #06 CAMP: A TWO-STAGE APPROACH TO MODELLING PROSODY IN CONTEXT |
18:55-19:00 | 環境音分析 | 砺波紀之(立命館) | #07 “LEARNING CONTEXTUAL TAG EMBEDDINGS FOR CROSS-MODAL ALIGNMENT OF AUDIO AND TAGS |
19:00-19:05 | パラ言語情報(音声感情認識) | 永瀬 亮太郎(立命館大学大学院) | #08 CopyPaste: An Augmentation Method for Speech Emotion Recognition |
19:05-19:10 | 音声認識 | 中村泰貴(東大院・情報理工) | #09 MIXSPEECH: DATA AUGMENTATION FOR LOW-RESOURCE AUTOMATIC SPEECH RECOGNITION |
19:10-19:15 | 音声知覚 (パラ言語を含む) | 大澤まゆ子(立命館大学大学院 情報理工学研究科 情報理工学専攻) | #10 Progressive Co-Teaching for Ambiguous Speech Emotion Recognition |
19:15-19:20 | 音楽 | 山本 雄也(筑波大学大学院) | #11 Multimodal Metric Learning for Tag-Based Music Retrieval |
19:20-19:30 | 質疑応答 & ディスカッション | - | - |
19:30-19:35 | 閉会挨拶 | 高道 慎之介 (東京大学) | - |
注意事項
※ 掲載タイミングや更新頻度によっては、情報提供元ページの内容と差異が発生しますので予めご了承ください。
※ 最新情報の確認や参加申込手続き、イベントに関するお問い合わせ等は情報提供元ページにてお願いします。