ICASSP2020音響音声読み会(オンライン)
2020/06/19(金)13:00
〜
18:00
開催
ブックマーク
イベント内容
概要
2020年5月開催の国際学術会議 ICASSP2020 の音声&音響に関する論文読み会です。 今年は 平日にバーチャル開催 となります.
URLはこちら https://2020.ieeeicassp.org/
機械学習に関する論文を普段読んでいる研究者、学生、エンジニアの方を想定しておりますが、誰でもご参加いただけます。 終了後にバーチャル懇親会をやるかもしれません.
発表者について
先着で募集いたします。
紹介したい論文に沿って、ジャンル(音声生成・認識・信号処理・音楽)を選択頂きますようお願いします。
ジャンルの配分は調整する場合がございます。
バーチャル会場案内
ZOOMを使用します。各自インストールをお願いします。 URLはこちら.
発表形式
- 質疑込み20分(目安:講演17分、質疑3分)
- 音声、音楽などを再生させる場合は画面共有時に音声も共有するを選択ください。
- セッション後にディスカッション・質疑応答の時間を取っておりますので、そちらでも議論頂けます。
- 講演者は、お手数ですが各セッション終了後までは待機頂く様、よろしくお願いします。
- 質問事項はGoogle documentに記載して頂き、答えて行く形式とします。
- 発表資料に関しては、発表前にSlideShareやSpeaker Deck等にアップロードして頂き、ハッシュタグ #icassp2020jp でつぶやいていただくか、主催者までご連絡をお願い致します。
キャンセル
- 参加は抽選(先着順)になりますが、より多くの方へご参加いただきたいと考えています.
- 大まかな参加人数を把握するために,当日都合が悪くなって参加できないことが判明した方は、お手数ですが速やかにキャンセル処理をお願いします.
その他
- 本勉強会は、技術交流が目的です。知識の共有や参加者同士の交流を目的としない方の参加はお断りします。
- 参加目的が不適切だと判断される場合には、運営側で参加をキャンセルさせていただく場合がございます。
スケジュール
時刻 | 講演者 | タイトル | |
---|---|---|---|
13:00-13:10 | 開会挨拶 | 橘 健太郎 (DeNA) | GoogleDrive |
13:10-13:30 | 音声生成1 | 斎藤 佑樹(東大) | BOFFIN TTS: FEW-SHOT SPEAKER ADAPTATION BY BAYESIAN OPTIMIZATION SlideShare |
13:30-13:50 | 音声生成2 | 藤本 敬介(ABEJA) | F0-Consistent Many-to-Many Non-Parallel Voice Conversion via Conditional Autoencoder SlideShare |
13:50-14:10 | 音声生成3 | 橘 健太郎(DeNA) | MELLOTRON: MULTISPEAKER EXPRESSIVE VOICE SYNTHESIS BY CONDITIONING ON RHYTHM, PITCH AND GLOBAL STYLE TOKENS SlideShare |
14:10-14:15 | ディスカッション・質疑応答 | - | - |
14:15-14:25 | Break | - | - |
14:25-14:45 | 信号処理1 | 寺下 直行 | An Improved Selective Active Noise Control Algorithm Based on Empirical Wavelet Transform GoogleDrive |
14:45-15:05 | 信号処理2 | 玉森 聡(愛知工業大) | State-Space Gaussian Process for Drift Estimation in Stochastic Differential Equations SpeakerDeck |
15:05-15:25 | 信号処理3 | 土肥 宏太(日立製作所) | An Ontology-Aware Framework for Audio Event Classification SpeakerDeck |
15:25-15:30 | ディスカッション・質疑応答 | - | - |
15:30-15:40 | Break | - | - |
15:40-16:00 | 音声認識1 | 鈴木 雅之(IBM research) | Alignment-length synchronous decoding for RNN transducer SpeakerDeck |
16:00-16:20 | 音声認識2 | 柏木 陽佑(Sony) | UNSUPERVISED SPEAKER ADAPTATION USING ATTENTION-BASED SPEAKER MEMORY FOR END-TO-END ASR SlideShare |
16:20-16:40 | 音声認識3 | 上乃 聖 (京大) | CIF: CONTINUOUS INTEGRATE-AND-FIRE FOR END-TO-END SPEECH RECOGNITION SlideShare |
16:40-16:45 | ディスカッション・質疑応答 | - | - |
16:45-16:55 | Break | - | - |
16:55-17:15 | 音楽1 | 植村 あい子 (日本大学) | Transformer VAE: A Hierarchical Model for Structure-Aware and Interpretable Music Representation Learning SlideShare |
17:15-17:35 | 音声生成4 | 岡本 拓磨(NICT) | AlignTTS: Efficient feed-forward text-to-speech system without explicit alignment SpeakerDeck |
17:35-17:40 | ディスカッション・質疑応答 | - | - |
17:40-17:50 | 閉会挨拶 | 高道 慎之介 (東京大学) | GoogleDrive (質疑応答ドキュメント) |
18:00-19:30 | オンライン懇親会 | - | - |
注意事項
※ こちらのイベント情報は、外部サイトから取得した情報を掲載しています。
※ 掲載タイミングや更新頻度によっては、情報提供元ページの内容と差異が発生しますので予めご了承ください。
※ 最新情報の確認や参加申込手続き、イベントに関するお問い合わせ等は情報提供元ページにてお願いします。
※ 掲載タイミングや更新頻度によっては、情報提供元ページの内容と差異が発生しますので予めご了承ください。
※ 最新情報の確認や参加申込手続き、イベントに関するお問い合わせ等は情報提供元ページにてお願いします。
