ICASSP2020音響音声読み会(オンライン)

2020/06/19(金)13:00 〜 18:00 開催
ブックマーク

イベント内容

概要

2020年5月開催の国際学術会議 ICASSP2020 の音声&音響に関する論文読み会です。 今年は 平日にバーチャル開催 となります.

URLはこちら https://2020.ieeeicassp.org/

機械学習に関する論文を普段読んでいる研究者、学生、エンジニアの方を想定しておりますが、誰でもご参加いただけます。 終了後にバーチャル懇親会をやるかもしれません.

発表者について

先着で募集いたします。

紹介したい論文に沿って、ジャンル(音声生成・認識・信号処理・音楽)を選択頂きますようお願いします。

ジャンルの配分は調整する場合がございます。

バーチャル会場案内

ZOOMを使用します。各自インストールをお願いします。 URLはこちら

発表形式

  • 質疑込み20分(目安:講演17分、質疑3分)
  • 音声、音楽などを再生させる場合は画面共有時に音声も共有するを選択ください。
  • セッション後にディスカッション・質疑応答の時間を取っておりますので、そちらでも議論頂けます。
  • 講演者は、お手数ですが各セッション終了後までは待機頂く様、よろしくお願いします。
  • 質問事項はGoogle documentに記載して頂き、答えて行く形式とします。
  • 発表資料に関しては、発表前にSlideShareやSpeaker Deck等にアップロードして頂き、ハッシュタグ #icassp2020jp でつぶやいていただくか、主催者までご連絡をお願い致します。

キャンセル

  • 参加は抽選(先着順)になりますが、より多くの方へご参加いただきたいと考えています.
  • 大まかな参加人数を把握するために,当日都合が悪くなって参加できないことが判明した方は、お手数ですが速やかにキャンセル処理をお願いします.

その他

  • 本勉強会は、技術交流が目的です。知識の共有や参加者同士の交流を目的としない方の参加はお断りします。
  • 参加目的が不適切だと判断される場合には、運営側で参加をキャンセルさせていただく場合がございます。

スケジュール

時刻 講演者 タイトル
13:00-13:10 開会挨拶 橘 健太郎 (DeNA) GoogleDrive
13:10-13:30 音声生成1 斎藤 佑樹(東大) BOFFIN TTS: FEW-SHOT SPEAKER ADAPTATION BY BAYESIAN OPTIMIZATION SlideShare
13:30-13:50 音声生成2 藤本 敬介(ABEJA) F0-Consistent Many-to-Many Non-Parallel Voice Conversion via Conditional Autoencoder SlideShare
13:50-14:10 音声生成3 橘 健太郎(DeNA) MELLOTRON: MULTISPEAKER EXPRESSIVE VOICE SYNTHESIS BY CONDITIONING ON RHYTHM, PITCH AND GLOBAL STYLE TOKENS SlideShare
14:10-14:15 ディスカッション・質疑応答 - -
14:15-14:25 Break - -
14:25-14:45 信号処理1 寺下 直行 An Improved Selective Active Noise Control Algorithm Based on Empirical Wavelet Transform GoogleDrive
14:45-15:05 信号処理2 玉森 聡(愛知工業大) State-Space Gaussian Process for Drift Estimation in Stochastic Differential Equations SpeakerDeck
15:05-15:25 信号処理3 土肥 宏太(日立製作所) An Ontology-Aware Framework for Audio Event Classification SpeakerDeck
15:25-15:30 ディスカッション・質疑応答 - -
15:30-15:40 Break - -
15:40-16:00 音声認識1 鈴木 雅之(IBM research) Alignment-length synchronous decoding for RNN transducer SpeakerDeck
16:00-16:20 音声認識2 柏木 陽佑(Sony) UNSUPERVISED SPEAKER ADAPTATION USING ATTENTION-BASED SPEAKER MEMORY FOR END-TO-END ASR SlideShare
16:20-16:40 音声認識3 上乃 聖 (京大) CIF: CONTINUOUS INTEGRATE-AND-FIRE FOR END-TO-END SPEECH RECOGNITION SlideShare
16:40-16:45 ディスカッション・質疑応答 - -
16:45-16:55 Break - -
16:55-17:15 音楽1 植村 あい子 (日本大学) Transformer VAE: A Hierarchical Model for Structure-Aware and Interpretable Music Representation Learning SlideShare
17:15-17:35 音声生成4 岡本 拓磨(NICT) AlignTTS: Efficient feed-forward text-to-speech system without explicit alignment SpeakerDeck
17:35-17:40 ディスカッション・質疑応答 - -
17:40-17:50 閉会挨拶 高道 慎之介 (東京大学) GoogleDrive (質疑応答ドキュメント)
18:00-19:30 オンライン懇親会 - -

注意事項

※ こちらのイベント情報は、外部サイトから取得した情報を掲載しています。
※ 掲載タイミングや更新頻度によっては、情報提供元ページの内容と差異が発生しますので予めご了承ください。
※ 最新情報の確認や参加申込手続き、イベントに関するお問い合わせ等は情報提供元ページにてお願いします。

関連するイベント