ICASSP2020音響音声読み会(オンライン)

2020/06/19(金)13:00 〜 18:00 開催

ブックマーク

#機械学習, #読書会

イベント内容

概要

2020年5月開催の国際学術会議 ICASSP2020 の音声＆音響に関する論文読み会です。今年は 平日にバーチャル開催 となります．

URLはこちら https://2020.ieeeicassp.org/

機械学習に関する論文を普段読んでいる研究者、学生、エンジニアの方を想定しておりますが、誰でもご参加いただけます。終了後にバーチャル懇親会をやるかもしれません．

発表者について

先着で募集いたします。

紹介したい論文に沿って、ジャンル（音声生成・認識・信号処理・音楽）を選択頂きますようお願いします。

ジャンルの配分は調整する場合がございます。

バーチャル会場案内

ZOOMを使用します。各自インストールをお願いします。 URLはこちら．

発表形式

質疑込み20分（目安：講演17分、質疑3分）
音声、音楽などを再生させる場合は画面共有時に音声も共有するを選択ください。
セッション後にディスカッション・質疑応答の時間を取っておりますので、そちらでも議論頂けます。
講演者は、お手数ですが各セッション終了後までは待機頂く様、よろしくお願いします。
質問事項はGoogle documentに記載して頂き、答えて行く形式とします。
発表資料に関しては、発表前にSlideShareやSpeaker Deck等にアップロードして頂き、ハッシュタグ #icassp2020jp でつぶやいていただくか、主催者までご連絡をお願い致します。

キャンセル

参加は抽選(先着順)になりますが、より多くの方へご参加いただきたいと考えています．
大まかな参加人数を把握するために，当日都合が悪くなって参加できないことが判明した方は、お手数ですが速やかにキャンセル処理をお願いします．

その他

本勉強会は、技術交流が目的です。知識の共有や参加者同士の交流を目的としない方の参加はお断りします。
参加目的が不適切だと判断される場合には、運営側で参加をキャンセルさせていただく場合がございます。

スケジュール

時刻		講演者	タイトル
13:00-13:10	開会挨拶	橘健太郎 (DeNA)	GoogleDrive
13:10-13:30	音声生成1	斎藤佑樹（東大）	BOFFIN TTS: FEW-SHOT SPEAKER ADAPTATION BY BAYESIAN OPTIMIZATION SlideShare
13:30-13:50	音声生成2	藤本敬介（ABEJA）	F0-Consistent Many-to-Many Non-Parallel Voice Conversion via Conditional Autoencoder SlideShare
13:50-14:10	音声生成3	橘健太郎（DeNA）	MELLOTRON: MULTISPEAKER EXPRESSIVE VOICE SYNTHESIS BY CONDITIONING ON RHYTHM, PITCH AND GLOBAL STYLE TOKENS SlideShare
14:10-14:15	ディスカッション・質疑応答	-	-
14:15-14:25	Break	-	-
14:25-14:45	信号処理1	寺下直行	An Improved Selective Active Noise Control Algorithm Based on Empirical Wavelet Transform GoogleDrive
14:45-15:05	信号処理2	玉森聡（愛知工業大）	State-Space Gaussian Process for Drift Estimation in Stochastic Differential Equations SpeakerDeck
15:05-15:25	信号処理3	土肥宏太（日立製作所）	An Ontology-Aware Framework for Audio Event Classification SpeakerDeck
15:25-15:30	ディスカッション・質疑応答	-	-
15:30-15:40	Break	-	-
15:40-16:00	音声認識1	鈴木雅之（IBM research）	Alignment-length synchronous decoding for RNN transducer SpeakerDeck
16:00-16:20	音声認識2	柏木陽佑（Sony）	UNSUPERVISED SPEAKER ADAPTATION USING ATTENTION-BASED SPEAKER MEMORY FOR END-TO-END ASR SlideShare
16:20-16:40	音声認識3	上乃聖（京大）	CIF: CONTINUOUS INTEGRATE-AND-FIRE FOR END-TO-END SPEECH RECOGNITION SlideShare
16:40-16:45	ディスカッション・質疑応答	-	-
16:45-16:55	Break	-	-
16:55-17:15	音楽1	植村あい子 (日本大学)	Transformer VAE: A Hierarchical Model for Structure-Aware and Interpretable Music Representation Learning SlideShare
17:15-17:35	音声生成4	岡本拓磨（NICT）	AlignTTS: Efficient feed-forward text-to-speech system without explicit alignment SpeakerDeck
17:35-17:40	ディスカッション・質疑応答	-	-
17:40-17:50	閉会挨拶	高道慎之介 (東京大学)	GoogleDrive (質疑応答ドキュメント)
18:00-19:30	オンライン懇親会	-	-