# An introduction to Spoken language processing (SLP) # 2021/03/15 ###### tags: `Speech peko` > 講者:Dr. Liao I-Bin 廖宜斌 教授 (NCTU) > ibin.liao@gmail.com ## Outline - intro - 專題說明 ## 語音處理 > 語音是兩個層次的意義 [name=講者] - Processing of double-Level information - 講什麼 - 誰在講(年齡/性別) - 情緒狀態 - 怎麼講(節奏韻律) - 語意 ## AI人格塑造 - 使用者喜歡 AI 有自己的個性 - Siri: 仿人性,幽默與圓融的拉扯 - Alexa: 塑造精靈般的存在,有許多個人偏好,喜歡的書籍、電影等 - Google: 博學多聞,如同行動圖書館 ## Ababa da da bababa - dada bababa - ba ba... da ba ba da da {%youtube _JmA2ClUvUY%} - :heavy_check_mark: A -- Aaaaaa! <img width="400" src="https://i.imgur.com/mgjM4MI.jpg"> > brain power~ let the bass kick gooooooooo aaeeee aaaa joooooooo Ae oaaaao ooooooooooo oe oa oo jooooooooooo ## Prosody > 在對談時,抑揚頓挫是很重要的一環 ### Prosody and Syntax > 不同的人,音色與音調會不一樣 ## Analysis on Speech Signal ## Spectrogram ### Speaker Recognition 發展歷程 > 講了一堆名詞,也沒有解釋 - 高斯混合模型(GMM) - (Gaussian Mixture Model-Universal Background Model) - i-vector, - super cextor - channel subspace - speaker subspace - 深度神經網路 - time delay neural network + data augmentation x-vector - x-vector, L-vector, (Long-????) <!--...我聽完還是沒有很清楚他要報告啥--> <!-- 窩不知道 --> <!--????????? --> https://paperswithcode.com/ 剛剛那個網站 on windows, use `ctrl+shift+back_space` to delete whole line on windows, use `ctrl+back_space` to delete one word on mac, use `cmd+back_space` to delete whole line on mac, use `option+back_space` to delete one word ### VoxCeleb - a large-scale speaker identidication dataset ??????????? wat 俚語小知識 wat: The only proper response to something that makes absolutely no sense. 結束了!? What??? <!-- Wow 完蛋 我們小組選這個 下去 --> 我只有聽懂:bla bla bla da~ da ba? baba!! da ba ba! <!-- 我喜歡這影片XD -->