英國薩里大學研究生課程Speech and Audio Processing and Recognition能輔導(dǎo)嗎?這門課可能比較冷門,我問了幾家補習機構(gòu)都不能輔導(dǎo),不知道這兒的老師行不行?
英國薩里大學研究生課程Speech and Audio Processing and Recognition(語音和音頻處理和識別)討論了語音處理和識別的基本概念、信號處理方法和人機交互應(yīng)用,包括聽覺感知和心理聲學。學生將學習如何從語音信號中提取顯著特征,如何設(shè)計口語模型,如何進行識別和訓練,并了解當前自發(fā)語音識別的研究,如說話人的適應(yīng)和噪聲的魯棒性解決方案。
Speech and Audio Processing and Recognition課程主要內(nèi)容如下:
語音和音頻處理
1、介紹:語音和語言。數(shù)字語音處理。語音處理應(yīng)用。語音信號的特征。
2、語音生成:聲道描述。源過濾器模型。物理模型中周期性、共振峰和反共振的起源。聲道全極數(shù)字模型。物理模型和音素之間的關(guān)系。
3、語音感知:耳朵的結(jié)構(gòu)。耳朵的頻率和幅度響應(yīng)。感知單位。
4-5、信號處理技術(shù):語音信號的自相關(guān)。從語音信號中估計音調(diào)。語音信號的傅里葉分析。頻譜圖和功率譜密度。濁音和清音語音的頻譜分析。共振峰和反共振的頻譜分析。語音的和聲結(jié)構(gòu)。
6-7、線性預(yù)測:Z變換。聲道傳遞函數(shù)。傳遞函數(shù)的穩(wěn)定性。線性預(yù)測的概念和模型。全極點源濾波器。順序選擇及其與預(yù)測誤差的關(guān)系。LPC系數(shù)估計。根據(jù)LPC系數(shù)進行語音合成。
8、語音信號的逆濾波:將源與激發(fā)分開。聲道響應(yīng)——格式估計。從殘差估計音高。穩(wěn)健的線性預(yù)測。
9-10、Cepstral Deconvolution:真實倒譜的定義。通過非線性操作將卷積轉(zhuǎn)換為求和。復(fù)數(shù)對數(shù)。復(fù)倒譜。quefrency單位。通過倒譜估計音高。頻譜包絡(luò)與線性預(yù)測得出的頻譜包絡(luò)的比較。
11-12、音頻記錄和聲學:麥克風類型和方向性模式、數(shù)字音頻采集、波傳播和聲學、反射和混響效果。
13-15、心理聲學:響度感知、音調(diào)感知、聽覺掩蔽、音色感知、空間聽覺。
自動語音識別
16-17、介紹:人類語音通信。ASR在人機交互中的作用。語音和語音感知的基礎(chǔ)。
18-19、特征提?。郝晭晫W和線性預(yù)測。梅爾頻率倒譜。差異特征。
20、模板匹配:動態(tài)時間扭曲。孤立詞和連接詞識別。搜索修剪。
21-22、隱馬爾可夫模型:馬爾可夫模型和狀態(tài)拓撲。HMM公式。離散和連續(xù)輸出pdf。
23-24、識別和維特比解碼:網(wǎng)格圖。前向和后向概率。累積可能性和追溯。
25-26、通過期望最大化:Baum-Welch訓練的機器學習:推導(dǎo)和實施。
27-28、大詞匯量連續(xù)語音識別:語言建模和折扣。上下文敏感性和參數(shù)綁定。
29-30、適應(yīng)和魯棒性:說話人適應(yīng)(MLLR和MAP方法)。噪聲魯棒性(頻譜減法和并行模型組合)。
Speech and Audio Processing and Recognition課程涉及到了很多知識要點,同學如果想深入了解課程內(nèi)容的話,可以與考而思英國課程輔導(dǎo)老師聯(lián)系喲~