一種基于近鄰原則合成情感模型的說話人識別方法
本發(fā)明公開了一種基于近鄰原則合成情感模型的說話人識別方法,包括:(1)訓練出參考語音和用戶中性語音的模型;(2)提取GMM參考模型的中性-情感高斯分量映射集;(3)提取與用戶的中性訓練高斯分量鄰近的若干中性參考高斯分量映射的情感參考高斯分量;(4)合成出用戶的情感訓練高斯分量,進而得到用戶的情感訓練模型;(5)合成出所有用戶的GMM訓練模型;(6)輸入測試語音進行識別。本發(fā)明采用基于KL散度的近鄰原則從語音庫中提取若干與用戶的中性訓練語音相似的參考語音,用參考語音中的情感參考語音合成出用戶的情感訓練語音,改善了在訓練語音與測試語音失配情況下說話人識別系統(tǒng)的性能,提高了說話人識別系統(tǒng)的魯棒性。
浙江大學
2021-04-13