RM新时代官网

您好,歡迎來到安徽省安全技術(shù)防范行業(yè)協(xié)會(huì)!
0551- 62818875 64280445
網(wǎng)站首頁>政策法規(guī)>行業(yè)資訊
行業(yè)動(dòng)態(tài)

行業(yè)資訊

自動(dòng)識(shí)別判斷說話人特征的聲紋鑒定新技術(shù)

來源:互聯(lián)網(wǎng) 發(fā)布時(shí)間:2010/11/24
 說話人識(shí)別的研究始于20世紀(jì)30年代。隨著研究手段和工具的不斷改進(jìn),說話人識(shí)別的研究逐漸擺脫了早期單純的人耳聽辨模式。Bell實(shí)驗(yàn)室的L?G?Kesta用目視觀察語譜圖的方法進(jìn)行識(shí)別,并提出了“聲紋”的概念。我國的聲紋鑒定技術(shù)起步較晚,上世紀(jì)80年代末,公安部二所(現(xiàn)為公安部物證鑒定中心)引進(jìn)了美國的DSP5500聲譜儀,開展聲紋鑒定的科研和檢案實(shí)踐。1992年公安部物證鑒定中心完成了部級(jí)重點(diǎn)課題《5500語圖儀在聲紋鑒定中應(yīng)用的研究》,2001年,該中心承擔(dān)的國家九五科技攻關(guān)項(xiàng)目《聲紋鑒定關(guān)鍵技術(shù)及話者識(shí)別系統(tǒng)研究》通過驗(yàn)收,研制出具有自主知識(shí)產(chǎn)權(quán)的VS99語音工作站,標(biāo)志著我國聲紋鑒定技術(shù)日趨成熟。
  “聲紋鑒定與自動(dòng)識(shí)別技術(shù)研究”項(xiàng)目由公安部物證鑒定中心等單位完成,其主要研究成果是將聲紋自動(dòng)識(shí)別功能植入VS99語音工作站,該系統(tǒng)能對(duì)說話人特征進(jìn)行自動(dòng)分析、判斷和語圖顯示及測(cè)量,并可結(jié)合專家鑒定以確定說話人身份,適合于法庭科學(xué)實(shí)際應(yīng)用。本項(xiàng)目研制出當(dāng)前聲紋鑒定工作中非常實(shí)用的集聲譜儀和說話人自動(dòng)識(shí)別系統(tǒng)為一體的語音工作站,大大提高了結(jié)論的準(zhǔn)確率,為聲紋鑒定提供了一個(gè)實(shí)用系統(tǒng)。
  創(chuàng)新技術(shù):
  1.抗噪聲處理
  噪聲對(duì)檢驗(yàn)結(jié)果的影響是一個(gè)不可忽視的問題。在本系統(tǒng)中對(duì)于非平穩(wěn)噪聲,研究人員提出了利用偶數(shù)幀段主分量特征輸入隱馬爾可夫模型(HMM)結(jié)合時(shí)間方向平滑處理的SS方法來提高噪聲環(huán)境下漢語連續(xù)語音識(shí)別系統(tǒng)魯棒性的方法,取得較好的識(shí)別結(jié)果。
  2.語音端點(diǎn)檢測(cè)
  端點(diǎn)檢測(cè)可以避免由噪音引起的誤動(dòng)作以及由噪音引起的誤識(shí)別,對(duì)于準(zhǔn)確檢測(cè)語音信號(hào)的起始、提高識(shí)別系統(tǒng)精度等有重要意義。采用傳統(tǒng)的語音端點(diǎn)檢測(cè)器SAD很容易造成語音激活的漏檢。另外,較大的干擾信號(hào),又有可能被當(dāng)成是語音的激活,造成語音激活的虛檢。為克服這一缺點(diǎn),研究人員采用一種基于相關(guān)性的語音激活檢測(cè)器,定義了一種有效的相關(guān)函數(shù),找到了判別門限設(shè)定方法以及防止漏檢和虛檢的方法。
  3.識(shí)別算法
  本系統(tǒng)采用的是基于GMM模型的優(yōu)化算法。
  (1)改進(jìn)的GMM的模型訓(xùn)練方法
  實(shí)驗(yàn)中發(fā)現(xiàn)EM算法存在出現(xiàn)奇異陣的重大缺陷,而最大似然估計(jì)(ML),雖然識(shí)別率比較低,但不會(huì)出現(xiàn)奇異陣。因此研究人員采用最大似然估計(jì)(ML)所得模型為初始模型,然后用EM算法中的每步的模型通過α值控制修正比例對(duì)其進(jìn)行修正,稱為改進(jìn)EM算法。
  (2)基于遺傳算法的GMM的模型優(yōu)化算法
  研究人員對(duì)傳統(tǒng)的遺傳算法進(jìn)行了改進(jìn),用于GMM的參數(shù)優(yōu)化中,大大提高了模型的優(yōu)化程度。
  (3)GMM的說話人識(shí)別方法的優(yōu)化
  研究人員提出了一種新的優(yōu)化的基于GMM的說話人識(shí)別方案,該方案通過先對(duì)一次發(fā)音對(duì)應(yīng)一個(gè)模型的各幀似然度做一種特定變化然后再計(jì)算該音節(jié)總的似然度,也就是該音節(jié)對(duì)應(yīng)該模型的總的評(píng)分,記作Sc,與最大Sc所屬模型相對(duì)應(yīng)的說話人即為目標(biāo)說話人。
  社會(huì)效益:
  目前,公安部物證鑒定中心完成的國家“九五”攻關(guān)成果VS99語音工作站已經(jīng)在國內(nèi)普及,在實(shí)際辦案中發(fā)揮了重要作用。該項(xiàng)目是在VS99的基礎(chǔ)上增加自動(dòng)判別功能,從而進(jìn)一步提高辦案效率和鑒定的準(zhǔn)確率。
  該項(xiàng)目研制的聲紋鑒定自動(dòng)識(shí)別系統(tǒng)具有完全自主知識(shí)產(chǎn)權(quán),實(shí)用性強(qiáng),非常適合公安工作的實(shí)際需要,可在偵查中對(duì)大量嫌疑人進(jìn)行排查,可以有效地提供偵查方向,縮小偵查范圍,提高工作效率。同時(shí)該系統(tǒng)具有語圖實(shí)時(shí)顯示功能,適用于行動(dòng)技術(shù)中語音信號(hào)的采集。自2002年以來,實(shí)際檢驗(yàn)鑒定案件200起,案件類型包括刑事、經(jīng)濟(jì)、民事、治安案件。從結(jié)案反饋及法庭審判結(jié)果看,正判率為100%。
RM新时代官网