• <li id="00i08"><input id="00i08"></input></li>
  • <sup id="00i08"><tbody id="00i08"></tbody></sup>
    <abbr id="00i08"></abbr>
  • 新聞中心

    EEPW首頁(yè) > 嵌入式系統(tǒng) > 設(shè)計(jì)應(yīng)用 > DSP嵌入式說話人識(shí)別系統(tǒng)的設(shè)計(jì)與實(shí)現(xiàn)

    DSP嵌入式說話人識(shí)別系統(tǒng)的設(shè)計(jì)與實(shí)現(xiàn)

    作者: 時(shí)間:2009-12-28 來源:網(wǎng)絡(luò) 收藏

    1.6 人身份的結(jié)果顯示
    人的身份顯示通過LED的組合顯示確定。在DSK上有4只LED燈,將每個(gè)LED燈看成是一位二進(jìn)制數(shù)。則4個(gè)LED燈最大可表示16個(gè)人的身份。該取前10個(gè)組合來表示所人的身份。
    1.7 自舉的
    以上程序都是通過PC機(jī)與組合,要想使上單獨(dú)完成,還必須自舉。該采用ROM方式自舉。在自舉實(shí)現(xiàn)過程中,程序的燒寫可以通過CCS自帶的FLASHBorn工具實(shí)現(xiàn)。在燒寫過程中應(yīng)正確的分配FLAH ROM的空間。FLASHROM空間總體分為程序存儲(chǔ)區(qū)和數(shù)據(jù)存儲(chǔ)區(qū),經(jīng)計(jì)算,程序代碼段大小為0x162C0,故在FLASH ROM中劃分127 KB的空間供程序代碼使用,空間中未使用的部分供程序擴(kuò)展使用。數(shù)據(jù)存儲(chǔ)區(qū)劃分的大小為64 KB的空間,每個(gè)說話者模型參數(shù)占用空間為4.2 KB左右,最多可存放15個(gè)說話人GMM模型參數(shù)。該系統(tǒng)訓(xùn)練者數(shù)目為10個(gè),占用空間為42 KB左右。剩余的空間可用來擴(kuò)展訓(xùn)練人數(shù),也可用于后期系統(tǒng)的改進(jìn)。如可以利用語(yǔ)音提示來顯示說話人身份,而提示語(yǔ)音的數(shù)據(jù)可以存放于此區(qū)域。具體的存儲(chǔ)的安排如表1所示。

    本文引用地址:http://www.czjhyjcfj.com/article/152184.htm

    2 系統(tǒng)的算法與軟件
    說話人系統(tǒng)的實(shí)現(xiàn)方案如圖3所示。

    輸入的模擬語(yǔ)音先通過預(yù)處理,包括預(yù)濾波、采樣、量化、加窗、端點(diǎn)檢測(cè)、預(yù)加重等。語(yǔ)音經(jīng)過預(yù)處理后進(jìn)行特征提取。在訓(xùn)練階段,對(duì)提取的特征進(jìn)行相應(yīng)的處理后就可以獲得參考模型。識(shí)別階段,語(yǔ)音通過同樣的通道獲得特征參數(shù),生成測(cè)試摸型,之后將測(cè)試摸型與參考摸型進(jìn)行匹配,從而根據(jù)判決邏輯獲得判決結(jié)果。
    2.1 語(yǔ)音信號(hào)的端點(diǎn)檢測(cè)
    語(yǔ)音信號(hào)的端點(diǎn)檢測(cè)目的是去除語(yǔ)音信號(hào)中的噪聲段。端點(diǎn)檢測(cè)從很大程度上影響到識(shí)別率。常用方法有短時(shí)能量法,短時(shí)過零率法和雙門限法等。本系統(tǒng)選用雙門限法,實(shí)驗(yàn)表明,效果優(yōu)于前兩種方法。在雙門限方法端點(diǎn)檢測(cè)中,閾值的選擇尤為關(guān)鍵,該系統(tǒng)的語(yǔ)音采樣頻率設(shè)為8 kHz,語(yǔ)音分幀為每幀80個(gè)點(diǎn)。經(jīng)過多次實(shí)驗(yàn),這里短時(shí)能量低閾值通過式(3)的動(dòng)態(tài)方式得到,高閾值設(shè)為低閾值的5倍。而過零率的閾值選取應(yīng)充分考慮到噪聲的影響,通過大量實(shí)驗(yàn)發(fā)現(xiàn)系統(tǒng)中噪聲的過零率一般不超過5,所以對(duì)過零率的閾值選取為25,取得了很好的效果,準(zhǔn)確率達(dá)到95%以上。
    ITU=0.03(amp_max-amp_min)+amp_min (3)
    在端點(diǎn)檢測(cè)過程中有時(shí)會(huì)遇到突發(fā)性的干擾噪聲,這種噪聲持續(xù)時(shí)間很短,一般小于5 ms。為了消除這種干擾,這里用檢測(cè)后的起止長(zhǎng)度判斷它是不是語(yǔ)音。如果所檢測(cè)到的語(yǔ)音長(zhǎng)度足夠的短,則可以把它當(dāng)成是噪聲。
    2.2 特征參數(shù)的提取
    語(yǔ)音信號(hào)的特征提取是說話人身份識(shí)別的難點(diǎn)。能否用相對(duì)簡(jiǎn)單的方法提取出一種最能體現(xiàn)說話人個(gè)性信息的特征將成為以后研究的方向。該系統(tǒng)中用的是能體現(xiàn)人耳聽覺特性的Mel倒譜系數(shù)(MFCC)。

    linux操作系統(tǒng)文章專題:linux操作系統(tǒng)詳解(linux不再難懂)


    評(píng)論


    相關(guān)推薦

    技術(shù)專區(qū)

    關(guān)閉
    主站蜘蛛池模板: 韶关市| 桐庐县| 随州市| 棋牌| 鄂托克前旗| 比如县| 文山县| 诸城市| 五原县| 社旗县| 庄浪县| 凤城市| 湟源县| 澄城县| 贵德县| 陇川县| 郸城县| 绥宁县| 休宁县| 奇台县| 西昌市| 怀仁县| 古浪县| 封丘县| 商水县| 改则县| 喀喇沁旗| 堆龙德庆县| 鹤山市| 沙洋县| 镇沅| 淳化县| 临安市| 平安县| 资中县| 南城县| 乌拉特前旗| 平安县| 齐齐哈尔市| 邹平县| 嘉黎县|