• <li id="00i08"><input id="00i08"></input></li>
  • <sup id="00i08"><tbody id="00i08"></tbody></sup>
    <abbr id="00i08"></abbr>
  • 關 閉

    新聞中心

    EEPW首頁 > 工控自動化 > 設計應用 > 語意識別與智能機器人設計

    語意識別與智能機器人設計

    作者: 時間:2006-02-16 來源:網絡 收藏

    摘要:語音技術在智能方面的應用廣泛。AP7003型IC是一款性能優良和價格低廉的語音電路,文中介紹它的基本電路及其在機中的一些應用友及主意系統的基本原理,為提供了一種思路。

    關鍵詞:AP7003 語音識別 目標詞

    語音識別技術以語言為研究對象,涉及生理學、語言學、計算機及信號處理等多個領域,是語言信號處理的一個重要研究方向,在智能控制、多媒體、人機對話等方面有著極其廣泛的應用前景。

    1 語音識別技術

    語音識別技術首先要提取語音特征參量,也就是從語言信號中提取語音識別的有用信息。語音特征參量的提取要考慮單詞選定位置的基音、鼻輔音的頻譜、元音的頻譜、擦音的頻譜等要素。語音識別技術也必須有模式匹配及模型訓練技術,其中主要包括動態時間規整技術、HMM模型和人工神經網絡。時間規整是把一個單詞內的時變特征變為一致的過程,在時間規整過程中,作為單詞的時間軸要不均勻的扭曲或彎曲,使其行征為模型特征對正,該技術是一種有力的矯正措施,對提高系統的識別精度極為有效。人工神經網絡是一個自適應非線性動力學系統,模擬人體大腦活動的基本原理,具有學習、技藝、判斷、對比和概括等能力。另外,語音識別單元的選取也是語音識別的重要一步,語言識別單元有單詞、音節和音素。對于漢語而言,主要選取音節單元,因為漢語是單音節結構的語言,而英語是多音節的語言,漢語約有400個音節,數量相對較少,便于識別。

    2 AP7003型語音識別電路

    AP7003是一款低成本語音識別專用集成電路,內置麥克風放大器、A/D轉換器、語音處理器和I/O控制器,經預處理后可識別12組不同的字詞,每組1.5s時長,可連詞或單詞識別。可廣泛應用于玩具、識別轉控和自動答錄等領域。

    AP7003的功能框圖如圖1所示。表1給出AP7003的引腳功能。

    表1 AP7003的引腳功能

    引腳名稱功 能
    GNDD數字地
    LED1低電平存放LED驅動腳,能設計成語音輸入指示,適合于標準應用
    DLED2低電平存放LED驅動腳,在標準應用線路中設計成語音輸入驗證結果的標志
    DPOB1-POB4輸出口,作為鍵盤掃描用,標準應用
    DPIT1-PIT4低電平有效輸入口,內部有上拉電阻器,能設計成輸入口或鍵盤的輸入標準應用
    DVDDD數字電源VDD
    DCAPV去耦電容器,電容器必須接在此引腳到地之間,用于內部的電壓基準
    DOSCI頻率振蕩器控制腳,接一個56k電阻器到地
    DPIM1PIM2普通輸入腳,能設計成模式控制輸入,用于標準電路
    DTEST測試引腳,用于生產測試
    DPOSL輸出模式選擇,用于輸出A口,若ProtA是高電平有效,則以POSL接高電平;若低電平有效則接地
    GNDA模擬地
    TREF語音輸入閥電壓控制
    A2OUT輸出第二放大器
    AIIN第一(前級)放大器反相輸入
    A1OUT前級放大輸出
    MICP麥克風的正電源腳
    VDDA模擬電路正電源
    POA-POA12輸出口
    PORES高電平有效輸入,清除輸出口A狀態

    AP7003的主要特征如下:

    內置麥克風放大器

    內置A/D轉換器

    采用DIP40雙列直插式封裝

    能識別12組1.5s時長字詞

    I/O:2個普通輸入,4個觸發輸入,2個輸出口分別有4個、12個輸出,2個LED驅動

    AP7003具有二種工作模式,即錄音模式和識別模式,在進入識別模式之前,應先將目標詞錄入電路內。在AP7003內有12個存貯體用于存貯12組不同的字句,每個存貯體可存貯1.5s時長的字句,可通過鍵盤或按程序編制的順序選擇存貯體來錄入及存放目標詞。語音可通過外部麥克風或其他媒體錄入電路內,經內部處理后以不同的數字特征信號保存在存貯體中。

    圖2

    目標詞錄入電路內后即可將工作模式轉換到識別模式,工作時電路將當前語音與事先錄入存貯體的目標詞語音相比較,如果語音特征相匹配,則在電路的相應輸出端輸出高電平或低電平。

    3 聲控機器人設計

    語音識別電路廣泛應用在智能控制中,把這種電路應用在器人設計中,使機器人初步具有與人對話的能力,且機器人的操作具有普遍性,極大地提高了操作者的興趣,圖2是機器人電路的主要原理框圖。

    圖2中按鍵的定義如表2所示。上電后12個存貯器在錄入目標詞之前必須清空,開始錄入目標詞時使LED1有效,錄入后電路將進入識別模式。

    表2 按鍵的定義

    Key NO.12Key (PIM1=1)
    1Store Word1
    2Store Word2
    3Stroe Word3
    4Store Word4
    5Store Word5
    6Store Word6
    7Sotre Word7
    8Store Word8
    9Set R_Leve1
    10Set Level2
    11Clear Output
    12Shut Down
    PIT4Clesr Word

    如果由麥克風錄入的單詞與存儲器原有單詞相匹配,對應的POA輸出口有效,并驅動斷電器器,電機運動。在本設計中,機器人主要有“前進”(J1)、“后退”(J2)、“左轉”(J3)、“右轉”(J4)、“舉起”(J5)、“放下”(J6)、“停止”等幾種動作。其中,“停止”定義為clearOutput,其他依次定義為POA3、POA4、POA5、POA6、POA7和POA8。以“前進”(J1)和“后退”(J2)為例,如圖3所示。

    當“停止”時,清除POA所有狀態,機器人停止。

    當然,語音識別電路對外部麥克風(MIC)的分貝值有一定的要求,經驗表明在本語音識別電路中選用56dB的麥克風較好。另外,AP7003的工作電壓為2.4~4.5V,如果您的應用系統是5V工作電壓,那么,通過一個二極管給AP7003供電,可以保證系統能長期穩定、可靠的工作,也有利于降低系統功耗。

    4 結束語

    在實際應用的過程中,麥克風的分貝值、Set R_Level匹配度的設置對于語音識別的效果影響較大。如果這二個參數設置合理,該電路可具有較高的識別率,一般可達80%以上,不失為一種效好的語音識別電路。



    評論


    相關推薦

    技術專區

    關閉
    主站蜘蛛池模板: 龙州县| 安康市| 兰西县| 中方县| 桐柏县| 梧州市| 宝应县| 梅河口市| 和硕县| 松江区| 保亭| 水富县| 宁津县| 和林格尔县| 西乌珠穆沁旗| 和平区| 泾源县| 玉山县| 东源县| 五原县| 台东县| 柘荣县| 福海县| 大安市| 西安市| 察隅县| 泾源县| 且末县| 常熟市| 大庆市| 松滋市| 炎陵县| 灵丘县| 法库县| 安西县| 西充县| 门头沟区| 且末县| 玉龙| 同仁县| 顺平县|