基于ATMEGAl28的語音識別系統設計

作者：時間：2013-09-13 來源：網絡

加入技術交流群
- 掃碼加入
  和技術大咖面對面交流
  海量資料庫查詢

0 引言

傳統的人機交互依靠復雜的鍵盤或按鈕來實現，隨著科技的發展，一些新型的人機交互方式也隨之誕生，帶給人們全新的體驗。基于語音識別的人機交互方式是目前熱門的技術之一。但是語音識別功能算法復雜、計算量大，一般在計算機上實現，即使是嵌入式方面，多數方案也需要運算能力強的ARM或DSP，并且外擴RAM、FLASH等資源，增加了硬件成本，這些特點無疑限制了語音識別技術的應用，尤其是嵌入式領域。
本系統采用的主控MCU為Atmel公司的ATMEGA128，語音識別功能則采用ICRoute公司的單芯片LD3320。LD3320內部集成優化過的語音識別算法，無需外部FLASH，RAM資源，可以很好地完成非特定人的語音識別任務。

1 整體方案設計

1．1 語音識別原理

在計算機系統中，語音信號本身的不確定性、動態性和連續性是語音識別的難點。主流的語音識別技術是基于統計模式識別的基本理論，原理如圖1所示。

語音識別通常需要兩個階段完成。第一階段是訓練，主要是提取語音特征，用戶往往需要進行幾次語音訓練，經過預處理和特征提取后獲得相應特征參數。第二階段是識別，識別過程就是將輸入的語音特征參數和模型庫中的參數進行相似性比較，最后輸出匹配度最高的特征參數完成識別過程。

2 硬件電路設計

硬件框架如圖2所示，電路主要由主控制器電路和語音識別電路組成。ATMEGA128控制LD3320語音識別電路，輸出結果由ATMEGA128處理，然后通過總線來控制不同的設備。

2．1 控制器電路

控制器選用Atmel公司生產的ATMEGA128芯片，采用先進的RISC結構，內置128 KB FLASH，4 KB SRAM，4 KB E2PROM等豐富資源。該芯片是業界高性能、低功耗的8位微處理器，并在8位單片機市場有著廣泛應用。

2．2 LD3320語音識別電路

LD3320芯片是一款“語音識別”專用芯片。該芯片集成了語音識別處理器和一些外部電路，包括A／D、D／A轉換器、麥克風接口、聲音輸出接口等，而且可以播放MP3。不需要外接任何的輔助芯片如FLASH，RAM等，直接集成到產品中即可以實現語音識別、聲控、人機對話功能。

圖3為LD3320電路原理圖，與MCU通信采用SPI總線方式，時鐘不能超過1．5MHz。

麥克風工作電路如圖4所示，音頻輸出只需將揚聲器連接到SPOP和SPON即可。使用SPI總線方式時，LD3320的MD要設為高電平，SPIS設為低電平。SPI總線的引腳有SDI，SDO，SDCK以及SCS。INTB為中斷端口，當有識別結果或MP3數據不足時，會觸發中斷，通知MCU處理。RSTB引腳是LD3320復位端，低電平有效。LED1，LED2作為上電指示燈。

新聞中心

基于ATMEGAl28的語音識別系統設計

評論

相關推薦

技術專區