設爲主頁  加入收藏
 
·I2S數字功放IC/内置DSP音頻算法功放芯片  ·馬達驅動IC  ·2.1聲道單芯片D類功放IC  ·内置DC/DC升壓模塊的D類功放IC  ·锂電充電管理IC/快充IC  ·無線遙控方案  ·直流無刷電機驅動芯片
當前位置:首頁->技術分享
電子設備中的語音和音頻控制進展
文章來源:永阜康科技 更新時間:2026/2/28 9:59:00
在線咨詢:
給我發消息
張代明 3003290139
給我發消息
姚紅霞 3002514837
給我發消息
鄢先輝 2850985542
13713728695
 

作者:貿澤電子Mark Patrick

言語是人們表達思想和願望的一種有效方式。在工業時代到來之前,人類發現動物可以被訓練用來識别和響應讓它們執行某些任務的基本命令。

下一個合乎邏輯的發展應該是開發一種使用聲音信号與機器進行交流,並指揮機器行動的方法。近年來,以語音和音頻作爲電子設備的控制界面越來越受歡迎,並且這種技術也在不斷發展,以滿足用戶的期望和新應用的要求。

在本文中,我們将解釋用語音和音頻信号控制電子設備和機器的好處,並回顧如何實現這種控制。我們還将展示這種控制界面現在可以如何能夠嵌入到離線設備,以及它們提供的音頻控制體驗如何能夠大幅度改善。

使用語音控制電子設備

採用語音控制實現與機器交互有幾個明顯好處:

• 對人類來說,語音是一種直觀的交流形式,這種口頭傳達指令的方式更容易。

• 即使一個人的眼睛和手正在用於其它事情,語音交流仍然可能。實時的語音控制也很方便,例如在駕車等某些應用場景下,試圖通過觸摸來控制車内其它設備是違法的。

• 語音是控制機器的一種有效媒介,採用語音控制機器,可以在不需要複雜指令的情況下進行監聽和響應。

• 在設備中集成語音控制能夠最大限度地減少許多設備對觸屏的需求。這對於處於遠程或便攜式電池供電設備來說尤其理想,在這些設備中,減小尺寸和降低功耗是常見的設計挑戰。對於具有多個用戶的應用來說,去掉觸屏控制也更加符合衛生要求。

• 如圖1所示,對於某些殘疾人來說,觸屏控制可能是一種不現實的選擇,因而語音可以成爲一種有效的支持工具。通過語音與機器進行交互可用於執行諸如開門之類的任務,或者通過遠程通信來傳輸個人最近的健康狀況。


圖1:聲控機器人助手。(來源:Shutterstock的PaO_STUDIO)

語音控制設備的音頻前端(AFE)包括麥克風陣列和信号處理模塊。AFE能夠處理來自多通道麥克風陣列的信号,以消除任何背景噪聲或設備本身回放産生的幹擾。然後,該信号被發送到“喚醒詞(wake-word)”檢測引擎,例如經過在設備上預先編程,可識别出“Alexa”或“OK Google”等單詞。通過使用多種信号處理算法,能夠消除多種不需要的幹擾信号。語音控制解決方案的組成部分包括:

麥克風陣列:語音激活系統需要一個或多個麥克風來捕獲音頻控制信号。在選擇麥克風陣列時,重要的考慮因素包括尺寸、成本、性能和穩健性。優化組合來自多麥克風陣列的不同信号有助於提高音頻信号鏈的信噪比(SNR)。

到達方向(DoA)檢測器:用於確定用戶相對於被控設備的位置,以便麥克風陣列可以将波束調整爲語音的方向。

波束成形器:它接受來自DoA檢測器的聲音,同時去除來自其他方向的聲音。其性能取決於麥克風陣列的幾何形狀、SNR以及波束寬度和背景噪聲水平等。

聲學回聲消除器(AEC):它會消除設備揚聲器本身的播放信号(例如,設備揚聲器正在播放音樂時收到語音指令),以便清晰地拾取用戶語音指令。

自适應幹擾消除器(AIC):它能夠消除來自其他聲音源的外部噪聲,這些噪聲很難用傳統的波束成形器消除,例如,其他設備産生的較大噪聲。

喚醒詞檢測器:将來自AFE的經過處理語音信号與喚醒詞庫進行比較,例如可使用喚醒詞檢測算法的“Hey Google”,這種算法通常是機器學習模型的一部分。更大的模型則更準確,例如,1MB訓練模型比64kB模型更準確,但處理強度更大。需要大的喚醒詞模型來準確地檢測喚醒詞,從而減少錯誤警報的數量。

D類音頻放大器

該控制界面的語音處理部分經過大量開發,現在即使是低成本的設備也能提供準確的語音識别能力。然而,界面的音頻端受到的關注明顯較少,這意味著與高端音頻設備相比,許多早期智能揚聲器和其他支持音頻的物聯網(IoT)設備所産生的音質較差。

與語音控制相關的任何新産品都可能被認爲分散瞭人們對這些缺點的關注。然而,随著智能設備越來越廣泛採用,消費者對其提供的音頻體驗期望也越來越高。傳統AB類音頻放大器的低效率使其無法用於低功率物聯網設備,幸運的是,幾家芯片制造商最近推出瞭一系列高級D類音頻放大器,體現瞭對以前可用音頻放大器的重大改進,其中許多産品都是專門爲在智能技術和物聯網設備中實現高品質音頻而開發。

德州儀器 (Texas Instruments)的TAS277015W輸入音頻放大器能夠提高響度和音頻質量,它具有更強的語音捕獲能力,意味著語音控制設備的操作更容易、更自然。Maxim Integrated(現在屬於Analog Devices旗下品牌)開發瞭MAX98357 和MAX98358 D類放大器,效率達到92%,可提供3.2W的AB類音頻性能,這些放大器的簡化框圖如圖2所示。Diodes Incorporated的PAM8106具有較低功耗,使其能夠在由1.5V鉛酸電池和3.5V锂離子電池驅動的設備中很好地運行。


圖2:Maxim Integrated D類音頻放大器簡化框圖。(來源:Maxim Integrated)

離線語音控制

亞馬遜的Alexa和谷歌助手(Google Assistant)等基於雲的解決方案很容易用於具有穩定互聯網連接的設備,但對於那些沒有穩定互聯網或根本沒有連接的設備來說,離線語音控制則是一個更好的解決方案。例如,如果某個産品需要響應簡單的單詞指令,如go、stop、reset等(通常稱爲關鍵字識别),那麽在設備本身進行本地處理則很有意義。使用低成本的嵌入式微控制器可以實現簡單的關鍵字指令系統,例如可使用恩智浦(NXP)基於EdgeReady MCU的離線本地語音控制解決方案。它採用i.MX RT交叉MCU,開發人員能夠快速将語音控制集成到他們的産品中。恩智浦基於i.MX RT106S的解決方案包括SLN-LOCAL2-IOT開發工具包,如圖3所示。

該開發工具包配備瞭在FreeRTOS上運行的全部集成軟件,並提供有軟件開發工具包(SDK),以便快速驗證概念。離線語音控制也有助於解決許多消費者的隐私問題,因爲他們擔心自己的系統容易受到在線黑客的攻擊。


圖3:恩智浦的SLN-LOCAL2-IOT離線語音控制解決方案。(來源:恩智浦)

結論

語音和音頻正在快速成爲許多智能設備的首選控制界面,這種技術尤其适合在低功耗和便攜式物聯網設備中使用,因爲它能夠消除對昂貴且耗電的數字顯示器的要求。許多早期系統的音頻質量較差,隻能使用雲連接解決方案來實現。

然而,随著新一代高效D類音頻放大器的出現,使制造商能夠確保其設備爲消費者提供高質量的音頻體驗。而且現在也可提供一些其它解決方案,能夠在互聯網連接不穩定或根本沒有互聯網連接的情況下實現設備的語音控制。這些創新表明,随著人們越來越習慣這種控制界面,語音控制技術有能力适應新的需求,而且這種發展趨勢還會不斷繼續。

 
 
 
    您可能對以下産品感興趣  
産品型号 功能介紹 兼容型号 封裝形式 工作電壓 備注
HT517 3.1W (VDD=5.0V, RL=4Ω, THD+N=10%) MAX98360/MAX98357/AW88084 WLCSP-9/QFN-16/ESOP-8 2.5V-5.5V 3.1W小型便捷低功耗I2S輸入單(dān)聲道D類(lèi)音頻功率放大器
 
 
·藍牙音箱的音頻功放/升壓/充電管
·單節锂電内置升壓音頻功放IC選型
·HT7179 12V升24V内置
·5V USB輸入、三節锂電升壓型
·網絡主播聲卡專用耳機放大IC-H
 
M12269 HT366 ACM8629 HT338 

業務洽談:手機:13713728695(微信同号)   QQ:3003207580  EMAIL:panbo@szczkjgs.com   聯系人:潘波

地址:深圳市寶安西鄉航城大道航城創新創業園A3棟3樓

版權所有:深圳市永阜康科技有限公司  備案号:粵ICP備17113496号