捷通華聲面向智能車載推出靈云遠場語音交互解決方案

2016-05-17 09:14:48來源:威易網(wǎng)作者:

    靈云科技04月27日消息:近日,北京車展在京隆重開幕,智能語音交互作為一種安全、流暢、便捷的車載設(shè)備控制技術(shù),成為本次車展最為亮麗的風景線。捷通華聲長期為國內(nèi)外汽車廠商等合作伙伴提供智能語音交互、智能圖像等全方位人工智能服務(wù)。

靈云科技04月27日消息:近日,北京車展在京隆重開幕,智能語音交互作為一種安全、流暢、便捷的車載設(shè)備控制技術(shù),成為本次車展最為亮麗的風景線。捷通華聲長期為國內(nèi)外汽車廠商等合作伙伴提供智能語音交互、智能圖像等全方位人工智能服務(wù),為了更進一步滿足市場對智能車載語音交互技術(shù)的需求,捷通華聲近期推出適應(yīng)于車載環(huán)境的專用語音識別技術(shù),并面向中國智能車載領(lǐng)域全面開放靈云遠場語音交互解決方案。

靈云遠場語音交互解決方案全面整合了捷通華聲最新推出的語音喚醒、聲源定向、遠場降噪、回聲消除、語音打斷、語音糾錯、多輪對話等實用化語音、信號處理技術(shù),抗噪能力極強,即使在80km/h的車速下也能準確識別司機話語,保證語音交互的流暢自然,為國內(nèi)廣大智能終端設(shè)備廠商、解決方案提供商、軟件開發(fā)商等行業(yè)伙伴提供靈云麥克風陣列、云+端語音交互、內(nèi)容服務(wù)等軟硬件一體的智能語音交互解決方案,打造“能聽會說、能理解、會思考”的各種智能車機、智能后視鏡、便攜式導航儀、HUD等車載設(shè)備。

\

抗噪型靈云語音識別+麥克風陣列 輕松破解車內(nèi)噪音干擾

      面對行車過程中的車外胎噪、風噪,車內(nèi)空調(diào)聲、引擎聲等行車環(huán)境噪音,捷通華聲靈云多麥克風陣列能精準拾取說話人的語音信號,抑制噪聲和混響,抗噪型靈云語音識別技術(shù),能對殘余的車載噪音進行進一步處理,準確識別司機語音命令。

      多麥克風陣列能根據(jù)聲音到達的時間差,準確計算出聲源與陣列模塊之間的角度和距離,實現(xiàn)對目標聲源的定位與跟蹤,并利用麥克風陣列的空域濾波特性,在目標說話人方向形成拾音波束,僅拾取波束的信號,抑制波束之外的噪聲和混響(反射聲),同時,通過回聲消除技術(shù),過濾掉音頻設(shè)備發(fā)出的聲音,讓語音識別引擎獲取的用戶聲音更為清晰純凈。
 

\
 

由于麥克風陣列會不可避免的拾取部分行車環(huán)境噪音,影響語音識別率,對此,捷通華聲綜合考慮車內(nèi)物理結(jié)構(gòu)和車速變化,對駕車過程中的車外胎噪、風噪,車內(nèi)空調(diào)聲、引擎聲等車載環(huán)境噪音信息進行建模,并用大量的實際行車噪音數(shù)據(jù)進行訓練,進一步優(yōu)化語音識別引擎,推出了針對抗噪的深度學習算法和自適應(yīng)車內(nèi)噪音的聲學模型,讓靈云語音識別具備極強的抗噪性,輕松應(yīng)對常見車載環(huán)境噪音。同時,該技術(shù)采用深度神經(jīng)網(wǎng)絡(luò)算法(DNN)算法,可在用戶的使用過程中,通過利用積累的語音數(shù)據(jù)來訓練、優(yōu)化算法,不斷提升語音識別率,讓司機與車載設(shè)備的語音交互越來越流暢。

靈云遠場語音交互解決方案 全面滿足司機需求

      為了全面滿足司機駕駛途中的各種實際需求,靈云遠場語音交互解決方案在實現(xiàn)打電話、發(fā)短信、聽音樂、地圖導航、設(shè)備控制等眾多語音控制的同時,為司機提供天氣、新聞、故事、股票、火車、航班、餐飲等30多種云端信息與內(nèi)容服務(wù)。

      在駕車過程中,司機只要說出喚醒詞,如“小靈開機”,車載設(shè)備便會開啟,并面向司機方向形成拾音波束。司機說“為我導航至天安門”,車載設(shè)備便會自動規(guī)劃路線并進行導航,路上需要打電話時,司機可以說“給xx打電話”、“打電話給xx”,或者直接報出電話號碼,電話便會自動撥出,當電話號碼識別有誤時,司機可通過多輪對話方便地進行糾錯。打完電話,如果想聽首歌放松一下,可以直接說“放首青花瓷”、“來首周杰倫的歌”,或者“播放周杰倫的青花瓷”,車載設(shè)備都能輕松識別;如果想了解最新信息,無論是天氣、新聞,還是股票、航班信息,只要說出來,都可以從云端輕松獲;如果你想吹吹風、透透氣,也無需親自動手,只需說“開窗”,車窗便會自動落下,真正實現(xiàn)語音控制,把司機的眼睛和雙手還給駕駛,為行車安全保駕護航。

\

除此之外,靈云遠場語音交互解決方案具備獨特的優(yōu)點:語音識別方面,捷通華聲通過用怠速、中速、高速、開窗、關(guān)窗以及空調(diào)弱風、強風等各種駕駛狀況下的海量真實錄音數(shù)據(jù)對ASR引擎經(jīng)行訓練優(yōu)化,讓靈云語音識別技術(shù)能夠輕松應(yīng)對各種行車環(huán)境噪音,語音識別正確率和實時率已達行業(yè)領(lǐng)先水平;語音合成方面,靈云語音合成提供男聲、女聲、可愛童聲等多種音色供用戶選擇,滿足不同用戶的個性化需求。同時,捷通華聲充分考慮目前的網(wǎng)絡(luò)覆蓋狀況,為用戶提供本地與云端相結(jié)合的語音交互服務(wù),即使汽車行駛在沒有網(wǎng)絡(luò)的偏遠地區(qū),也能使用語音交互來輕松控制車載設(shè)備。

捷通華聲堅持合作共贏 與廣大合作伙伴共享產(chǎn)業(yè)機遇

       靈云遠場語音交互技術(shù)源自于捷通華聲于2011年推出的首個全方位人工智能開放平臺——靈云平臺(hcicloud.com),靈云平臺面向產(chǎn)業(yè)全面開放,并以“云+端”方式,為產(chǎn)業(yè)界提供語音合成、語音識別、語義理解、機器翻譯、OCR、手寫識別、人臉識別、聲紋識別、指紋識別等全方位人工智能能力。

       通過完美整合靈云語音識別、語音合成、語義理解等核心技術(shù)以及靈云多麥克風陣列,靈云遠場語音交互解決方案有效克服了噪音干擾,徹底打破智能車載設(shè)備應(yīng)用語音交互技術(shù)的產(chǎn)業(yè)瓶頸,為國內(nèi)廣大智能車載設(shè)備廠商、解決方案提供商、軟件開發(fā)商等行業(yè)伙伴提供麥克風陣列、云+端語音交互、內(nèi)容服務(wù)等軟硬件一體的智能語音交互解決方案。捷通華聲始終堅持“合作共贏”的發(fā)展理念,堅持不與合作伙伴爭利,通過與合作伙伴精誠合作,共同推動智能語音交互在中國智能車載領(lǐng)域的普及化應(yīng)用。

      未來發(fā)展,捷通華聲將繼續(xù)以清華大學人工智能研究力量為依托,更加專注智能語音等人工智能技術(shù)研究與產(chǎn)業(yè)化的推廣與應(yīng)用,通過與產(chǎn)業(yè)內(nèi)合作伙伴的精誠合作,共同推動中國智能車載設(shè)備全面服務(wù)社會大眾,共同加快智能化生活時代到來的步伐!

關(guān)鍵詞:捷通華聲