智能硬件遠(yuǎn)場語音交互:一文讀懂靈云麥克風(fēng)陣列

2017-05-24 16:25:44來源:威易網(wǎng)作者:

    引入更為自然的遠(yuǎn)場語音交互,已成為電視、空調(diào)、機(jī)器人等眾多智能硬件的發(fā)展趨勢及廣泛需求。捷通華聲依托成熟的核心技術(shù),推出靈云麥克風(fēng)陣列軟、硬件產(chǎn)品及針對不同智能硬件的遠(yuǎn)場語音交互解決方案。

      引入更為自然的遠(yuǎn)場語音交互,已成為電視、空調(diào)、機(jī)器人等眾多智能硬件的發(fā)展趨勢及廣泛需求。捷通華聲依托成熟的核心技術(shù),推出靈云麥克風(fēng)陣列軟、硬件產(chǎn)品及針對不同智能硬件的遠(yuǎn)場語音交互解決方案。

配合靈云麥克風(fēng)陣列,捷通華聲同時(shí)在靈云開發(fā)者社區(qū)提供靈云種子SDK、靈云語音識別SDK、語音合成SDK、語義理解SDK 、聲紋識別SDK等全鏈條的語音交互產(chǎn)品,以及強(qiáng)大的公有云平臺服務(wù)支持,使得硬件能輕松實(shí)現(xiàn)遠(yuǎn)場精準(zhǔn)語音交互。

領(lǐng)先行業(yè)的核心技術(shù)

作為技術(shù)驅(qū)動型的企業(yè),捷通華聲擁有語音喚醒、聲源定向、回聲消除、語音降噪、遠(yuǎn)場識別在內(nèi)的全部靈云麥克風(fēng)陣列核心技術(shù),且各項(xiàng)核心技術(shù)指標(biāo)均達(dá)到業(yè)界領(lǐng)先水平。

\

語音喚醒

支持1個(gè)或者多個(gè)喚醒詞,且喚醒詞可定制,支持第三方喚醒詞。5米喚醒率 > 95%,誤喚醒率 < 1次/24小時(shí)。

聲源定向

支持2/4/6個(gè)麥克風(fēng),線性/環(huán)形布局,180°/360°聲源定向。線性布局陣列定向精度 < ±15°,環(huán)形布局陣列定向精度 < ±10°。

回聲消除

支持單聲道/立體聲雙聲道回聲信號輸入,采樣率16000Hz,采樣位數(shù)16bit。

語音降噪

增強(qiáng)目標(biāo)說話人方向語音,抑制說話人方向以外的聲音,消除非人聲背景音。

遠(yuǎn)場識別

支持持續(xù)16k16bit音頻輸出,或者經(jīng)過端點(diǎn)檢測的非靜音音頻輸出。3米識別率 > 95%,5米識別率 > 92%。

捷通華聲為客戶提供從靈云麥克風(fēng)陣列SDK軟件,到靈云麥克風(fēng)陣列評估板,以及針對不同智能硬件推出的遠(yuǎn)場語音交互方案。

靈云麥克風(fēng)陣列SDK

靈云麥克風(fēng)陣列SDK是捷通華聲專門針對智能家電、車載、機(jī)器人、音箱等智能終端遠(yuǎn)場語音交互推出的語音信號處理SDK,可適配多麥克風(fēng)陣列布局,可以實(shí)現(xiàn)各種復(fù)雜噪音環(huán)境中的遠(yuǎn)場語音識別體驗(yàn)。

\

語音識別本質(zhì)上必須和聲學(xué)處理融合,語音設(shè)備沒有好的耳朵顯然不行,而靈云麥克風(fēng)陣列SDK則能讓智能硬件的雙耳更加靈敏,目前,SDK已可在靈云平臺開發(fā)者社區(qū)內(nèi)下載使用。

靈云遠(yuǎn)場語音識別麥克風(fēng)陣列評估板

評估板主要方便用戶體驗(yàn)評估靈云麥克風(fēng)陣列各項(xiàng)功能,加快產(chǎn)品開發(fā)進(jìn)程,日前已經(jīng)成功上線靈云商城,可直接在線購買。用戶拿到靈云遠(yuǎn)場語音識別麥克風(fēng)陣列評估板,只需要對安照說明書進(jìn)行簡單的操作,即可體驗(yàn)產(chǎn)品的各項(xiàng)功能。

\

目前,靈云麥克風(fēng)陣列評估板主要涉及君正芯片X1000芯片平臺和瑞芯微RK3229平臺,君正X1000平臺支持單麥,2麥,4麥線性,4麥環(huán)形等布局形式,瑞芯微RK3229平臺支持環(huán)形6麥的布局形式,用戶可以根據(jù)產(chǎn)品的外觀設(shè)計(jì),結(jié)構(gòu)尺寸,選擇合適的麥克風(fēng)陣列布局形式,采購對應(yīng)的評估板做體驗(yàn)測試,輔助產(chǎn)品開發(fā)。

\

靈云系列語音交互方案

針對不同智能硬件客戶,捷通華聲分別推出靈云智能電視語、智能空調(diào)語音、智能音箱語音交互、機(jī)器人語音交互等相對應(yīng)的解決方案,從而使靈云麥克風(fēng)陣列技術(shù)以及靈云語音交互技術(shù)能更好地解決用戶需求。

靈云智能電視遠(yuǎn)場語音交互方案

該方案包括近講語音遙控器產(chǎn)品、遠(yuǎn)場語音遙控器產(chǎn)品、靈云種子產(chǎn)品(包含云+端語音識別和語義理解,語音合成功能)、靈云聲紋識別產(chǎn)品,以及豐富的第三方接入內(nèi)容,例如天氣,音樂,百科,視頻等資源。

\

其中遠(yuǎn)場語音遙控器產(chǎn)品為捷通華聲獨(dú)有的遠(yuǎn)場語音交互解決方案。這個(gè)方案中,遠(yuǎn)場語音遙控器采用環(huán)形4麥克風(fēng)布局方式,可以實(shí)現(xiàn)360度聲源定位,3到5米距離拾音,有效降低周圍環(huán)境中的噪聲,同時(shí)消除電視機(jī)播放的聲音。具有極低的功耗和極高的性價(jià)比,能夠在增加產(chǎn)品"新技能"的同時(shí)保證成本有效控制。

多年技術(shù)積累,靈云麥克風(fēng)陣列以及語音交互技術(shù)已經(jīng)在樂視、小米等眾多電視、空調(diào)廠家產(chǎn)品中實(shí)現(xiàn)量產(chǎn),同時(shí)應(yīng)用于新松、棠棣、木爺?shù)葞资曳⻊?wù)型機(jī)器人中,并在長安眾多智能車載產(chǎn)品中得以應(yīng)用。

圍繞遠(yuǎn)場語音交互,捷通華聲通過成熟的靈云麥克陣列技術(shù)以,并配合國內(nèi)領(lǐng)先的靈云語音交互、聲紋識別等技術(shù),努力實(shí)現(xiàn)在讓每一家智能硬件廠商都能低成本快速擁有"靈動雙耳",并輕松實(shí)現(xiàn)語音交互,構(gòu)建智能硬件語音交互新時(shí)代。

關(guān)鍵詞:智能硬件靈云