眼見為實 捷通華聲靈云遠場語音識別震撼發(fā)布

2015-11-26 14:06:05來源:威易網作者:

      靈云科技26日消息:捷通華聲靈云遠場語音識別技術全面升級,可獲取7到8米外的語音,語音識別率仍不低于90%,從根本上改變目前市場上因各式問題導致的僅能近距離交互的方式。

靈云科技26日消息:捷通華聲靈云遠場語音識別技術全面升級,可獲取7到8米外的語音,語音識別率仍不低于90%,從根本上改變目前市場上因各式問題導致的僅能近距離交互的方式,為智能語音技術應用于智能車載、智能家電、智能家居、機器人等靈云奠定堅實的基礎,讓智能硬件不再為遠場語音識別的瓶頸而擔憂。據悉,靈云種子已采用靈云遠場語音識別技術。

靈云種子自2014年發(fā)布以來,得到了智能硬件、車載、機器人等多個領域的一致好評,特別是在機器人領域,解決了之前存在的種種人機交互困難的問題,使設備脫離了手動控制,真正讓機器人實現了“能說會聽、能思考、會判斷”。

\

靈云遠場語音識別  距離不再阻礙交流

很長一段時間以來,科大訊飛、NUANCE等語音技術公司都在努力開拓智能硬件市場,但智能硬件產品在很多場景下因語音交互體驗不如人意而不能滿足市場的需求,究其原因主要是受限于背景噪音、其他聲音干擾、回聲、混響等多重復雜因素,進而導致的識別距離近、識別率低等明顯痛點,在這些問題沒有解決之前,智能硬件語音交互方面將一直是一個短板。鑒于此,靈云推出遠場語音識別技術,將極大推進語音識別技術在真實生活場景中的應用。

遠場語音識別技術的核心有兩點,一是語音前端處理:利用麥克風陣列、回聲消除等技術將目標說話人的聲音增強,并抑制/消除周圍無用的聲音(噪聲+回聲);二是語音識別引擎針對麥克風陣列處理后的數據進行專門優(yōu)化,以使遠場識別效果達到最優(yōu)。

靈云遠場語音識別技術,是基于多麥克風陣列的語音硬件前端方案,并利用麥克風陣列的空域濾波特性——在目標說話人方向形成拾音波束,抑制波束之外的噪聲和反射聲,其降噪和去混響效果均為國內領先水平,并可成功實現語音喚醒;聲源定位;遠場識別;回聲消除;語音打斷等5大功能。

可以想象,基于靈云遠場語音識別的遠距離、高識別率支撐,現在用戶在以家庭為單位的活動范圍內,幾乎可以通過語音輕松操控家里的一切智能硬件設備,推而廣之,搭載遠場識別的智能硬件產品將無限擴大適用范圍和應用場景。目前的方案主要根據算法不同,可分為適用于電視機、空調、機器人等的加性麥克風陣列和適用于采訪話筒、錄音筆等的差分麥克風陣列。

靈云種子  智能終端交互一站式解決方案

智能硬件熱炒兩三年,至今未見哪個企業(yè)已經將成熟的一套方案或者說場景完整地展現出來并得到推廣?傮w上來說,目前很多企業(yè)設想的場景對于消費者的價值究竟是什么沒有考慮清楚;外部來說,智能家居還未深入老百姓,市場還未感知到,沒有爆款產品,產品形態(tài)整體傳統(tǒng);從內部講,大大小小的企業(yè)都在喊著做平臺,資本市場也炒的很熱,但實際上參與其中的很多智能軟件公司并沒有一套整體的方案能拿的出手。

如果整體目前玩不轉,那么先從做單品或者微場景來吸引大眾眼球似乎是不錯的路子,這就是智能硬件目前呈現的結果。在智能家居的部分,基本上所有推出產品的企業(yè)都在強調可以聯WIFI,可以遠程操控,甚至可以在一臺冰箱上看視頻聽音樂,即所謂的娛樂化?蛇@些并不是真正的“智能”。目前,智能單品遇到的市場瓶頸,包括操控形式本末倒置、形式大于實際效果、存在安全性等問題。

怎么定義智能,并真正實現智能,依然為產業(yè)界,也是媒體爭論的熱點。越來越多的人認為,能夠實現手機app控制即為智能,但是手機控制卻也需要手動操作各類硬件,依然不夠智能。

隨著人工智能技術的應用越來越廣泛,手機app控制、語音控制等多重控制方式越來越多的應用到了智能硬件上。靈云智能種子可實現通過語音識別、語音合成、自然語言理解等人工智能技術,為用戶提供各種智能交互服務,用戶只需要用說話的方式發(fā)布命令,就可以控制相應的系統(tǒng)。

例如,對著手機app說一聲“我五分鐘之后到家”,就會得到回復“好的,按照您的習慣,空調已經調到26度,熱水器調到35度”;說一聲“幫我煮杯咖啡”,咖啡機就開始工作;說一聲“太熱了,溫度調低兩度”,空調就開始調溫窩在沙發(fā)上看著無聊的電視節(jié)目,說一聲“我想看上周的非誠勿擾”,對應的電視臺就自動搜索出來了;說一聲“我要睡覺了”,空調就自動調到睡眠模式,門窗自動鎖閉。用戶可以通過語音來開啟燈光、調整燈光的亮度、啟動私人家庭影院、控制家用電器、等等,讓家庭自動化的功能往前邁向了一大步。

但由于國內諸多語音廠商能力參差不齊、語義理解能力高低有別,而且語音交互僅能辨別指令及交互,僅是智能家居的一部分,并不能為家居的安防、家庭成員的辨別提供能力,因此并不能為家居提供全方位的智能服務。而國內技術廠商所推出的智能家居解決方案卻往往固步在“聲”的方向,無法覆蓋聲紋識別、人臉識別、指紋識別等生物識別能力等全套能力。

2014年,為方便智能終端廠商與集成商、開發(fā)商更好地使用靈云平臺(hcicloud.com)全方位人工智能能力,捷通華聲特別推出了企業(yè)級開發(fā)者專用的智能終端交互方案:靈云種子。靈云種子強化了靈云全方位人工智能平臺各項人工智能技術的融合,包括靈云語音識別、語音合成、語義理解、聲紋識別、人臉識別、指紋識別等全方位人工智能交互能力,并提供簡單易用的開發(fā)接口,供智能家居、車載等各類智能終端進行集成調用,實現人與終端設備多種方式的自由溝通和控制。企業(yè)級開發(fā)商通過應用靈云種子,可以輕松實現智能語音交互、智能語音導航、智能語音控制、聲紋解鎖、手寫輸入、智能圖像識別、安全身份認證等多種人機交互功能,滿足智能家居、智能車載、智能家電、機器人及可穿戴式設備等各個行業(yè)對人工智能技術應用大量且多方位的需求。

經過與眾多智能終端廠商的合作,為不斷滿足合作的應用需求,捷通華聲“靈云種子”已經升級到2.0版,新版靈云種子新增云端和本地同時識別,并從結果中擇優(yōu)的功能,提高了語音識別的準確率和識別速度,優(yōu)化了意圖理解的幾十個領域。目前,靈云種子可廣泛應用在以下場景中:

語音檢索:支持包括路況導航類、家居菜單智能導航類、周邊服務類、生活服務類、娛樂類等多種語音檢索服務;

消息提醒:人性化定制推送類別:來電提醒、短信提醒、應用提醒,并可將設置在云端;

通訊娛樂:支持短信發(fā)送,電話通訊,多媒體播放,手機操控;

健康服務:支持傳感器,提供傳感器數據分析,為用戶提供健康圖表,并結合云端服務提供定制健康指導等現有及正在研發(fā)的能力;

云平臺:基于靈云平臺,提供多設備數據同步,私人信息云存儲,智能推薦;

這些方案類似于一個開發(fā)模版,靈云(hcicloud.com)平臺將這些特定領域和場景的智能交互方案經過設計和優(yōu)化后,打造出一體化的全智能人機交互解決方案——“靈云種子”。直接應用“靈云種子”配置的技術服務和內容服務,即可滿足各種智能硬件的智能化需求。

在機器人方面,靈云機器人已成功應用靈云種子,全面整合捷通華聲靈云平臺多項人工智能技術能力,讓稍顯“笨拙”的物理機器人成為真正“能說會聽,能寫會看,能思考、會判斷”,有一定分析與辨別能力的聰明、生動的智能機器人,可廣泛為金融、電信、交通、教育、醫(yī)療等智能客戶服務領域,也可以為教育、娛樂、家居生活等行業(yè)提供智能問答、智能聊天、智能“保姆”等服務。同時,靈云機器人具備平滑的移植性,可移植到市面上各類智能機器人硬件設備中。
據捷通華聲靈云產品研發(fā)部門人員介紹,靈云種子更主要的作用是在產業(yè)中起到示范與引導作用,期望伴隨靈云種子在各行各業(yè)智能硬件中的不斷“生根發(fā)芽”,中國智能硬件將進入一個全新的、真智能的時代!

捷通華聲靈云種子扎根智能終端  攜手合作伙伴共贏

靈云平臺(hcicloud.com)是捷通華聲于2011年推出的首個全方位人工智能開放平臺。為推動人工智能產業(yè)的廣泛應用,靈云平臺自推出以來一直面向產業(yè)全面開放,包括個人開發(fā)者在內的合作伙伴,都可以通過靈云平臺獲取智能語音、智能圖像、智能語義、生物特征等技術能力。

在中國華南地區(qū),尤其廣州、深圳地區(qū)經濟發(fā)達、創(chuàng)新力強,在智能家居、智能車載、智能家電、機器人、穿戴式設備研發(fā)與創(chuàng)新上擁有獨特優(yōu)勢。為了向華南地區(qū)廣大合作伙伴提供更加直接的支持與幫助,捷通華聲在2015年初成立了深圳捷通華聲公司,旨在依托靈云平臺,利用靈云平臺智能語音、智能圖像、語義理解等全方位人工智能技術能力和豐富完善的智能終端交互解決方案,與華南地區(qū)硬件廠商加強合作關系,發(fā)揮華南地區(qū)智能終端設備研發(fā)和生產的優(yōu)勢,期望伴隨靈云種子在各行各業(yè)智能硬件中的不斷“生根發(fā)芽”,以推動智能終端產業(yè)長足的進步,攜手智能硬件廠商互惠共贏,推動中國智能硬件進入一個全新的、真智能的時代!

未來發(fā)展,伴隨人工智能產業(yè)在世界范圍內的高速發(fā)展,捷通華聲與清華大學共同創(chuàng)建清華靈云人工智能研究中心、清華海峽研究院人工智能研究中心,捷通華聲將以清華大學人工智能研究力量為依托,更加專注人工智能技術研究與產業(yè)化的推廣與應用,與合作伙伴精誠合作,共同創(chuàng)建良好的人工智能產業(yè)生態(tài),共同推動中國人工智能產業(yè)的發(fā)展進步,為中國人工智能產業(yè)的發(fā)展做出應有的貢獻!
 

關鍵詞:捷通華聲