智能語音站在神秘入口 后來者雷臻壁咚了誰?

2015-04-09 20:11:39來源:硅谷網(wǎng)作者:

     一個(gè)假期接著一個(gè)假期而來,出行訂票時(shí)我們對(duì)著手機(jī)上的智能語音機(jī)器人說話,就能讓它幫忙找到出行所需信息。如果不想走出去,在家里,我們對(duì)著智能語音電視說出想看什么,然后,我們只需要靜靜等待精彩節(jié)目的

     一個(gè)假期接著一個(gè)假期而來,出行訂票時(shí)我們對(duì)著手機(jī)上的智能語音機(jī)器人說話,就能讓它幫忙找到出行所需信息。如果不想走出去,在家里,我們對(duì)著智能語音電視說出想看什么,然后,我們只需要靜靜等待精彩節(jié)目的上演。還不止這些,我們的手表、我們的眼鏡等都能通過語音理解我們的需求,智能語音控制大有成為智能硬件標(biāo)配的趨勢(shì)。
 
  某一天,一個(gè)男人站在北京上地某辦公室的落地窗前,內(nèi)心起伏,想著這些智能語音給生活帶來的改變,他臉上滿是笑容,看著窗外漸綠的世界,他知道盡管春天已經(jīng)來了,但冬天遠(yuǎn)未離去。智能語音的征途還很漫長(zhǎng),但景色還是要看的。
  
  這個(gè)男人在向我們?nèi)绱私榻B智能語音帶來的智慧生活同時(shí),他感慨道:“智能語音會(huì)是下一個(gè)互聯(lián)網(wǎng)入口,尤其在移動(dòng)互聯(lián)網(wǎng)時(shí)代,這個(gè)入口將更快形成。”

  智能語音或是那個(gè)神秘入口
  這個(gè)男人是雷臻,OKVoice的聯(lián)合創(chuàng)始人,2014年8月,他和另外兩位聯(lián)合創(chuàng)始人決定要做一件厚積薄發(fā)的事情,說是厚積薄發(fā),是因?yàn)樗麄冇兄迥曜笥业募夹g(shù)儲(chǔ)備,這件事情就是現(xiàn)在的OKVoice。
 
  OkVoice主要從事智能語音技術(shù)和人工智能探索,仔細(xì)想想這也算是一家比較老的公司了,加上創(chuàng)始團(tuán)隊(duì)五年左右的技術(shù)儲(chǔ)備期,這家公司快6歲了。OKVoice聯(lián)合創(chuàng)始人雷臻在接受硅谷網(wǎng)專訪時(shí),所表現(xiàn)出來的創(chuàng)業(yè)姿態(tài)和思路,對(duì)應(yīng)這家公司后來者的身份,更是難以讓人不好奇。當(dāng)談到爭(zhēng)論和聲音不斷的“移動(dòng)互聯(lián)網(wǎng)入口”問題的時(shí)候,雷臻臉上浮現(xiàn)出了比以往更多的笑容,他表示,智能語音現(xiàn)在正站在風(fēng)口等風(fēng)來,它就是移動(dòng)互聯(lián)網(wǎng)入口。
 
  資料顯示,目前,國(guó)內(nèi)外多家公司從事智能語音相關(guān)產(chǎn)品的研發(fā)和生產(chǎn),國(guó)外主要以微軟、谷歌、蘋果、英特爾、IBM等巨頭為代表,國(guó)內(nèi)主要以百度、騰訊、盛大、搜狗、科大訊飛、云之聲、OKVoice為代表,其中,科大訊飛、云之聲、OKVioce一類公司是以智能語音為標(biāo)簽之一的垂直公司。
 
  金礦是容易讓人趨之若鶩的事物,智能語音,被稱為互聯(lián)網(wǎng)的下一個(gè)金礦,尤其是在這個(gè)移動(dòng)互聯(lián)網(wǎng)炙手可熱的時(shí)期。此間,雖然智能語音更多時(shí)候僅是表現(xiàn)為新潮的人機(jī)交互方式,但智能語音市場(chǎng)早已開始布局備賽,你未唱罷,我便登臺(tái),搶占傳說中的“入口”。
 
  巨頭公司紛紛涉足語音市場(chǎng),加劇智能語音市場(chǎng)競(jìng)爭(zhēng)的同時(shí),搶灘“移動(dòng)互聯(lián)網(wǎng)入口”的目的越發(fā)清晰,在雷臻看來,智能語音市場(chǎng)的潛力現(xiàn)在仍被低估了,隨著智能硬件的不斷升級(jí)改造,未來智能語音市場(chǎng)是會(huì)被真的“智能硬件”引爆的。從巨頭公司爭(zhēng)相布局智能語音拉開“移動(dòng)物聯(lián)網(wǎng)入口”戰(zhàn)備競(jìng)賽來看,未來幾年,智能語音會(huì)上升到一個(gè)前所未有的戰(zhàn)略地位,相應(yīng)的智能語音市場(chǎng),也會(huì)有一個(gè)明顯的爆發(fā)現(xiàn)象。
 
  滲透式改造行業(yè)才剛剛開始
  讓機(jī)器理解人的語言,是一個(gè)從語音到文本、從文本到理解的技術(shù)過程。由于中國(guó)方言和口語豐富多樣,智能語音的準(zhǔn)確率和理解率會(huì)偏低。面對(duì)這樣的中國(guó)智能語音市場(chǎng),國(guó)內(nèi)外巨頭必將面臨更為殘酷的競(jìng)爭(zhēng)。雷臻和他所帶領(lǐng)的Okvoice不愿錯(cuò)過搶灘中國(guó)智能語音市場(chǎng)的絕佳時(shí)機(jī),但是雷臻認(rèn)為,智能語音和行業(yè)的結(jié)合更有意義,更讓大家心動(dòng)的是,滲透式改造行業(yè)才剛剛開始。
 
  所以,OKvoice除了針對(duì)中國(guó)方言和口語推出的“語音識(shí)別”服務(wù)外,還推出了“字幕服務(wù)、口語評(píng)測(cè)、智能客服”等特色服務(wù)。
 
  其中,“字幕服務(wù)”就是典型的智能語音和行業(yè)深度整合的技術(shù)類產(chǎn)品,借助“字幕服務(wù)”,可以將影視作品、電視節(jié)目、在線課程、視頻會(huì)議等視頻中的聲音,通過語音識(shí)別技術(shù)自動(dòng)生成文字并導(dǎo)入生成字幕。雷臻告訴硅谷網(wǎng),借助云計(jì)算和大數(shù)據(jù),這項(xiàng)服務(wù)未來或可實(shí)現(xiàn)工具化的在線服務(wù)。非專業(yè)人士拍攝的小視頻,通過這項(xiàng)在線服務(wù),就能輕松制作出具有影視風(fēng)格的短片。
 
  據(jù)第三方數(shù)據(jù)不完全顯示,OKVoice推出的“字幕服務(wù)“快速通過語音識(shí)別自動(dòng)生成文字,目前階段,準(zhǔn)確率在垂直領(lǐng)域可達(dá)到95%,省時(shí)省力。當(dāng)然還有提升空間,隨著技術(shù)不斷完善,更高的準(zhǔn)確率下帶來的便捷體驗(yàn),對(duì)“字幕制作”這個(gè)行業(yè)小痛點(diǎn),也算是莫大的安慰。
 
  比以上這些更引人注目的,是智能語音與硬件的互動(dòng),在市場(chǎng)需求及技術(shù)和模式創(chuàng)新的驅(qū)動(dòng)下,全球智能語音產(chǎn)業(yè)正在快速發(fā)展。像藍(lán)牙耳機(jī)、車載導(dǎo)航、語音門禁等智能語音解決方案,都在逐步完善中。不得不承認(rèn),智能語音正在改變我們的生活。
 
  隨著智能終端設(shè)備的普及以及可穿戴設(shè)備、智能家居等發(fā)展,智能語音行業(yè)發(fā)展趨勢(shì)見好。語音會(huì)是未來一種簡(jiǎn)單和常用的人機(jī)交互模式。特別是在場(chǎng)景化的環(huán)境中,如駕車,不方便通過手或者眼球操作,語音是一種首選的方式。受硬件形態(tài)的約束,市場(chǎng)上將會(huì)有更多的硬件引入智能語音的技術(shù)。
 
  一次公開場(chǎng)合上,智能語音技術(shù)和人工智能探索者作為OKVoice的定位被進(jìn)一步夯實(shí),陸續(xù)上線的服務(wù)中就有我們前面提到的滲透式的行業(yè)解決方案。當(dāng)然,這些解決方案,還有待市場(chǎng)和用戶的進(jìn)一步檢驗(yàn)。
 
  格局未定,后來者自我壁咚
  “互聯(lián)網(wǎng)+”的概念提出后,在不久前剛剛舉辦的2015博鰲論壇上,互聯(lián)網(wǎng)領(lǐng)袖的關(guān)注度格外高漲。本次活動(dòng)上,李彥宏、比爾蓋茨、馬斯克這三位大佬的對(duì)話更是引人矚目,其中很多觀點(diǎn)都蘊(yùn)含著對(duì)未來的重要意義。其中,人工智能就是三位大佬在對(duì)話上都高度關(guān)注的領(lǐng)域,而眾所周知的事情是,智能語音是人工智能的基礎(chǔ)支持和核心要點(diǎn)。
 
  這聽起來很讓人興奮,雖然智能語音距離人工智能似乎還比較遙遠(yuǎn),但是,越來越多的通道將被打開,在中國(guó),越來越多的公司加入智能語音市場(chǎng),百度宣布語音識(shí)別技術(shù)及能力全面開放,微信發(fā)布了語音識(shí)別開放平臺(tái)……現(xiàn)階段,互聯(lián)網(wǎng)巨頭都還只是在試水,還沒有大規(guī)模地進(jìn)入語音這塊市場(chǎng)。大公司考慮更多的是自己的商業(yè)閉環(huán),而垂直的公司更多做一些聚焦,前者進(jìn)入語音市場(chǎng)是立足做一個(gè)平臺(tái)級(jí)的產(chǎn)品,而后者更關(guān)注垂直與細(xì)分市場(chǎng)。
 
  OKVoice也是這么做的,格局未定,后來者可發(fā)揮空間還很大。“巨頭的參與讓智能語音這個(gè)領(lǐng)域容易得到更多的關(guān)注,共同培育市場(chǎng),市場(chǎng)對(duì)參與者反饋越多。”雷臻在說這句話的時(shí)候異常平靜。
 
  對(duì)雷臻來說,這是他的第二次創(chuàng)業(yè)了,第一次是做優(yōu)惠券,就是現(xiàn)在O2O的雛形。第二次,他選擇了智能語音這塊大蛋糕。30多歲的雷臻,看起來干練自信,言談舉止親切而自然。當(dāng)年雷臻從華為出來的時(shí)候,他就堅(jiān)信,創(chuàng)業(yè)這件事情,厚積薄發(fā)更能帶來驚喜。
 
  前面提到的OKVoice五年的技術(shù)儲(chǔ)備,來源于團(tuán)隊(duì)構(gòu)成的強(qiáng)大技術(shù)背景,但這還不夠,應(yīng)該還有這個(gè)團(tuán)隊(duì)共同的強(qiáng)大理想所架設(shè)的“極客”氛圍。在OKVoice創(chuàng)業(yè)初期,公司還在研發(fā)“語音識(shí)別”的升級(jí)產(chǎn)品,一個(gè)主抓技術(shù)的同事因?yàn)榧抑杏惺,雷臻給了他一個(gè)星期的事假,其實(shí),用7天來處理該技術(shù)的家事還是有點(diǎn)緊張的,結(jié)果,這個(gè)可愛的技術(shù)大牛只用了不到一半的時(shí)間就趕了回來,結(jié)果,該階段項(xiàng)目進(jìn)展提前完成,為后面“滲透性行業(yè)智能語音服務(wù)”節(jié)省出了競(jìng)爭(zhēng)時(shí)間。
 
  “這樣的一個(gè)團(tuán)隊(duì),是一個(gè)可以創(chuàng)造神奇的團(tuán)隊(duì)。”雷臻對(duì)來訪者說,又像是在自言自語。言語當(dāng)中自豪和壓力都有,他對(duì)現(xiàn)在的OKVoice的估值是一億美元,別人問他,你這么估值的依據(jù)是什么:是行業(yè)前景,是市場(chǎng)體量,還是技術(shù)儲(chǔ)備?雷臻笑語,他說,我們不主動(dòng)尋找資本介入,也不排斥資本介入,我這是在逼迫自己呀。
 
  雷臻是一個(gè)緊跟潮流的人嗎?像也不像,他似乎忘了一個(gè)潮詞。這個(gè)潮詞是“壁咚”。壁咚的字面意思是大力拍打墻壁發(fā)出“咚咚”聲的行為,但分場(chǎng)合又有著不同的意義。通常是指戀愛中,男性把女性逼到墻邊,單手或者靠在墻上發(fā)出“咚”的一聲,讓其完全無處可逃的動(dòng)作。
 
  現(xiàn)在的雷臻就像在談一場(chǎng)戀愛,戀愛對(duì)象是“智能語音”,是“競(jìng)爭(zhēng)對(duì)手”,是“行業(yè)未來”,但更多的是他自己。這和自戀無關(guān),他做為后來者,究竟壁咚了誰?在智能語音風(fēng)起云涌的當(dāng)下,后來者雷臻壁咚的是自己。
關(guān)鍵詞:智能語音雷臻