從web到social graph,搜索正在發(fā)生什么?

2013-01-22 11:25:38來(lái)源:鈦媒體作者:

搜索引擎正在發(fā)生一場(chǎng)靜悄悄的變革,在平靜的搜索結(jié)果頁(yè)背后,巨大的浪潮在洶涌澎湃。上一次革命是Pagerank的誕生,它使得Google替代Yahoo成為搜索巨頭,這次輪到了Facebook和Twitter。

搜索引擎正在發(fā)生一場(chǎng)靜悄悄的變革,在平靜的搜索結(jié)果頁(yè)背后,巨大的浪潮在洶涌澎湃。上一次革命是Pagerank的誕生,它使得Google替代Yahoo成為搜索巨頭,這次輪到了Facebook和Twitter。

在2012年底前后,F(xiàn)acebook、Twitter和國(guó)內(nèi)的云云都先后推出了基于社交數(shù)據(jù)的搜索引擎(云云搜索基于新浪、騰訊等四大微博的數(shù)據(jù)源)。盡管有些巧合,但其背后隱藏的邏輯不可低估——以Pagerank(web graph)為基石的傳統(tǒng)搜索引擎,遇到了整合了social graph社交搜索的強(qiáng)大挑戰(zhàn)。

為什么說(shuō)這是個(gè)強(qiáng)大的挑戰(zhàn),social graph(社交圖譜或社會(huì)化搜索)將以什么方式顛覆傳統(tǒng)搜索呢?

\

傳統(tǒng)網(wǎng)頁(yè)的信息源危機(jī)

任何搜索的基礎(chǔ),都是豐富的、海量的信息。當(dāng)世界上的web網(wǎng)頁(yè)足夠多的時(shí)候,Google的存在才有意義。1998年的時(shí)候,網(wǎng)上的網(wǎng)站只有那么幾個(gè),掰著手指就可以數(shù)出來(lái),這種信息匱乏的情況下,當(dāng)然用不著多強(qiáng)大的搜索。

隨著網(wǎng)頁(yè)信息的增加,在網(wǎng)上尋找信息的網(wǎng)民分化成了兩個(gè)部分:一部分網(wǎng)民的需求,hao123就可以滿(mǎn)足;而更大量、更多網(wǎng)民的信息檢索需求,列表式的網(wǎng)址導(dǎo)航無(wú)法滿(mǎn)足,從而誕生了Google和百度。

可以說(shuō),有價(jià)值的信息在哪里,搜索的價(jià)值就在哪里。當(dāng)移動(dòng)互聯(lián)網(wǎng)上產(chǎn)生的信息足夠多、足夠有價(jià)值的時(shí)候,移動(dòng)搜索就順理成章地出現(xiàn);當(dāng)大量有價(jià)值的信息出現(xiàn)在微博、Twitter上時(shí),微博搜索出現(xiàn)了,社會(huì)化搜索的曙光也出現(xiàn)了。

我們可以做個(gè)對(duì)比:中國(guó)互聯(lián)網(wǎng)上有網(wǎng)站268萬(wàn)個(gè)(根據(jù)第31次CNNIC報(bào)告),主流搜索引擎索引的中文網(wǎng)頁(yè)數(shù)量為1000億;現(xiàn)在有三四千萬(wàn)微博用戶(hù)活躍,每天生產(chǎn)出2、3億條微博信息。微博上一年產(chǎn)生的數(shù)據(jù)量,幾乎等于中文互聯(lián)網(wǎng)有史以來(lái)產(chǎn)生的所有數(shù)據(jù)。

如此海量的信息,產(chǎn)生的價(jià)值無(wú)可估量。

由于微博是每個(gè)人都可以自由產(chǎn)生信息,比傳統(tǒng)網(wǎng)站經(jīng)過(guò)編輯的信息產(chǎn)生效率高出一兩個(gè)數(shù)量級(jí);微博實(shí)名認(rèn)證,每天有幾十萬(wàn)個(gè)實(shí)名認(rèn)證的企業(yè)、行業(yè)精英來(lái)產(chǎn)生內(nèi)容,在很多方面比傳統(tǒng)的互聯(lián)網(wǎng)新聞要可靠、值得信任。比如,同樣一條醫(yī)療信息,你是相信百度搜索出來(lái)的網(wǎng)頁(yè),還是相信協(xié)和醫(yī)院醫(yī)生的微博?

Social Graph凸顯朋友的價(jià)值

社交數(shù)據(jù)越來(lái)越體現(xiàn)出來(lái)在搜索上的價(jià)值,無(wú)論是Google這樣的傳統(tǒng)搜索引擎,還是Facebook、Twitter這樣的社交信息擁有者,都異曲同工的瞄準(zhǔn)了社交搜索這個(gè)全新的領(lǐng)域。在國(guó)內(nèi),以云云為代表的社交搜索也順勢(shì)而起,借助社交因素來(lái)優(yōu)化搜索,為用戶(hù)提供更準(zhǔn)確的搜索結(jié)果。

從技術(shù)角度來(lái)講,F(xiàn)acebook、Twitter跟云云的努力方向并不一致。

例如,搜索“北京最好吃的爆肚”,F(xiàn)acebook是先挑選你在Facebook上的朋友,再在他們發(fā)表的信息里搜索“爆肚”;而云云則是在需要你先登錄,綁定微博后獲知你的微博關(guān)系,再把你的微博好友“動(dòng)”過(guò)的包含“爆肚”的網(wǎng)頁(yè)挑出來(lái)(這個(gè)“動(dòng)”,意味著好友對(duì)網(wǎng)頁(yè)進(jìn)行了贊、轉(zhuǎn)發(fā)等動(dòng)作)。

理想狀態(tài)下,兩者都可以檢索到想要的結(jié)果,只不過(guò)體現(xiàn)在搜索結(jié)果頁(yè)上,一個(gè)是Facebook的一條內(nèi)容,一個(gè)是普通的中文網(wǎng)頁(yè)。(Facebook的搜索原理,僅是依據(jù)媒體報(bào)道推測(cè),未看到產(chǎn)品呈現(xiàn))

傳統(tǒng)搜索是分析網(wǎng)頁(yè)之間的關(guān)系,F(xiàn)acebook搜索是分析人與人之間的關(guān)系,是一種進(jìn)步和趨勢(shì)。加入“人”之后的搜索會(huì)更加精準(zhǔn)、更個(gè)性化,也更有效。

Web和People的互動(dòng),將提升搜索的價(jià)值

Facebook的搜索理論上很有用,因?yàn)槿烁酥g的關(guān)系(link)有價(jià)值。在搜索結(jié)果中,存在著大量并非絕對(duì)標(biāo)準(zhǔn)、僅對(duì)少部分人有意義的搜索結(jié)果:比如“小明愛(ài)吃的面包”,只對(duì)小明這個(gè)人周?chē)娜ψ?mdash;—小明的爸爸、小明的媽媽、小明的朋友有意義,別人對(duì)他愛(ài)吃什么面包沒(méi)興趣。

小明的媽媽搜“好吃的面包”,實(shí)際上可能是為了找“小明愛(ài)吃什么面包”,現(xiàn)在的搜索引擎99%是找不到好結(jié)果的。整合了社交數(shù)據(jù)之后,搜索結(jié)果的有效性就會(huì)大幅提升。因?yàn)樾∶鞯膵寢屧谛吕宋⒉┥详P(guān)注了小明,當(dāng)她搜“好吃的面包”時(shí),小明轉(zhuǎn)發(fā)過(guò)的面包網(wǎng)頁(yè)就會(huì)排在搜索結(jié)果前列,這樣就有了一個(gè)很棒的搜索結(jié)果。

另外,單純的搜索社交數(shù)據(jù)也是不夠的。就像Facebook一樣,只能搜索社交網(wǎng)絡(luò)上的信息顯得有些單薄,因?yàn)楝F(xiàn)在傳統(tǒng)的互聯(lián)網(wǎng)上也沉淀了大量有價(jià)值的內(nèi)容,無(wú)論是Wiki(中文互聯(lián)網(wǎng)上的百科)、問(wèn)答,還是傳統(tǒng)的論壇和社區(qū),都有不少有用的數(shù)據(jù)。必須是網(wǎng)頁(yè)和人的關(guān)系整合在一起,才是社會(huì)化搜索的發(fā)展方向。

關(guān)鍵詞搜索和語(yǔ)義搜索的不同

在現(xiàn)有的搜索里,“小明愛(ài)吃的面包”和“小明 面包”是兩種搜索方式。前面的語(yǔ)義搜索對(duì)用戶(hù)更加友好,但使得搜索引擎對(duì)自然語(yǔ)言的處理要求更高;后一種關(guān)鍵詞搜索是現(xiàn)在常用的方式,比如Google和百度搜索,大家還是更習(xí)慣于挑幾個(gè)詞來(lái)查詢(xún)。這種查詢(xún)處理起來(lái)簡(jiǎn)單,但搜索結(jié)果可能需要用戶(hù)進(jìn)一步的篩選,給普通用戶(hù)的搜索帶來(lái)困擾。

從目前報(bào)道的信息來(lái)看,F(xiàn)acebook的Social graph和蘋(píng)果的Siri類(lèi)似,都是用自然語(yǔ)言的語(yǔ)義搜索。如果這種搜索習(xí)慣在普通用戶(hù)中逐漸培養(yǎng)起來(lái)的話(huà),可能給Google和百度這樣的傳統(tǒng)引擎帶來(lái)麻煩,比如在Google上搜“我今天下午到哪兒去喝茶會(huì)遇到漂亮姑娘”,你猜Google會(huì)給一個(gè)什么結(jié)果?

關(guān)鍵詞:socialgraph搜素facebook

贊助商鏈接: