盛大文學(xué)問鼎國(guó)際數(shù)據(jù)挖掘競(jìng)賽

2014-11-07 15:31:26來源:威易網(wǎng)作者:

數(shù)據(jù)挖掘技術(shù)誰最強(qiáng)?首次在中國(guó)大陸舉辦的CMKI CUP(國(guó)際數(shù)據(jù)挖掘競(jìng)賽)日前閉幕,盛大文學(xué)力克ebay等等國(guó)際強(qiáng)勁對(duì)手,以優(yōu)異成績(jī)摘得本次競(jìng)賽的桂冠。這不僅顯示了盛大文學(xué)在用戶需求挖掘方面的實(shí)力,也代表了 “大數(shù)據(jù)”時(shí)代,中國(guó)在數(shù)據(jù)挖掘和信息檢索方面的國(guó)際領(lǐng)先地位。

數(shù)據(jù)挖掘技術(shù)誰最強(qiáng)?首次在中國(guó)大陸舉辦的CMKI CUP(國(guó)際數(shù)據(jù)挖掘競(jìng)賽)日前閉幕,盛大文學(xué)力克ebay等等國(guó)際強(qiáng)勁對(duì)手,以優(yōu)異成績(jī)摘得本次競(jìng)賽的桂冠。這不僅顯示了盛大文學(xué)在用戶需求挖掘方面的實(shí)力,也代表了 “大數(shù)據(jù)”時(shí)代,中國(guó)在數(shù)據(jù)挖掘和信息檢索方面的國(guó)際領(lǐng)先地位。

CIKM的全稱是International Conference on Information and Knowledge Management,是信息檢索和知識(shí)管理領(lǐng)域的國(guó)際著名學(xué)術(shù)會(huì)議,堪稱數(shù)據(jù)挖掘和信息檢索方面技術(shù)的“奧林匹克”,今年首次在中國(guó)大陸舉行,會(huì)議邀請(qǐng)到了Google的大神級(jí)人物Jeff Dean、微軟的執(zhí)行副總裁陸奇博士和德國(guó)Max Planck Institute for Informatics的Gerhard Weikum教授擔(dān)任主講人,盛況空前。

\

由盛大文學(xué)首席數(shù)據(jù)官陳運(yùn)文博士帶領(lǐng)的“TOPdata”團(tuán)隊(duì),占據(jù)主場(chǎng)之利與全世界的數(shù)據(jù)挖掘科學(xué)家們一較高下——競(jìng)賽的目標(biāo)是通過機(jī)器學(xué)習(xí)技術(shù)來識(shí)別用戶查詢意圖(Query Intent Detection,QID)。主辦方聯(lián)合了百度公司,提供了百度線上的6千余萬行用戶的真實(shí)查詢?nèi)罩竞忘c(diǎn)擊行為數(shù)據(jù),要求參賽隊(duì)伍根據(jù)用戶的行為數(shù)據(jù),設(shè)計(jì)算法來自動(dòng)判讀出用戶的需求意圖。例如當(dāng)用戶在搜索“北京上海”時(shí),同時(shí)還在查詢“上海 天氣”、“高鐵車票”等信息時(shí),計(jì)算機(jī)要能聰明地判斷出用戶的需求是“從北京到上海的出行”并返回相對(duì)應(yīng)的各類高價(jià)值的信息。參賽隊(duì)伍所開發(fā)的系統(tǒng),對(duì)用戶意圖的識(shí)別既要全面又要準(zhǔn)確。比賽一共吸引了全球遍布學(xué)術(shù)界和企業(yè)界的520支隊(duì)伍參賽,盛大文學(xué)代表隊(duì)所設(shè)計(jì)的算法,通過周密的用戶行為特征分析,和多個(gè)機(jī)器學(xué)習(xí)算法的訓(xùn)練和融合技術(shù),在比賽中不斷超越,最終以優(yōu)異的成績(jī)一舉奪魁。

\

據(jù)悉,參加此次競(jìng)賽的盛大文學(xué)數(shù)據(jù)團(tuán)隊(duì)承擔(dān)了全公司大數(shù)據(jù)相關(guān)系統(tǒng)的研發(fā)工作,負(fù)責(zé)從海量的文學(xué)作品和用戶數(shù)據(jù)中挖掘高價(jià)值的內(nèi)容,不但讀者們提供高質(zhì)量的各類服務(wù),也為文學(xué)作品版權(quán)的衍生如影視劇改編、游戲改編等業(yè)務(wù)提供了大量的數(shù)據(jù)指導(dǎo)和幫助。“盛大文學(xué)是全球最大的社區(qū)驅(qū)動(dòng)型網(wǎng)絡(luò)文學(xué)平臺(tái),在我們首創(chuàng)的網(wǎng)絡(luò)文學(xué)模式下創(chuàng)造出來的內(nèi)容,天生就帶來了完整的覆蓋了內(nèi)容、社區(qū)、流量、用戶屬性和用戶行為等全方位的海量數(shù)據(jù)”,陳運(yùn)文表示:“我們的團(tuán)隊(duì)就是在這樣的‘數(shù)據(jù)海洋’中天天鍛煉,拿世界冠軍,舍我其誰?!”

最新文章