首批!商湯「日日新·商量」通過國(guó)內(nèi)首個(gè)官方“大模型標(biāo)準(zhǔn)符合性測(cè)試”

2024-09-04 21:21:54來源:威易網(wǎng)作者:

作為首批通過該國(guó)家標(biāo)準(zhǔn)的大模型,商湯·日日新-商量在38個(gè)功能測(cè)試項(xiàng)中全部通過,其中包括理解能力、生成能力。

 日前,全國(guó)首個(gè)官方“大模型標(biāo)準(zhǔn)符合性測(cè)試”公布結(jié)果:商湯·日日新-商量大語言模型符合國(guó)家標(biāo)準(zhǔn)《人工智能預(yù)訓(xùn)練模型第2部分:評(píng)測(cè)指標(biāo)與方法》語言大模型的相關(guān)技術(shù)要求,通用性、智能性等維度達(dá)到國(guó)家相關(guān)標(biāo)準(zhǔn)。

 \

“大模型預(yù)訓(xùn)練模型測(cè)試” 是由中國(guó)電子技術(shù)標(biāo)準(zhǔn)化研究院發(fā)起,旨在建立大模型標(biāo)準(zhǔn)符合性名錄,引領(lǐng)人工智能產(chǎn)業(yè)健康有序發(fā)展。該評(píng)測(cè)對(duì)外征集了學(xué)術(shù)界、產(chǎn)業(yè)界幾十家頭部單位意見,圍繞多維度展開,涵蓋語言、語音、視覺等多模態(tài)領(lǐng)域,是基于官方大模型測(cè)試基準(zhǔn)的權(quán)威評(píng)測(cè)。

作為首批通過該國(guó)家標(biāo)準(zhǔn)的大模型,商湯·日日新-商量在38個(gè)功能測(cè)試項(xiàng)中全部通過,其中包括理解能力、生成能力。
其中,理解能力測(cè)試部分進(jìn)行了文本分析能力、信息抽取能力、推理能力、任務(wù)分解、知識(shí)問答、編程代碼理解等測(cè)試。生成能力測(cè)試部分進(jìn)行了摘要總結(jié)能力、模板化文本生成能力、機(jī)器翻譯、文本改寫、編程代碼生成、結(jié)構(gòu)化數(shù)據(jù)生成等測(cè)試。

通過國(guó)家標(biāo)準(zhǔn)符合性測(cè)試,意味著未來可以在更廣泛的場(chǎng)景中應(yīng)用,滿足不同行業(yè)和用戶的需求。事實(shí)上,目前,商湯在金融、手機(jī)、醫(yī)療、電信、汽車、地產(chǎn)、能源、傳媒、工業(yè)制造等眾多垂直行業(yè),已與上海電信、小米小愛、金山辦公、海通證券、筑夢(mèng)島等超過500家客戶建立深度合作,助力千行百業(yè)的企業(yè)解決實(shí)際應(yīng)用難題。
 
 
 
關(guān)鍵詞:商湯·日日新-商量