Meta公司推出Llama 3:開源大模型的新里程碑,性能媲美GPT-4

2024-04-19 09:05:53來(lái)源:威易網(wǎng)作者:

在人工智能技術(shù)迅猛發(fā)展的今天,Meta公司再次引領(lǐng)潮流,推出了備受期待的開源大模型——Llama 3。這一模型的發(fā)布,不僅標(biāo)志著Meta在AI領(lǐng)域的技術(shù)實(shí)力,也預(yù)示著開源模型在與閉源模型的競(jìng)爭(zhēng)中邁出了堅(jiān)實(shí)的一步。

在人工智能技術(shù)迅猛發(fā)展的今天,Meta公司再次引領(lǐng)潮流,推出了備受期待的開源大模型——Llama 3。這一模型的發(fā)布,不僅標(biāo)志著Meta在AI領(lǐng)域的技術(shù)實(shí)力,也預(yù)示著開源模型在與閉源模型的競(jìng)爭(zhēng)中邁出了堅(jiān)實(shí)的一步。

當(dāng)?shù)貢r(shí)間4月18日,Meta公司正式發(fā)布了Llama 3,這一消息立即在AI界引起了廣泛關(guān)注。Meta首席執(zhí)行官馬克·扎克伯格宣布,基于Llama 3模型的AI助手現(xiàn)已全面覆蓋Instagram、WhatsApp、Facebook等Meta全系應(yīng)用,并且單獨(dú)開啟了網(wǎng)站,提供圖像生成器功能,可根據(jù)自然語(yǔ)言提示詞生成圖片。

\

Llama 3模型在多個(gè)關(guān)鍵基準(zhǔn)測(cè)試中性能優(yōu)于業(yè)界先進(jìn)同類模型,尤其在代碼生成等任務(wù)上實(shí)現(xiàn)了全面領(lǐng)先。它能夠進(jìn)行復(fù)雜的推理,更遵循指令,能夠可視化想法并解決許多微妙的問(wèn)題。Llama 3的主要亮點(diǎn)包括基于超過(guò)15T token的訓(xùn)練,支持8K長(zhǎng)文本,改進(jìn)的tokenizer具有128K token的詞匯量,以及訓(xùn)練效率比Llama 2高3倍。

目前發(fā)布的8B和70B版本的Llama 3模型已用于Meta AI助手,并且面向開發(fā)者進(jìn)行了開源,包括預(yù)訓(xùn)練和微調(diào)版本。Meta計(jì)劃在今年推出正式版Llama 3,目前用4000億個(gè)參數(shù)進(jìn)行訓(xùn)練,MMLU得分達(dá)到85分。此外,Meta還宣布與谷歌建立新的合作伙伴關(guān)系,在助手的答復(fù)中包括實(shí)時(shí)搜索結(jié)果。

Llama 3的推出,正值開源與閉源AI模型優(yōu)劣之爭(zhēng)的熱議之際。Meta堅(jiān)定地選擇了開源路線,認(rèn)為開源對(duì)社區(qū)和公司都有好處,因?yàn)榭梢源龠M(jìn)創(chuàng)新。Llama 3的發(fā)布,不僅為開源模型扳回一局,也為AI未來(lái)的發(fā)展提供了新的方向。

Meta表示,Llama 3是在兩個(gè)定制的24K GPU集群上、基于超過(guò)15T token的數(shù)據(jù)上進(jìn)行了訓(xùn)練,是迄今為止最強(qiáng)大的Llama模型。公司還計(jì)劃在未來(lái)幾個(gè)月內(nèi)推出更多具備多模態(tài)、多語(yǔ)言對(duì)話、更長(zhǎng)上下文窗口等能力的新模型。

Llama 3的發(fā)布,不僅是Meta公司在AI領(lǐng)域的一次重大技術(shù)突破,也是開源AI模型發(fā)展史上的重要里程碑。隨著Llama 3的開源,我們有理由相信,它將為全球的AI研究和應(yīng)用帶來(lái)深遠(yuǎn)的影響,推動(dòng)整個(gè)行業(yè)向更智能、更開放的未來(lái)發(fā)展。

關(guān)鍵詞:LlamaMetaAI