Meta公司推出Llama 3：開源大模型的新里程碑，性能媲美GPT-4

2024-04-19 09:05:53來(lái)源：威易網(wǎng)作者：

在人工智能技術(shù)迅猛發(fā)展的今天，Meta公司再次引領(lǐng)潮流，推出了備受期待的開源大模型——Llama 3。這一模型的發(fā)布，不僅標(biāo)志著Meta在AI領(lǐng)域的技術(shù)實(shí)力，也預(yù)示著開源模型在與閉源模型的競(jìng)爭(zhēng)中邁出了堅(jiān)實(shí)的一步。

當(dāng)?shù)貢r(shí)間4月18日，Meta公司正式發(fā)布了Llama 3，這一消息立即在AI界引起了廣泛關(guān)注。Meta首席執(zhí)行官馬克·扎克伯格宣布，基于Llama 3模型的AI助手現(xiàn)已全面覆蓋Instagram、WhatsApp、Facebook等Meta全系應(yīng)用，并且單獨(dú)開啟了網(wǎng)站，提供圖像生成器功能，可根據(jù)自然語(yǔ)言提示詞生成圖片。

Llama 3模型在多個(gè)關(guān)鍵基準(zhǔn)測(cè)試中性能優(yōu)于業(yè)界先進(jìn)同類模型，尤其在代碼生成等任務(wù)上實(shí)現(xiàn)了全面領(lǐng)先。它能夠進(jìn)行復(fù)雜的推理，更遵循指令，能夠可視化想法并解決許多微妙的問(wèn)題。Llama 3的主要亮點(diǎn)包括基于超過(guò)15T token的訓(xùn)練，支持8K長(zhǎng)文本，改進(jìn)的tokenizer具有128K token的詞匯量，以及訓(xùn)練效率比Llama 2高3倍。

目前發(fā)布的8B和70B版本的Llama 3模型已用于Meta AI助手，并且面向開發(fā)者進(jìn)行了開源，包括預(yù)訓(xùn)練和微調(diào)版本。Meta計(jì)劃在今年推出正式版Llama 3，目前用4000億個(gè)參數(shù)進(jìn)行訓(xùn)練，MMLU得分達(dá)到85分。此外，Meta還宣布與谷歌建立新的合作伙伴關(guān)系，在助手的答復(fù)中包括實(shí)時(shí)搜索結(jié)果。

Llama 3的推出，正值開源與閉源AI模型優(yōu)劣之爭(zhēng)的熱議之際。Meta堅(jiān)定地選擇了開源路線，認(rèn)為開源對(duì)社區(qū)和公司都有好處，因?yàn)榭梢源龠M(jìn)創(chuàng)新。Llama 3的發(fā)布，不僅為開源模型扳回一局，也為AI未來(lái)的發(fā)展提供了新的方向。

Meta表示，Llama 3是在兩個(gè)定制的24K GPU集群上、基于超過(guò)15T token的數(shù)據(jù)上進(jìn)行了訓(xùn)練，是迄今為止最強(qiáng)大的Llama模型。公司還計(jì)劃在未來(lái)幾個(gè)月內(nèi)推出更多具備多模態(tài)、多語(yǔ)言對(duì)話、更長(zhǎng)上下文窗口等能力的新模型。

Llama 3的發(fā)布，不僅是Meta公司在AI領(lǐng)域的一次重大技術(shù)突破，也是開源AI模型發(fā)展史上的重要里程碑。隨著Llama 3的開源，我們有理由相信，它將為全球的AI研究和應(yīng)用帶來(lái)深遠(yuǎn)的影響，推動(dòng)整個(gè)行業(yè)向更智能、更開放的未來(lái)發(fā)展。

關(guān)鍵詞：Llama Meta AI

Meta公司推出Llama 3：開源大模型的新里程碑，性能媲美GPT-4

相關(guān)閱讀:

Meta公司推出Llama 3：開源大模型的新里程碑，性能媲美GPT-4