阿里云發(fā)布全球最強開源模型Qwen2，性能超越眾多中國閉源模型

2024-06-07 16:37:17來源：威易網(wǎng)作者：

比中國閉源模型們更強的開源模型來了！6月7日，阿里云更新技術(shù)博客：重磅發(fā)布全球性能最強的開源模型Qwen2-72B，性能超過美國最強的開源模型Llama3-70B，也超過文心4.0、豆包pro、混元pro等眾多中國閉源大模型。所有

比中國閉源模型們更強的開源模型來了！6月7日，阿里云更新技術(shù)博客：重磅發(fā)布全球性能最強的開源模型Qwen2-72B，性能超過美國最強的開源模型Llama3-70B，也超過文心4.0、豆包pro、混元pro等眾多中國閉源大模型。所有人均可在魔搭社區(qū)和Hugging Face免費下載通義千問最新開源模型。

相比2月推出的通義千問Qwen1.5，Qwen2實現(xiàn)了整體性能的代際飛躍。在權(quán)威模型測評榜單OpenCompass中，此前開源的Qwen1.5-110B已領(lǐng)先于文心4.0等一眾中國閉源模型。剛剛開源的Qwen2-72B，整體性能相比Qwen1.5-110B又取得了大幅提升。

（圖說：在上海人工智能實驗室推出的OpenCompass大模型測評榜單上，此前開源的Qwen1.5-110B已領(lǐng)先于文心4.0等一眾中國閉源模型）

通義千問Qwen2系列模型大幅提升了代碼、數(shù)學(xué)、推理、指令遵循、多語言理解等能力。在MMLU、GPQA、HumanEval、GSM8K、BBH、MT-Bench、Arena Hard、LiveCodeBench等國際權(quán)威測評中，Qwen2-72B一舉斬獲十幾項世界冠軍，超過美國的Llama3。

（圖說：Qwen2-72B在十多個權(quán)威測評中獲得冠軍，超過美國的Llama3-70B模型）

通義千問團隊在技術(shù)博客中披露，Qwen2系列包含5個尺寸的預(yù)訓(xùn)練和指令微調(diào)模型，Qwen2-0.5B、Qwen2-1.5B、Qwen2-7B、Qwen2-57B-A14B和Qwen2-72B，其中Qwen2-57B-A14B為混合專家模型（MoE）。Qwen2所有尺寸模型都使用了GQA（分組查詢注意力）機制，以便讓用戶體驗到GQA帶來的推理加速和顯存占用降低的優(yōu)勢。

（圖說：Qwen2系列包含5個尺寸的預(yù)訓(xùn)練和指令微調(diào)模型）

在中英文之外，模型訓(xùn)練數(shù)據(jù)中增加了27種語言相關(guān)的高質(zhì)量數(shù)據(jù)，提升了模型的多語言能力。Qwen2還增大了上下文長度支持，Qwen2-72B-Instruct能夠完美處理128k上下文長度內(nèi)的信息抽取任務(wù)。

魔搭社區(qū)模型下載地址：

Qwen2-72B https://modelscope.cn/models/qwen/Qwen2-72B

Qwen2-72B-Instruct https://modelscope.cn/models/qwen/Qwen2-72B-Instruct

據(jù)悉，通義千問Qwen系列模型正在全球爆火，總下載量一個月內(nèi)翻了一倍，已突破1600萬次。全球開源社區(qū)已經(jīng)出現(xiàn)了超過1500款基于Qwen二次開發(fā)的模型。Qwen系列的72B、110B模型多次登頂HuggingFace 的Open LLM Leaderboard開源模型榜單。

阿里云CTO周靖人表示，“堅持開源開放是阿里云的重要策略，我們希望打造一朵AI時代最開放的云，讓算力更普惠、讓AI更普及。”

（圖說：眾多開源平臺和工具第一時間支持Qwen2）

自2023年8月開源以來，通義千問在全球開源社區(qū)生態(tài)中已形成重要影響力。6月7日，Qwen2系列模型的API第一時間登陸阿里云百煉平臺。TensorRT-LLM、OpenVINO、OpenCompass、XTuner、LLaMA-Factory、Firefly、OpenBuddy、vLLM、Ollama等眾多全球開源平臺和工具，也第一時間宣布支持Qwen2最新款模型。除了美國Llama開源生態(tài)之外，通義千問已成為全球開發(fā)者的另一主流選項。

關(guān)鍵詞：阿里云

阿里云發(fā)布全球最強開源模型Qwen2，性能超越眾多中國閉源模型

相關(guān)閱讀:

阿里云發(fā)布全球最強開源模型Qwen2，性能超越眾多中國閉源模型