近日,阿里云宣布了一項(xiàng)重大開源舉措,正式推出了Qwen3系列模型。這一系列模型相較于DeepSeek-R1,參數(shù)量大幅減少至三分之一,為用戶提供了更為經(jīng)濟(jì)高效的解決方案。
緊接著,國(guó)家級(jí)算力服務(wù)平臺(tái)超算互聯(lián)網(wǎng)迅速響應(yīng),全面上線了Qwen3系列的所有模型。此次上線的模型涵蓋了六個(gè)Dense版本,從Qwen3-32B到Qwen3-0.6B,參數(shù)規(guī)模各異,滿足了不同用戶的需求。同時(shí),平臺(tái)還推出了兩款MoE模型,Qwen3-235B-A22B和Qwen3-30B-A3B,前者總參數(shù)超過(guò)2350億,激活參數(shù)達(dá)220多億,后者總參數(shù)為300億,激活參數(shù)為30億。
Qwen3系列模型基于Apache 2.0協(xié)議進(jìn)行開源,這意味著開發(fā)者與企業(yè)用戶均可以通過(guò)超算互聯(lián)網(wǎng)平臺(tái)輕松下載模型文件,進(jìn)行快速開發(fā)與部署。這一舉措極大地降低了技術(shù)門檻,促進(jìn)了人工智能技術(shù)的普及與應(yīng)用。
超算互聯(lián)網(wǎng)平臺(tái)還透露,正在積極籌備上線Qwen3系列的模型鏡像及應(yīng)用體驗(yàn)服務(wù)。屆時(shí),用戶將無(wú)需繁瑣的環(huán)境配置,即可通過(guò)零代碼的方式體驗(yàn)Qwen3的對(duì)話系統(tǒng),享受云端服務(wù)的便捷與高效。
在性能方面,Qwen3系列模型同樣表現(xiàn)出色。特別是Qwen3-235B-A22B,在編碼、數(shù)學(xué)及通用能力等基準(zhǔn)測(cè)試中展現(xiàn)出了強(qiáng)勁的實(shí)力,與當(dāng)前多款主流大模型相比毫不遜色。而小型MoE模型Qwen3-30B-A3B也憑借其顯著的激活參數(shù)優(yōu)勢(shì),在性能上遠(yuǎn)超QwQ-32B。即便是Qwen3系列中的輕量級(jí)模型Qwen3-4B,其性能也可與Qwen2.5-72B-Instruct相媲美,展現(xiàn)了Qwen3系列模型在性能優(yōu)化方面的卓越成就。