阿里巴巴在科技創(chuàng)新的道路上再次邁出重要一步,正式推出了全新的推理模型——通義千問QwQ-32B,并宣布在全球范圍內以Apache2.0協(xié)議開源。這一舉措不僅意味著開發(fā)者可以免費獲取并使用這一尖端技術,還展現(xiàn)了阿里巴巴在推動AI技術普及和應用方面的堅定決心。
千問QwQ-32B是阿里巴巴通義團隊經(jīng)過多輪大規(guī)模強化學習訓練后的成果。在數(shù)學、代碼及通用能力上,該模型實現(xiàn)了顯著提升,其性能與業(yè)界知名的DeepSeek-R1模型不相上下。尤為千問QwQ-32B在保持高性能的同時,還極大地降低了部署成本,使得用戶即便在消費級顯卡上也能輕松實現(xiàn)本地部署。
據(jù)了解,千問QwQ-32B的研發(fā)過程歷經(jīng)艱辛。阿里巴巴通義團隊在冷啟動的基礎上,針對數(shù)學、編程任務以及通用能力進行了兩輪深入的大規(guī)模強化學習,最終在32B的模型尺寸上取得了令人矚目的推理能力提升。這一成果不僅驗證了大規(guī)模強化學習在提升模型性能方面的巨大潛力,也為未來的AI技術發(fā)展提供了寶貴經(jīng)驗。
在多個權威基準測試中,千問QwQ-32B的表現(xiàn)均十分亮眼。在數(shù)學能力測試AIME24評測集上,以及代碼能力評估LiveCodeBench中,千問QwQ-32B的表現(xiàn)與DeepSeek-R1相當,遠超OpenAI-o1-mini及相同尺寸的R1蒸餾模型。在由meta首席科學家楊立昆領銜的“最難LLMs評測榜”LiveBench、谷歌提出的指令遵循能力IFeval評測集,以及加州大學伯克利分校等提出的評估準確調用函數(shù)或工具方面的BFCL測試中,千問QwQ-32B均取得了超越DeepSeek-R1的優(yōu)異成績。
千問QwQ-32B不僅具備強大的推理能力,還具備低資源消耗的特點,非常適合需要快速響應或對數(shù)據(jù)安全要求較高的應用場景。開發(fā)者和企業(yè)可以在消費級硬件上輕松實現(xiàn)本地部署,并根據(jù)實際需求進行高度定制化的AI解決方案開發(fā)。這一特性無疑將極大地推動AI技術的普及和應用。
千問QwQ-32B還集成了與智能體Agent相關的能力,使其能夠在使用工具的同時進行批判性思考,并根據(jù)環(huán)境反饋調整推理過程。這一創(chuàng)新性的設計使得千問QwQ-32B在應對復雜問題時更加靈活和智能,也為未來的AI技術發(fā)展提供了新的思路。
目前,千問QwQ-32B已在多個平臺如魔搭社區(qū)、HuggingFace及GitHub上基于寬松的Apache2.0協(xié)議開源。用戶可以通過這些平臺免費下載模型進行本地部署,或者通過阿里云百煉平臺直接調用模型API服務。對于需要云端部署的用戶,阿里云PAI平臺提供了快速部署、模型微調、評測和應用搭建等一站式服務。用戶還可以選擇容器服務ACK搭配阿里云GPU算力(如GPU云服務器、容器計算服務ACS等),實現(xiàn)模型容器化部署和高效推理。
自2023年以來,阿里巴巴通義團隊已經(jīng)開源了200多款模型,涵蓋了文本生成、視覺理解/生成、語音理解/生成、文生圖及視頻模型等全模態(tài)領域,以及從0.5B到110B等全尺寸參數(shù)范圍。其中,千問Qwen系列模型在全球范圍內受到了廣泛關注和認可,衍生模型數(shù)量已突破10萬,成為全球最大的開源模型族群之一。