在人工智能領(lǐng)域的激烈競(jìng)爭(zhēng)中,新的王者似乎總是在不斷更迭。近期,阿里巴巴的通義千問QwQ-32B模型成為了算力供應(yīng)端的新寵,被視為即將大規(guī)模應(yīng)用的推理模型。
國家超算互聯(lián)網(wǎng)平臺(tái)近日宣布接入了阿里巴巴的通義千問大模型,并向外界提供QwQ-32B的API服務(wù),用戶可免費(fèi)獲取高達(dá)100萬次的tokens。這一舉措標(biāo)志著QwQ-32B在產(chǎn)業(yè)應(yīng)用上的重要一步。
不僅如此,眾多國產(chǎn)算力廠商也積極響應(yīng),紛紛推出或計(jì)劃推出針對(duì)QwQ-32B的算力部署方案。壁仞科技推出了基于壁礪TM106全系列一體機(jī)的解決方案,全面支持QwQ-32B大模型的推理。摩爾線程則利用大語言模型高速推理框架vLLM和MT Transformer推理引擎,成功部署了QwQ-32B。中國RISC-V芯片公司算能的SophNet云平臺(tái)、東南大學(xué)的昇騰國產(chǎn)算力平臺(tái)以及青云科技的AI算力云,也都接入了QwQ-32B模型。
業(yè)內(nèi)人士指出,作為推理模型,QwQ-32B的性價(jià)比成為行業(yè)關(guān)注的焦點(diǎn)。此前,DeepSeek-R1已經(jīng)在大模型推理場(chǎng)景中得到了廣泛應(yīng)用,但后續(xù)的模型必須提供更為出色的效果和成本數(shù)據(jù),才能取代DeepSeek-R1的地位。阿里巴巴官方透露,通義團(tuán)隊(duì)在冷啟動(dòng)基礎(chǔ)上,針對(duì)數(shù)學(xué)和編程任務(wù)、通用能力進(jìn)行了兩輪大規(guī)模強(qiáng)化學(xué)習(xí),使得QwQ-32B在32B的模型尺寸上,既能提供強(qiáng)大的推理能力,又能滿足較低的資源消耗需求,適合快速響應(yīng)或?qū)?shù)據(jù)安全要求高的應(yīng)用場(chǎng)景。
在一系列權(quán)威基準(zhǔn)測(cè)試中,QwQ-32B模型的表現(xiàn)令人矚目。它不僅在數(shù)學(xué)能力的AIME24評(píng)測(cè)集上,以及在評(píng)估代碼能力的LiveCodeBench中,與DeepSeek-R1表現(xiàn)相當(dāng),還遠(yuǎn)超OpenAI的o1-mini及相同尺寸的R1蒸餾模型。QwQ-32B還集成了與智能體Agent相關(guān)的能力,能夠在使用工具的同時(shí)進(jìn)行批判性思考,并根據(jù)環(huán)境反饋調(diào)整推理過程。
值得注意的是,一體機(jī)市場(chǎng)雖然因DeepSeek的火爆而迅速崛起,但業(yè)內(nèi)人士認(rèn)為,一體機(jī)可能并非最適合DeepSeek-R1的部署模式。與QwQ-32B的稠密架構(gòu)模型不同,DeepSeek采用的是稀疏MoE模型路線。以滿血版R1為例,其6710億參數(shù)至少需要671GB顯存,但每次推理時(shí),只有約0.55%的參數(shù)被激活,導(dǎo)致一體機(jī)中的大量算力未能高效利用。而QwQ-32B則遵循Apache 2.0協(xié)議開源,且可在消費(fèi)級(jí)顯卡上部署,這對(duì)于國產(chǎn)芯片來說,無疑是一個(gè)巨大的利好。
云計(jì)算行業(yè)分析師指出,自ChatGPT推出以來,生成式AI已成為云服務(wù)收入增長(zhǎng)的重要驅(qū)動(dòng)力。AI不再是云計(jì)算的應(yīng)用子集,而是推動(dòng)云戰(zhàn)略演進(jìn)的核心。以大模型與算力的相互促進(jìn)為例,大模型的發(fā)展已從單純的技術(shù)摸高,轉(zhuǎn)變?yōu)榧夹g(shù)摸高與工程創(chuàng)新并行;算力結(jié)構(gòu)也從單一的“預(yù)訓(xùn)練”,發(fā)展為“預(yù)訓(xùn)練+后訓(xùn)練+推理”的多元化結(jié)構(gòu),算力需求持續(xù)增長(zhǎng)。
阿里云作為行業(yè)內(nèi)的佼佼者,其遵循“AI驅(qū)動(dòng),公共云優(yōu)先”的戰(zhàn)略,將開源的千問大模型作為云計(jì)算的重要抓手。在最新一季的財(cái)報(bào)中,阿里云的AI收入已連續(xù)六個(gè)季度實(shí)現(xiàn)三位數(shù)增長(zhǎng),并推動(dòng)云收入重回兩位數(shù)增長(zhǎng),達(dá)到317億元。云+AI的估值邏輯,也帶動(dòng)了阿里巴巴股價(jià)的大幅上漲,市值飆升逾1100億美元。通過開源,阿里通義千問已成為國產(chǎn)算力平臺(tái)支持最多的大模型之一,并在海外被多家企業(yè)部署上云,提供API服務(wù)。
目前,通義千問在全球最大AI社區(qū)HuggingFace的熱門大模型榜上穩(wěn)居榜首,衍生模型數(shù)量超過10萬個(gè),超越美國llama,成為全球采用最廣泛的AI大模型。