近日,有傳言稱中國(guó)六大主流大型語(yǔ)言模型公司中有數(shù)家已放棄預(yù)訓(xùn)練。對(duì)此,零一無(wú)限創(chuàng)始人李凱夫于周三明確反駁,表示零一無(wú)限從未且永遠(yuǎn)不會(huì)放棄預(yù)訓(xùn)練,并強(qiáng)調(diào)其預(yù)訓(xùn)練既快速又出色。
李凱夫在新旗艦預(yù)訓(xùn)練模型“Yi-Lightning”(閃電模型)發(fā)布會(huì)上發(fā)表上述言論。他指出,Yi-Lightning是一款“高性價(jià)比的頂級(jí)模型”,在推理速度和價(jià)格上具有顯著優(yōu)勢(shì)。該模型的最高生成速度提升了近40%,每百萬(wàn)標(biāo)記的成本僅為0.99元,且在此定價(jià)下仍能實(shí)現(xiàn)盈利。
李凱夫表示:“這是中國(guó)首個(gè)在國(guó)際權(quán)威榜單上排名極高、超越多數(shù)美國(guó)主流模型、并首超全球領(lǐng)先的OpenAI GPT-4o的模型。Yi-Lightning閃電模型不僅具備世界級(jí)模型性能和極快的推理速度,而且價(jià)格極低,非常適合應(yīng)用調(diào)用和企業(yè)應(yīng)用場(chǎng)景?!?/p>
在會(huì)后討論中,李凱夫回應(yīng)了關(guān)于中國(guó)預(yù)訓(xùn)練是否落后于美國(guó)的問題。他坦言中國(guó)確實(shí)存在差距,但強(qiáng)調(diào)某些觀點(diǎn)夸大了這一差距,認(rèn)為中國(guó)落后十年甚至更久。他提到,通過精確計(jì)算,今年五月由GPT-4o開發(fā)的模型已被零一無(wú)限超越?!叭绻娴囊?jì)算中國(guó)超越美國(guó)還需要多久,至少零一無(wú)限的01.AI模型僅比OpenAI的模型落后五個(gè)月。”
01.AI成立于2023年5月16日,致力于創(chuàng)建一個(gè)新的AI 2.0平臺(tái)和面向全球的AI優(yōu)先生產(chǎn)力應(yīng)用公司。其核心團(tuán)隊(duì)成員來自谷歌、微軟、IBM和百度等知名企業(yè)。
在融資方面,01.AI已完成三輪融資,其中包括由阿里巴巴領(lǐng)投的2.5億美元(約18.08億元人民幣)的Pre-A輪融資,估值超過10億美元,成為一家獨(dú)角獸企業(yè)。
在產(chǎn)品與商業(yè)化方面,01.AI專注于海外To C(消費(fèi)者級(jí))付費(fèi)市場(chǎng)和國(guó)內(nèi)To B(企業(yè)級(jí))付費(fèi)市場(chǎng)。針對(duì)B端和C端的布局,李凱夫表示,大型模型公司同時(shí)涉足To B和To C領(lǐng)域頗具挑戰(zhàn),需要多樣化的管理策略,因?yàn)閮申?duì)團(tuán)隊(duì)在基因、運(yùn)營(yíng)方式和KPI考核等方面存在差異。
李凱夫進(jìn)一步解釋說,在To C領(lǐng)域,公司主要瞄準(zhǔn)海外市場(chǎng),因?yàn)閲?guó)內(nèi)To C產(chǎn)品的流量成本是一個(gè)重大問題,在當(dāng)前充滿挑戰(zhàn)的環(huán)境中需要謹(jǐn)慎判斷。他提到:“對(duì)于To C,我們主要關(guān)注海外市場(chǎng),原因有幾個(gè):當(dāng)我們開始零一無(wú)限的工作時(shí),國(guó)內(nèi)沒有合適的中文模型,所以我們不得不先在海外嘗試。一段時(shí)間后,我們獲得了經(jīng)驗(yàn),并迭代了一、二、三款產(chǎn)品。其中一些產(chǎn)品表現(xiàn)非常好,而其他產(chǎn)品則不那么成功,我們也在不斷調(diào)整。同時(shí),我們也在觀察何時(shí)適合在國(guó)內(nèi)推出某些產(chǎn)品。國(guó)內(nèi)To C產(chǎn)品的流量成本正在上升,我們注意到一些競(jìng)爭(zhēng)對(duì)手的用戶獲取成本從十幾元上漲到三十多元,最近用戶流失也相當(dāng)嚴(yán)重。在這樣充滿挑戰(zhàn)的環(huán)境中,我們會(huì)非常謹(jǐn)慎,目前不會(huì)在中國(guó)推出新的To C應(yīng)用。我們將繼續(xù)維護(hù)現(xiàn)有產(chǎn)品,但更多精力將放在以較低成本在海外獲取高質(zhì)量用戶,或直接銷售應(yīng)用并通過訂閱收費(fèi)。海外的訂閱習(xí)慣相對(duì)成熟。這些是主要原因。目前,海外To C產(chǎn)品能讓我們平衡盈利能力和用戶增長(zhǎng)成本。我們將關(guān)注國(guó)內(nèi)機(jī)會(huì),待時(shí)機(jī)成熟再行動(dòng)?!?/p>
目前,零一無(wú)限再次選擇優(yōu)化預(yù)訓(xùn)練模型,并在發(fā)布會(huì)上首次展示了其新ToB戰(zhàn)略下的首個(gè)行業(yè)應(yīng)用產(chǎn)品——AI 2.0數(shù)字人,專注于國(guó)內(nèi)零售和電商To B業(yè)務(wù)場(chǎng)景。
李凱夫表示:“生成響應(yīng)依賴于我們的Yi-Lightning大型模型,某家酒店和旅游公司的GMV銷售額因此飆升了170%。我認(rèn)為,對(duì)于大型模型公司而言,最好的方法不是銷售模型或使用模型進(jìn)行客戶服務(wù)應(yīng)用,而是理解用戶的完整需求,并創(chuàng)建一個(gè)端到端的綜合解決方案。這樣,購(gòu)買大型模型和數(shù)字人的公司每次使用時(shí)都能立即看到利潤(rùn),用得越多賺得越多,從而增加他們向我們付費(fèi)的意愿。”
關(guān)于成本問題,李凱夫透露,零一無(wú)限的預(yù)訓(xùn)練使用了2000個(gè)GPU,耗時(shí)一個(gè)半月,成本超過三百萬(wàn)美元,但這僅是Grok成本的1%-2%。