中美頂尖LLM差距僅5個(gè)月？凱富·李這樣說(shuō)！

發(fā)布時(shí)間：2024-10-17 20:14 來(lái)源：ITBEAR 作者：沈如風(fēng)

近日，有傳言稱中國(guó)六大主流大型語(yǔ)言模型公司中有數(shù)家已放棄預(yù)訓(xùn)練。對(duì)此，零一無(wú)限創(chuàng)始人李凱夫于周三明確反駁，表示零一無(wú)限從未且永遠(yuǎn)不會(huì)放棄預(yù)訓(xùn)練，并強(qiáng)調(diào)其預(yù)訓(xùn)練既快速又出色。

李凱夫在新旗艦預(yù)訓(xùn)練模型“Yi-Lightning”（閃電模型）發(fā)布會(huì)上發(fā)表上述言論。他指出，Yi-Lightning是一款“高性價(jià)比的頂級(jí)模型”，在推理速度和價(jià)格上具有顯著優(yōu)勢(shì)。該模型的最高生成速度提升了近40%，每百萬(wàn)標(biāo)記的成本僅為0.99元，且在此定價(jià)下仍能實(shí)現(xiàn)盈利。

李凱夫表示：“這是中國(guó)首個(gè)在國(guó)際權(quán)威榜單上排名極高、超越多數(shù)美國(guó)主流模型、并首超全球領(lǐng)先的OpenAI GPT-4o的模型。Yi-Lightning閃電模型不僅具備世界級(jí)模型性能和極快的推理速度，而且價(jià)格極低，非常適合應(yīng)用調(diào)用和企業(yè)應(yīng)用場(chǎng)景?！?/p>

在會(huì)后討論中，李凱夫回應(yīng)了關(guān)于中國(guó)預(yù)訓(xùn)練是否落后于美國(guó)的問(wèn)題。他坦言中國(guó)確實(shí)存在差距，但強(qiáng)調(diào)某些觀點(diǎn)夸大了這一差距，認(rèn)為中國(guó)落后十年甚至更久。他提到，通過(guò)精確計(jì)算，今年五月由GPT-4o開(kāi)發(fā)的模型已被零一無(wú)限超越?！叭绻娴囊?jì)算中國(guó)超越美國(guó)還需要多久，至少零一無(wú)限的01.AI模型僅比OpenAI的模型落后五個(gè)月?！?/p>

01.AI成立于2023年5月16日，致力于創(chuàng)建一個(gè)新的AI 2.0平臺(tái)和面向全球的AI優(yōu)先生產(chǎn)力應(yīng)用公司。其核心團(tuán)隊(duì)成員來(lái)自谷歌、微軟、IBM和百度等知名企業(yè)。

在融資方面，01.AI已完成三輪融資，其中包括由阿里巴巴領(lǐng)投的2.5億美元（約18.08億元人民幣）的Pre-A輪融資，估值超過(guò)10億美元，成為一家獨(dú)角獸企業(yè)。

在產(chǎn)品與商業(yè)化方面，01.AI專注于海外To C（消費(fèi)者級(jí)）付費(fèi)市場(chǎng)和國(guó)內(nèi)To B（企業(yè)級(jí)）付費(fèi)市場(chǎng)。針對(duì)B端和C端的布局，李凱夫表示，大型模型公司同時(shí)涉足To B和To C領(lǐng)域頗具挑戰(zhàn)，需要多樣化的管理策略，因?yàn)閮申?duì)團(tuán)隊(duì)在基因、運(yùn)營(yíng)方式和KPI考核等方面存在差異。

李凱夫進(jìn)一步解釋說(shuō)，在To C領(lǐng)域，公司主要瞄準(zhǔn)海外市場(chǎng)，因?yàn)閲?guó)內(nèi)To C產(chǎn)品的流量成本是一個(gè)重大問(wèn)題，在當(dāng)前充滿挑戰(zhàn)的環(huán)境中需要謹(jǐn)慎判斷。他提到：“對(duì)于To C，我們主要關(guān)注海外市場(chǎng)，原因有幾個(gè)：當(dāng)我們開(kāi)始零一無(wú)限的工作時(shí)，國(guó)內(nèi)沒(méi)有合適的中文模型，所以我們不得不先在海外嘗試。一段時(shí)間后，我們獲得了經(jīng)驗(yàn)，并迭代了一、二、三款產(chǎn)品。其中一些產(chǎn)品表現(xiàn)非常好，而其他產(chǎn)品則不那么成功，我們也在不斷調(diào)整。同時(shí)，我們也在觀察何時(shí)適合在國(guó)內(nèi)推出某些產(chǎn)品。國(guó)內(nèi)To C產(chǎn)品的流量成本正在上升，我們注意到一些競(jìng)爭(zhēng)對(duì)手的用戶獲取成本從十幾元上漲到三十多元，最近用戶流失也相當(dāng)嚴(yán)重。在這樣充滿挑戰(zhàn)的環(huán)境中，我們會(huì)非常謹(jǐn)慎，目前不會(huì)在中國(guó)推出新的To C應(yīng)用。我們將繼續(xù)維護(hù)現(xiàn)有產(chǎn)品，但更多精力將放在以較低成本在海外獲取高質(zhì)量用戶，或直接銷售應(yīng)用并通過(guò)訂閱收費(fèi)。海外的訂閱習(xí)慣相對(duì)成熟。這些是主要原因。目前，海外To C產(chǎn)品能讓我們平衡盈利能力和用戶增長(zhǎng)成本。我們將關(guān)注國(guó)內(nèi)機(jī)會(huì)，待時(shí)機(jī)成熟再行動(dòng)?！?/p>

目前，零一無(wú)限再次選擇優(yōu)化預(yù)訓(xùn)練模型，并在發(fā)布會(huì)上首次展示了其新ToB戰(zhàn)略下的首個(gè)行業(yè)應(yīng)用產(chǎn)品——AI 2.0數(shù)字人，專注于國(guó)內(nèi)零售和電商To B業(yè)務(wù)場(chǎng)景。

李凱夫表示：“生成響應(yīng)依賴于我們的Yi-Lightning大型模型，某家酒店和旅游公司的GMV銷售額因此飆升了170%。我認(rèn)為，對(duì)于大型模型公司而言，最好的方法不是銷售模型或使用模型進(jìn)行客戶服務(wù)應(yīng)用，而是理解用戶的完整需求，并創(chuàng)建一個(gè)端到端的綜合解決方案。這樣，購(gòu)買大型模型和數(shù)字人的公司每次使用時(shí)都能立即看到利潤(rùn)，用得越多賺得越多，從而增加他們向我們付費(fèi)的意愿?！?/p>

關(guān)于成本問(wèn)題，李凱夫透露，零一無(wú)限的預(yù)訓(xùn)練使用了2000個(gè)GPU，耗時(shí)一個(gè)半月，成本超過(guò)三百萬(wàn)美元，但這僅是Grok成本的1%-2%。

更多>同類內(nèi)容