在AI領(lǐng)域,一家名為DeepSeek的中國(guó)初創(chuàng)公司正迅速嶄露頭角。據(jù)鳳凰網(wǎng)科技報(bào)道,這家僅成立一年多的企業(yè),其AI模型已取得了令人矚目的突破性進(jìn)展,性能可與世界頂級(jí)聊天機(jī)器人相媲美,但成本卻大幅低于后者,這一成就讓美國(guó)硅谷感到震驚。
DeepSeek的異軍突起打破了業(yè)界的傳統(tǒng)認(rèn)知。過(guò)去,人們普遍認(rèn)為AI的未來(lái)發(fā)展需要巨大的算力和能源投入作為支撐。然而,DeepSeek的創(chuàng)新成果卻似乎顛覆了這一觀念。隨著其引發(fā)的熱潮不斷升溫,投資者開始重新評(píng)估它對(duì)美國(guó)競(jìng)爭(zhēng)對(duì)手及其硬件供應(yīng)商的影響,這也導(dǎo)致全球科技股在本月底出現(xiàn)了大幅下跌。
DeepSeek由量化基金幻方量化的負(fù)責(zé)人梁文峰于2023年創(chuàng)立。該公司開發(fā)的AI模型采取了開源策略,這意味著整個(gè)開發(fā)人員社區(qū)都可以參與檢查和改進(jìn)軟件。去年1月初,DeepSeek的移動(dòng)應(yīng)用一經(jīng)發(fā)布,便迅速在美國(guó)iPhone下載排行榜上登頂。
DeepSeek的AI模型與其他聊天機(jī)器人的顯著區(qū)別在于,它會(huì)在對(duì)提示做出響應(yīng)之前闡明其推理過(guò)程。該公司聲稱,其R1版本提供的性能與OpenAI的最新版本相當(dāng),并已向有興趣使用該技術(shù)開發(fā)聊天機(jī)器人的個(gè)人授予許可。這一舉措進(jìn)一步擴(kuò)大了DeepSeek的影響力。
雖然DeepSeek并未全面披露其R1新模型的細(xì)節(jié),但該模型的訓(xùn)練和開發(fā)成本似乎僅為OpenAI或meta等巨頭最強(qiáng)產(chǎn)品的一小部分。R1的高效率不禁讓人對(duì)業(yè)界是否需要繼續(xù)投入巨資購(gòu)買英偉達(dá)等公司的最新、最強(qiáng)大的AI加速器產(chǎn)生質(zhì)疑。同時(shí),這也讓外界更加關(guān)注美國(guó)針對(duì)中國(guó)的先進(jìn)AI芯片出口管制政策。
DeepSeek的R1模型在多個(gè)主要基準(zhǔn)測(cè)試中表現(xiàn)出色,接近或超越了競(jìng)爭(zhēng)對(duì)手的模型。例如,在測(cè)試數(shù)學(xué)能力的AIME 2024、測(cè)試常識(shí)的MMLU和測(cè)試問(wèn)答性能的Alpacaeval 2.0等測(cè)試中,R1均取得了優(yōu)異成績(jī)。它還在加州大學(xué)伯克利分校研究生開發(fā)的AI系統(tǒng)排名網(wǎng)站Chatbot Arena上名列前茅。
自發(fā)布最早模型以來(lái),DeepSeek一直備受關(guān)注。去年11月,它向世界預(yù)覽了旨在模仿人類思維的DeepSeek R1推理模型,該模型為其移動(dòng)聊天機(jī)器人應(yīng)用提供了技術(shù)支持。再加上網(wǎng)頁(yè)版,這款聊天機(jī)器人迅速成為全球知名的廉價(jià)OpenAI替代品。硅谷知名投資人馬克·安德森甚至將其稱為“AI的斯普特尼克時(shí)刻”,這一稱謂源自冷戰(zhàn)時(shí)期的歷史術(shù)語(yǔ),現(xiàn)已成為一種隱喻,用來(lái)描述某個(gè)事件或時(shí)刻引發(fā)的強(qiáng)烈危機(jī)感或緊迫感。
根據(jù)市場(chǎng)追蹤公司App Figures的數(shù)據(jù),截至今年1月25日,DeepSeek移動(dòng)應(yīng)用已被下載超過(guò)160萬(wàn)次,并在澳大利亞、加拿大、中國(guó)、新加坡、美國(guó)和英國(guó)的iPhone應(yīng)用商店中排名第一。這一成績(jī)充分展示了DeepSeek在全球范圍內(nèi)的受歡迎程度。
DeepSeek的創(chuàng)始人梁文峰出生于1985年,廣東人,擁有浙江大學(xué)電子與信息工程學(xué)士和碩士學(xué)位。他以1000萬(wàn)元人民幣的注冊(cè)資本創(chuàng)立了DeepSeek。在接受媒體采訪時(shí),梁文峰表示,進(jìn)一步進(jìn)步的瓶頸不是更多的融資,而是美國(guó)對(duì)獲得最佳芯片的限制。他強(qiáng)調(diào),中國(guó)需要發(fā)展自己的國(guó)內(nèi)生態(tài)系統(tǒng),類似于圍繞英偉達(dá)及其人工智能芯片構(gòu)建的生態(tài)系統(tǒng)。
在中國(guó)的AI行業(yè)中,DeepSeek憑借其開源策略脫穎而出。這一策略旨在快速吸引最多的用戶,并在龐大用戶基礎(chǔ)上制定創(chuàng)收策略。由于DeepSeek的模型更實(shí)惠,它已經(jīng)在協(xié)助降低中國(guó)AI開發(fā)商的成本。在過(guò)去一年半時(shí)間里,其他規(guī)模更大的公司在中國(guó)打起了價(jià)格戰(zhàn),出現(xiàn)了連續(xù)的降價(jià)浪潮。
DeepSeek的成功對(duì)全球AI市場(chǎng)產(chǎn)生了深遠(yuǎn)影響。它可能會(huì)促使OpenAI和其他美國(guó)AI供應(yīng)商降低價(jià)格以保持領(lǐng)先地位。同時(shí),這也引發(fā)了人們對(duì)meta、微軟等公司巨額支出的質(zhì)疑。這些公司已經(jīng)承諾將投入巨額資本支出用于AI基礎(chǔ)設(shè)施的建設(shè)。然而,如果效率更高的模型能夠用更少的投入與現(xiàn)有模型競(jìng)爭(zhēng),那么傳統(tǒng)的大規(guī)模資金投入模式將面臨挑戰(zhàn)。
DeepSeek的崛起還引發(fā)了全球股市動(dòng)蕩。投資者開始拋售英偉達(dá)、阿斯麥等受益于AI服務(wù)需求激增的公司股票。而與DeepSeek有關(guān)的中國(guó)公司股價(jià)則出現(xiàn)上漲。全球開發(fā)者已經(jīng)開始嘗試使用DeepSeek的軟件并希望基于它開發(fā)工具,這可能加速先進(jìn)AI推理模型的普及,但同時(shí)也可能引發(fā)更多關(guān)于如何設(shè)立使用護(hù)欄的擔(dān)憂。
盡管DeepSeek取得了顯著成就,但其云基礎(chǔ)設(shè)施可能會(huì)因其模型的突然走紅而受到考驗(yàn)。1月27日,該公司就經(jīng)歷了一次短暫的大宕機(jī)。隨著新老用戶向其聊天機(jī)器人提出更多問(wèn)題,DeepSeek將不得不應(yīng)對(duì)更大的流量挑戰(zhàn)。