DeepSeek崛起引全球關(guān)注，哪吒精神照進(jìn)AI世界？

發(fā)布時(shí)間：2025-02-03 16:24 來源：鈦媒體APP 作者：顧雨柔

近期，科技界與影視圈的兩個(gè)熱門話題意外地交織在一起，引發(fā)了廣泛關(guān)注。一方面，電影《哪吒2》以其深刻的劇情和視覺效果成為春節(jié)期間的熱門話題；另一方面，AI領(lǐng)域的后起之秀DeepSeek，憑借其在算法上的突破，成為業(yè)界焦點(diǎn)。

DeepSeek，這家并不為人所熟知的公司，近期因其創(chuàng)新的AI大模型技術(shù)而聲名鵲起。與眾多依賴算力堆疊的AI公司不同，DeepSeek選擇了一條獨(dú)特的道路——通過優(yōu)化算法結(jié)構(gòu)，實(shí)現(xiàn)了在較低算力條件下的高效性能。其MLA（多頭潛在注意力機(jī)制）、MoE（混合專家模型）以及多令牌預(yù)測（MPT）等技術(shù)，針對(duì)Transformer架構(gòu)中的瓶頸問題進(jìn)行了有效改進(jìn)，使得DeepSeek-R1模型能夠在相對(duì)較少的英偉達(dá)H800 GPU上完成預(yù)訓(xùn)練，且成本大幅降低。

DeepSeek v3架構(gòu)概覽圖

DeepSeek的這一創(chuàng)新策略，不僅打破了AI行業(yè)對(duì)于算力的過度依賴，也為后續(xù)的低成本高性能AI模型開發(fā)提供了新的思路。據(jù)DeepSeek公布的跑分?jǐn)?shù)據(jù)顯示，其在數(shù)學(xué)、代碼、自然語言推理等任務(wù)上的性能，已與OpenAI的GPT模型相媲美，但價(jià)格僅為后者的3%。這一成績，無疑是對(duì)DeepSeek技術(shù)實(shí)力的有力證明。

值得注意的是，DeepSeek并未選擇追求“通用智能”的全面發(fā)展，而是從垂直場景切入，先在數(shù)學(xué)、代碼等領(lǐng)域?qū)崿F(xiàn)突破，再逐步擴(kuò)展至其他領(lǐng)域。這種策略不僅有助于DeepSeek在細(xì)分領(lǐng)域建立差異化優(yōu)勢，也為其快速成長提供了有力保障。同時(shí)，DeepSeek還宣布將模型免費(fèi)開源，這一舉措無疑為AI行業(yè)的生態(tài)發(fā)展注入了新的活力。

然而，DeepSeek的崛起并非一帆風(fēng)順。自其嶄露頭角以來，便遭受了來自多方面的質(zhì)疑和攻擊。部分國家和組織以數(shù)據(jù)安全和隱私保護(hù)為由，對(duì)DeepSeek展開了調(diào)查。同時(shí)，一些所謂的“極客”也開始對(duì)DeepSeek的技術(shù)細(xì)節(jié)發(fā)起攻擊，試圖證明其涉嫌“抄襲”或“技術(shù)不透明”。

更為嚴(yán)重的是，DeepSeek的服務(wù)器集群在春節(jié)期間遭受了大規(guī)模DDoS惡意攻擊。攻擊總量之大，相當(dāng)于整個(gè)歐洲三天的網(wǎng)絡(luò)流量總和。面對(duì)這一嚴(yán)峻挑戰(zhàn)，中國互聯(lián)網(wǎng)企業(yè)迅速響應(yīng)，360安全響應(yīng)中心、華為云、中國紅客聯(lián)盟等多家企業(yè)紛紛加入保衛(wèi)戰(zhàn)，經(jīng)過83個(gè)小時(shí)的鏖戰(zhàn)，成功將攻擊流量壓制97.2%，捍衛(wèi)住了DeepSeek和中國AI產(chǎn)業(yè)的尊嚴(yán)。

盡管DeepSeek在技術(shù)和生態(tài)層面取得了顯著成績，但其仍面臨著諸多挑戰(zhàn)。算力作為大模型可持續(xù)發(fā)展的必要條件，仍是DeepSeek需要克服的短板。盡管其通過算法優(yōu)化降低了算力需求，但在實(shí)際應(yīng)用中，算力仍是一個(gè)不可忽視的因素。因此，DeepSeek需要在保持技術(shù)創(chuàng)新的同時(shí)，逐步加強(qiáng)算力建設(shè)，以確保其技術(shù)的可持續(xù)性和競爭力。

在這場中美AI角力下，DeepSeek的出現(xiàn)無疑為行業(yè)帶來了新的思考和啟示。其以技術(shù)突破打破封鎖、用開源生態(tài)重構(gòu)行業(yè)規(guī)則的理念，無疑為AI行業(yè)的未來發(fā)展提供了新的方向。盡管前路未知且充滿挑戰(zhàn)，但DeepSeek所展現(xiàn)出的勇氣和決心，已足以令人振奮。

更多>同類內(nèi)容