Sora發(fā)布后，中國視頻生成賽道走向何方？

發(fā)布時間：2024-12-12 09:27 來源：鈦媒體APP 作者：蘇婉清

自O(shè)penAI在今年2月16日首次發(fā)布Sora以來，這款視頻生成模型一直備受爭議，被戲稱為“技術(shù)期貨”。然而，在經(jīng)歷了近十個月的等待后，Sora終于迎來了正式版，其能夠生成最高分辨率為1080p、時長最長可達(dá)20秒的視頻。OpenAI的首席執(zhí)行官更是將Sora正式版的發(fā)布比作視頻生成領(lǐng)域的GPT-1時刻。

然而，與GPT發(fā)布時國內(nèi)AI企業(yè)紛紛跟進(jìn)的情況不同，面對Sora，國內(nèi)AI企業(yè)的態(tài)度顯得更為復(fù)雜。一部分企業(yè)選擇了積極跟進(jìn)，包括阿里巴巴、字節(jié)跳動、快手和騰訊等互聯(lián)網(wǎng)巨頭，以及智譜AI、MiniMax和愛詩科技等AI初創(chuàng)公司。這些企業(yè)紛紛發(fā)布了自家的視頻生成模型，并聲稱在某些方面已經(jīng)超越或達(dá)到了預(yù)覽版Sora的水平。

然而，并非所有國內(nèi)企業(yè)都對Sora持積極態(tài)度。百度和百川智能等企業(yè)明確表示不會跟進(jìn)Sora。百度創(chuàng)始人李彥宏更是直言，無論Sora多么火爆，百度都不會涉足這一領(lǐng)域。雖然月之暗面、商湯科技和零一萬物等公司也擁有文生視頻模型，但這些模型并未被作為重點發(fā)展對象。

這種分歧的背后，是國內(nèi)AI企業(yè)在技術(shù)路線和商業(yè)前景上的不同判斷。Sora的核心技術(shù)路線是Diffusion+Transformer相結(jié)合，通過文本、圖片和視頻作為提示詞進(jìn)行視頻生成。然而，對于這一技術(shù)路線的有效性和商業(yè)化前景，國內(nèi)企業(yè)存在非共識。

一些企業(yè)認(rèn)為，Sora雖然具有一定的技術(shù)突破，但仍然存在不少問題，如手部細(xì)節(jié)不準(zhǔn)確、動態(tài)過程中的一致性差等。Sora的商業(yè)化前景也充滿不確定性。一方面，視頻生成模型在ToB場景中的收費模式和投資回報比尚不明朗；另一方面，在ToC場景中，個人付費意愿不高，且視頻生成并非大眾日常使用的高頻場景。

在這種背景下，國內(nèi)AI企業(yè)開始根據(jù)自己的業(yè)務(wù)重要性和優(yōu)先級來確定是否跟進(jìn)Sora。以字節(jié)跳動和快手為例，這些企業(yè)以視頻為核心業(yè)務(wù)，擁有成熟的數(shù)字基建和豐富的技術(shù)人才資源，因此幾乎第一時間選擇了跟進(jìn)。而百度等則更聚焦于大語言模型和多模態(tài)大模型的發(fā)展，并未將視頻生成作為重點。

還有一些企業(yè)對Sora持觀望態(tài)度。他們出于“恐懼錯過”的心理有所布局，但并不重點投入。這些企業(yè)認(rèn)為，視頻生成領(lǐng)域仍然充滿不確定性，需要更多的時間和資源來探索和發(fā)展。

總的來說，面對Sora這一新技術(shù)，國內(nèi)AI企業(yè)表現(xiàn)出了不同的態(tài)度和策略。一些企業(yè)積極跟進(jìn)，試圖在這一領(lǐng)域取得突破；一些企業(yè)則選擇觀望或放棄，將資源投入到其他更有前景的領(lǐng)域。這種分化不僅反映了國內(nèi)AI企業(yè)在技術(shù)路線和商業(yè)前景上的不同判斷，也預(yù)示著未來視頻生成領(lǐng)域的競爭將更加激烈和復(fù)雜。

然而，無論國內(nèi)AI企業(yè)如何選擇，大模型技術(shù)的發(fā)展都必將繼續(xù)下去。對于Sora這一新技術(shù)，國內(nèi)企業(yè)不僅需要關(guān)注其技術(shù)本身的發(fā)展，更需要思考如何將其與自身的核心業(yè)務(wù)相結(jié)合，實現(xiàn)商業(yè)化和規(guī)?；陌l(fā)展。在這個過程中，企業(yè)需要不斷學(xué)習(xí)和借鑒OpenAI等領(lǐng)先企業(yè)的經(jīng)驗和技術(shù)，同時也要保持自己的獨立思考和創(chuàng)新精神。