自O(shè)penAI在今年2月16日首次發(fā)布Sora以來,這款視頻生成模型一直備受爭議,被戲稱為“技術(shù)期貨”。然而,在經(jīng)歷了近十個月的等待后,Sora終于迎來了正式版,其能夠生成最高分辨率為1080p、時長最長可達(dá)20秒的視頻。OpenAI的首席執(zhí)行官更是將Sora正式版的發(fā)布比作視頻生成領(lǐng)域的GPT-1時刻。
然而,與GPT發(fā)布時國內(nèi)AI企業(yè)紛紛跟進(jìn)的情況不同,面對Sora,國內(nèi)AI企業(yè)的態(tài)度顯得更為復(fù)雜。一部分企業(yè)選擇了積極跟進(jìn),包括阿里巴巴、字節(jié)跳動、快手和騰訊等互聯(lián)網(wǎng)巨頭,以及智譜AI、MiniMax和愛詩科技等AI初創(chuàng)公司。這些企業(yè)紛紛發(fā)布了自家的視頻生成模型,并聲稱在某些方面已經(jīng)超越或達(dá)到了預(yù)覽版Sora的水平。
然而,并非所有國內(nèi)企業(yè)都對Sora持積極態(tài)度。百度和百川智能等企業(yè)明確表示不會跟進(jìn)Sora。百度創(chuàng)始人李彥宏更是直言,無論Sora多么火爆,百度都不會涉足這一領(lǐng)域。雖然月之暗面、商湯科技和零一萬物等公司也擁有文生視頻模型,但這些模型并未被作為重點發(fā)展對象。
這種分歧的背后,是國內(nèi)AI企業(yè)在技術(shù)路線和商業(yè)前景上的不同判斷。Sora的核心技術(shù)路線是Diffusion+Transformer相結(jié)合,通過文本、圖片和視頻作為提示詞進(jìn)行視頻生成。然而,對于這一技術(shù)路線的有效性和商業(yè)化前景,國內(nèi)企業(yè)存在非共識。
一些企業(yè)認(rèn)為,Sora雖然具有一定的技術(shù)突破,但仍然存在不少問題,如手部細(xì)節(jié)不準(zhǔn)確、動態(tài)過程中的一致性差等。Sora的商業(yè)化前景也充滿不確定性。一方面,視頻生成模型在ToB場景中的收費模式和投資回報比尚不明朗;另一方面,在ToC場景中,個人付費意愿不高,且視頻生成并非大眾日常使用的高頻場景。
在這種背景下,國內(nèi)AI企業(yè)開始根據(jù)自己的業(yè)務(wù)重要性和優(yōu)先級來確定是否跟進(jìn)Sora。以字節(jié)跳動和快手為例,這些企業(yè)以視頻為核心業(yè)務(wù),擁有成熟的數(shù)字基建和豐富的技術(shù)人才資源,因此幾乎第一時間選擇了跟進(jìn)。而百度等則更聚焦于大語言模型和多模態(tài)大模型的發(fā)展,并未將視頻生成作為重點。
還有一些企業(yè)對Sora持觀望態(tài)度。他們出于“恐懼錯過”的心理有所布局,但并不重點投入。這些企業(yè)認(rèn)為,視頻生成領(lǐng)域仍然充滿不確定性,需要更多的時間和資源來探索和發(fā)展。
總的來說,面對Sora這一新技術(shù),國內(nèi)AI企業(yè)表現(xiàn)出了不同的態(tài)度和策略。一些企業(yè)積極跟進(jìn),試圖在這一領(lǐng)域取得突破;一些企業(yè)則選擇觀望或放棄,將資源投入到其他更有前景的領(lǐng)域。這種分化不僅反映了國內(nèi)AI企業(yè)在技術(shù)路線和商業(yè)前景上的不同判斷,也預(yù)示著未來視頻生成領(lǐng)域的競爭將更加激烈和復(fù)雜。
然而,無論國內(nèi)AI企業(yè)如何選擇,大模型技術(shù)的發(fā)展都必將繼續(xù)下去。對于Sora這一新技術(shù),國內(nèi)企業(yè)不僅需要關(guān)注其技術(shù)本身的發(fā)展,更需要思考如何將其與自身的核心業(yè)務(wù)相結(jié)合,實現(xiàn)商業(yè)化和規(guī)?;陌l(fā)展。在這個過程中,企業(yè)需要不斷學(xué)習(xí)和借鑒OpenAI等領(lǐng)先企業(yè)的經(jīng)驗和技術(shù),同時也要保持自己的獨立思考和創(chuàng)新精神。