近日,可靈AI宣布了一項(xiàng)重大更新,正式推出了可靈2.0視頻生成模型與可圖2.0圖像生成模型,這一消息引起了全球用戶的廣泛關(guān)注。
作為AI領(lǐng)域的佼佼者,可靈AI此次的2.0版本升級(jí),在多個(gè)方面實(shí)現(xiàn)了顯著的提升。據(jù)官方介紹,可靈2.0視頻生成模型在動(dòng)態(tài)質(zhì)量、語(yǔ)義響應(yīng)以及畫(huà)面美學(xué)上均有了長(zhǎng)足的進(jìn)步,而可圖2.0圖像生成模型則更加注重指令遵循、電影質(zhì)感及藝術(shù)風(fēng)格的表現(xiàn)。
自去年6月上線以來(lái),可靈AI的用戶規(guī)模迅速擴(kuò)張,目前全球用戶數(shù)量已突破2200萬(wàn)大關(guān)。在這短短的時(shí)間內(nèi),用戶通過(guò)可靈AI累計(jì)生成了1.68億個(gè)視頻和3.44億張圖片素材,這一數(shù)據(jù)無(wú)疑彰顯了其強(qiáng)大的生成能力和用戶的廣泛認(rèn)可。月活用戶數(shù)量更是在10個(gè)月內(nèi)增長(zhǎng)了25倍,這一增速令人矚目。
在發(fā)布會(huì)上,快手高級(jí)副總裁蓋坤分享了他對(duì)可靈AI的期待與愿景。他提到,早在去年三四月份,當(dāng)他首次看到可靈AI的DiT模型產(chǎn)出結(jié)果時(shí),就萌生了一個(gè)念頭——何時(shí)能用AI將自己心目中的《三體》拍攝出來(lái)。這一愿景不僅展現(xiàn)了蓋坤對(duì)可靈AI的厚望,也反映了AI在影視創(chuàng)作領(lǐng)域的巨大潛力。
然而,蓋坤也坦言,當(dāng)前AI視頻生成領(lǐng)域仍存在諸多挑戰(zhàn)。各家視頻模型在語(yǔ)義分析能力和動(dòng)態(tài)質(zhì)量上都存在共性問(wèn)題,如AI無(wú)法精準(zhǔn)理解創(chuàng)作者的文字表達(dá),以及生成的物體運(yùn)動(dòng)過(guò)快或不符合物理規(guī)律等。為了解決這些問(wèn)題,可靈AI在2.0版本中提出了全新的交互理念——Multi-modal Visual Language(MVL)。
MVL由TXT(Pure Text,語(yǔ)義骨架)和MMW(Multi-modal-document as a Word,多模態(tài)描述子)組成,它允許用戶結(jié)合圖像參考、視頻片段等多模態(tài)信息,將腦海中復(fù)雜多維度的創(chuàng)意直接傳達(dá)給AI。這一理念的提出,無(wú)疑為AI視頻生成領(lǐng)域帶來(lái)了革命性的突破。
基于MVL理念,可靈AI推出了多模態(tài)編輯功能,該功能不僅局限于圖片和視頻,還可以引入聲音、運(yùn)動(dòng)軌跡等其他模態(tài)的信息。同時(shí),可靈2.0大師版也應(yīng)運(yùn)而生,它在語(yǔ)義響應(yīng)、動(dòng)態(tài)質(zhì)量和畫(huà)面美學(xué)等方面實(shí)現(xiàn)了進(jìn)一步提升,并上線了新的多模態(tài)視頻編輯功能。這一功能允許創(chuàng)作者在一段視頻的基礎(chǔ)上,通過(guò)輸入圖片或文字,對(duì)生成的視頻內(nèi)容進(jìn)行靈活的二次編輯和處理。
在圖像生成領(lǐng)域,可圖2.0同樣表現(xiàn)出色。它具備復(fù)雜語(yǔ)義理解能力、電影級(jí)的畫(huà)面質(zhì)感以及多條件的可控風(fēng)格化生成等優(yōu)勢(shì)。新版本的可圖2.0提升了指令遵循能力,增強(qiáng)了電影美學(xué)表現(xiàn)力,并支持60多種風(fēng)格化的效果轉(zhuǎn)繪??蓤D2.0還上線了圖像可控編輯功能,包括局部重繪和擴(kuò)圖等,讓用戶可以對(duì)圖片進(jìn)行增加、修改和修復(fù)。
除了面向C端訂閱用戶提供服務(wù)外,可靈AI還積極開(kāi)拓B端市場(chǎng),為商家提供API接入等服務(wù)。目前,已有超過(guò)1.5萬(wàn)名開(kāi)發(fā)者將可靈的API應(yīng)用于不同行業(yè)場(chǎng)景中,累計(jì)生成的圖像和視頻素材數(shù)量龐大。這一舉措不僅拓寬了可靈AI的應(yīng)用范圍,也為其帶來(lái)了可觀的商業(yè)價(jià)值。
為了進(jìn)一步激發(fā)AI愛(ài)好者的創(chuàng)作熱情,可靈AI還發(fā)布了“可靈AI NextGen 新影像創(chuàng)投計(jì)劃”。該計(jì)劃將投入千萬(wàn)資金,為全球創(chuàng)作者提供宣發(fā)、IP打造和保障等全方位支持。通過(guò)全資出品、聯(lián)合出品和技術(shù)支持等合作方式,可靈AI致力于打造一個(gè)充滿活力的AIGC創(chuàng)作生態(tài)。