亚洲精品成人福利网站,无码伊人66久久大杳蕉网站谷歌,亚洲变态另类天堂av手机版,性猛交富婆╳xxx乱大交小说,无码精品国产va在线观看dvd

媒體界 - 推動(dòng)中國(guó)媒體行業(yè)創(chuàng)新,促進(jìn)業(yè)內(nèi)人士交流分享!

復(fù)旦百度聯(lián)手突破!音頻直接生成4K一小時(shí)長(zhǎng)視頻

   發(fā)布時(shí)間:2024-10-21 10:15 作者:顧雨柔

復(fù)旦大學(xué)與百度攜手推出全新AI模型——Hallo2,該模型已正式在GitHub開(kāi)源。Hallo2能夠生成長(zhǎng)達(dá)數(shù)小時(shí)、分辨率為4K的人物動(dòng)畫(huà),相較于前代模型,實(shí)現(xiàn)了顯著提升。

Hallo2模型基于latent diffusion models構(gòu)建,引入了數(shù)據(jù)增強(qiáng)方法,如patch-drop和高斯噪聲,有效提升了長(zhǎng)時(shí)間視頻的視覺(jué)一致性和時(shí)間連貫性。同時(shí),該模型還結(jié)合了向量量化生成對(duì)抗網(wǎng)絡(luò)和時(shí)間對(duì)齊技術(shù),確保了高分辨率視頻的質(zhì)量和流暢性。

Hallo2還創(chuàng)新性地將可調(diào)整的語(yǔ)義文本標(biāo)簽的肖像表情作為條件輸入,提高了生成內(nèi)容的可控性和多樣性。據(jù)項(xiàng)目頁(yè)面介紹,Hallo2是首個(gè)實(shí)現(xiàn)4K分辨率并生成長(zhǎng)達(dá)1小時(shí)音頻驅(qū)動(dòng)人像圖像動(dòng)畫(huà)的方法,且可通過(guò)文本提示進(jìn)行增強(qiáng)。

附Hallo2項(xiàng)目地址。

 
 
更多>同類內(nèi)容
全站最新
熱門(mén)內(nèi)容
本欄最新