9月9日,字節(jié)跳動 Seed 團隊宣布推出豆包圖像創(chuàng)作模型 Seedream 4.0。該模型支持文生圖、圖像編輯及多圖參考等功能,多模態(tài)生圖效果、速度和可用性在專業(yè)評測中達到業(yè)界領先水平。
目前,Seedream 4.0 已在豆包App、即夢AI、扣子等產(chǎn)品正式上線,用戶可以免費體驗。該模型也已通過火山引擎開放給企業(yè)客戶。
Seed 團隊表示,“Seedream 4.0 不僅僅是一個圖像生成模型,更是一個具備知識和思考能力的多模態(tài)創(chuàng)意引擎。”
測試案例顯示,Seedream 4.0 不僅能理解物理規(guī)律與時間約束、三維空間等復雜語境,還能在解謎、填字、續(xù)寫漫畫等任務中保持風格一致與細節(jié)精致,邏輯推理和創(chuàng)意生成能力表現(xiàn)出色。

Seedream 4.0 測試效果(Prompt:六個小時后這個圖片的場景是什么樣子)
據(jù)介紹,Seedream 4.0 可靈活支持文本、圖像的組合輸入,抽取不同圖片元素進行創(chuàng)作,還可一次生成角色連貫、風格統(tǒng)一的組圖,實現(xiàn)表情包、連環(huán)畫等各類創(chuàng)意玩法。
同時,該模型支持高度自由的藝術(shù)風格遷移,最高可生成 4K 分辨率的商用級圖像,并具備出色的文字渲染能力,還可處理基礎的公式、表格、統(tǒng)計圖等復雜排版,廣泛適用于教育、電商、廣告設計、影視后期等應用場景。

Seedream 4.0測試效果(Prompt:參考圖2的風格,將圖1做風格轉(zhuǎn)換)
基于高效的模型架構(gòu)和多層推理加速,Seedream 4.0 實現(xiàn)了高質(zhì)量和高效生成的平衡。Seed 官網(wǎng)顯示,Seedream 4.0 在各維度專業(yè)評測的綜合表現(xiàn)排名業(yè)界前列,視覺美感、速度等關鍵指標成績突出,并展現(xiàn)出較強的可靠性。

圖:MagicBench “文生圖”及“單圖編輯”人工評測基準(數(shù)據(jù)來源:Seed官網(wǎng))
Seed 團隊表示,圖像創(chuàng)作正在從文生圖進入多模態(tài)交互的新階段,Seedream 4.0 已具備通用多模態(tài)創(chuàng)意引擎的雛形。團隊將繼續(xù)探索更實時的交互式生成體驗,進一步深度融合多模態(tài)推理與世界知識,更好地幫助用戶激發(fā)靈感、實現(xiàn)創(chuàng)意。