近期,字節(jié)跳動旗下的AI助手豆包在功能上進行了一系列升級,其中最引人注目的是其新增的圖片理解功能。據(jù)界面新聞透露,這一功能已經(jīng)在豆包App及PC端正式上線。
用戶現(xiàn)在可以在豆包的界面上發(fā)現(xiàn)新增的照片和相機按鈕,只需簡單上傳圖片,豆包即可對圖片內(nèi)容進行識別。這一“圖片理解”功能不僅能夠識別圖片中的元素和基本特征,還允許用戶通過它詢問特定景點的位置或某個角色出自哪部影視作品,大大增強了用戶的互動體驗。
不僅如此,豆包在視頻生成方面也有所突破。就在上個月,豆包推出了視頻生成內(nèi)測功能,用戶可以通過圖片和文字一鍵生成視頻,并享受動態(tài)運鏡和多鏡頭一致性的效果,同時風(fēng)格比例也可以隨意挑選,為用戶提供了更多元化的創(chuàng)作空間。
回顧之前的市場調(diào)研,IDC在9月發(fā)布的移動端大模型應(yīng)用市場競爭力分析研究報告顯示,豆包在市場影響力、用戶活躍度以及用戶粘性方面均有不俗表現(xiàn)。然而,由于其產(chǎn)品定位偏向娛樂化,用戶對豆包的體驗要求也相對較高。盡管豆包在某些方面表現(xiàn)出色,但在功能豐富度上仍有待加強,用戶體驗維度還需進一步提升。
此次圖片理解功能的上線,無疑為豆包增添了一個新的亮點,也顯示了字節(jié)跳動在AI技術(shù)方面的持續(xù)投入和創(chuàng)新。未來,隨著技術(shù)的不斷進步和用戶需求的不斷變化,豆包還將繼續(xù)推出更多功能,以滿足用戶的多樣化需求。