近期,字節(jié)跳動(dòng)旗下的AI助手豆包在功能上進(jìn)行了一系列升級(jí),其中最引人注目的是其新增的圖片理解功能。據(jù)界面新聞透露,這一功能已經(jīng)在豆包App及PC端正式上線。
用戶現(xiàn)在可以在豆包的界面上發(fā)現(xiàn)新增的照片和相機(jī)按鈕,只需簡(jiǎn)單上傳圖片,豆包即可對(duì)圖片內(nèi)容進(jìn)行識(shí)別。這一“圖片理解”功能不僅能夠識(shí)別圖片中的元素和基本特征,還允許用戶通過它詢問特定景點(diǎn)的位置或某個(gè)角色出自哪部影視作品,大大增強(qiáng)了用戶的互動(dòng)體驗(yàn)。
不僅如此,豆包在視頻生成方面也有所突破。就在上個(gè)月,豆包推出了視頻生成內(nèi)測(cè)功能,用戶可以通過圖片和文字一鍵生成視頻,并享受動(dòng)態(tài)運(yùn)鏡和多鏡頭一致性的效果,同時(shí)風(fēng)格比例也可以隨意挑選,為用戶提供了更多元化的創(chuàng)作空間。
回顧之前的市場(chǎng)調(diào)研,IDC在9月發(fā)布的移動(dòng)端大模型應(yīng)用市場(chǎng)競(jìng)爭(zhēng)力分析研究報(bào)告顯示,豆包在市場(chǎng)影響力、用戶活躍度以及用戶粘性方面均有不俗表現(xiàn)。然而,由于其產(chǎn)品定位偏向娛樂化,用戶對(duì)豆包的體驗(yàn)要求也相對(duì)較高。盡管豆包在某些方面表現(xiàn)出色,但在功能豐富度上仍有待加強(qiáng),用戶體驗(yàn)維度還需進(jìn)一步提升。
此次圖片理解功能的上線,無疑為豆包增添了一個(gè)新的亮點(diǎn),也顯示了字節(jié)跳動(dòng)在AI技術(shù)方面的持續(xù)投入和創(chuàng)新。未來,隨著技術(shù)的不斷進(jìn)步和用戶需求的不斷變化,豆包還將繼續(xù)推出更多功能,以滿足用戶的多樣化需求。