OpenAI近期在ChatGPT中引入了一項(xiàng)革命性的新功能——圖像生成。這一變化得益于其先進(jìn)的GPT-4o多模態(tài)模型,使得ChatGPT用戶現(xiàn)在可以直接在聊天界面中創(chuàng)建圖像。
據(jù)悉,這一新功能將率先向ChatGPT Plus、Pro、Team以及免費(fèi)用戶開放,而企業(yè)和教育級(jí)別的用戶也將很快獲得使用權(quán)限。OpenAI的首席執(zhí)行官Sam Altman在周二的一場(chǎng)視頻直播中激動(dòng)地表示,他們推出了迄今為止最有趣、最酷的產(chǎn)品之一——直接在ChatGPT中生成原生圖像。
Altman坦誠(chéng),這一功能備受用戶期待,特別是在競(jìng)爭(zhēng)對(duì)手如Google Gemini自2024年年中便開始提供集成圖像生成功能的大背景下。現(xiàn)在,ChatGPT用戶可以根據(jù)提示、對(duì)話內(nèi)容以及上傳的文件來(lái)生成圖像,無(wú)論是創(chuàng)造全新的圖像還是對(duì)現(xiàn)有圖像進(jìn)行轉(zhuǎn)換,都變得輕而易舉。
OpenAI強(qiáng)調(diào),GPT-4o模型中的世界知識(shí)訓(xùn)練使得ChatGPT能夠更好地理解圖像的應(yīng)用場(chǎng)景。該模型還能更準(zhǔn)確地根據(jù)提示在圖像中呈現(xiàn)文本。用戶可以通過(guò)自然語(yǔ)言提示來(lái)優(yōu)化圖像,例如在設(shè)計(jì)視頻游戲角色時(shí),模型可以在用戶進(jìn)行多次調(diào)整后,依然保持視覺(jué)的一致性。
OpenAI希望用戶能夠利用這一工具來(lái)制作各種需要精確度的專業(yè)圖像,如圖表、信息圖表和品牌內(nèi)容,同時(shí)也適用于文字較多的圖像,如說(shuō)明海報(bào)和名片。它還能生成具有精確燈光和紋理的逼真圖像,以及受益于對(duì)話背景的視覺(jué)效果。
為了簡(jiǎn)化流程,OpenAI使用了單一的多模式模型來(lái)處理所有的圖像生成任務(wù),從而將ChatGPT定位為個(gè)人和專業(yè)圖像生成的首選工具。這一創(chuàng)新不僅提升了用戶體驗(yàn),也進(jìn)一步鞏固了OpenAI在人工智能領(lǐng)域的領(lǐng)先地位。