據(jù)最新消息,谷歌正籌備在12月推出其大型動作模型“Project Jarvis”。據(jù)悉,這一項目將為用戶在網(wǎng)頁上執(zhí)行多項日常任務提供自動化支持,如研究收集、產(chǎn)品購買及航班預訂等。
“Jarvis”將由谷歌Gemini的未來版本驅(qū)動,并特別針對Chrome瀏覽器進行優(yōu)化。該工具通過截取屏幕截圖、解析內(nèi)容及自動執(zhí)行點擊、輸入等操作,以實現(xiàn)網(wǎng)頁任務的自動化。值得注意的是,目前該工具在執(zhí)行操作時存在數(shù)秒的間隔。
當前,各大AI公司均在研發(fā)類似功能的模型,包括微軟的Copilot Vision、蘋果的Apple Intelligence、Anthropic的Claude測試版及OpenAI的相關項目。
谷歌計劃首先向少量測試者發(fā)布“Jarvis”,以便發(fā)現(xiàn)并修復潛在的Bug,因此具體展示計劃可能會有所調(diào)整。