OpenAI近日宣布,其ChatGPT移動應用將新增一項高級功能——屏幕與實時視頻共享,旨在提升用戶聊天體驗,讓溝通更為直觀與高效。這項功能的推出,意味著用戶無需再通過上傳照片或文字描述來分享所見所感,直接利用手機攝像頭即可與ChatGPT進行視覺交流。
屏幕和視頻共享功能在提升聊天便捷性的同時,也引發了對于個人隱私安全的關注。畢竟,這賦予了OpenAI更多訪問用戶敏感信息的權限。不過,OpenAI強調,他們將在保障用戶隱私的前提下,提供這一創新服務。
據悉,用戶只需在ChatGPT聊天欄中點擊語音圖標,即可進入高級語音模式,進而開啟屏幕和視頻共享功能。該功能原本計劃在GPT-4o發布時同步推出,但當時僅提供了音頻模式。如今,隨著技術的不斷成熟,用戶終于能夠利用手機攝像頭與ChatGPT進行視覺互動,讓AI模型“親眼”見證用戶的所見所聞。
在OpenAI的直播演示中,首席產品官Kevin Weil與團隊成員展示了ChatGPT如何協助制作手沖咖啡。通過將手機攝像頭對準咖啡機,ChatGPT不僅理解了咖啡機的操作原理,還成功指導團隊完成了咖啡的沖泡過程。團隊還演示了ChatGPT如何通過理解手機上的公開消息來支持屏幕共享功能,其中Weil佩戴圣誕老人胡須的畫面更是增添了不少趣味性。
OpenAI表示,這項功能將率先在大多數國家向ChatGPT Plus、Pro以及Team用戶開放。對于Enterprise和Edu用戶而言,他們則將在明年1月開始體驗這一新功能。歐盟、瑞士、冰島、挪威和列支敦士登等地區的ChatGPT Plus和Pro用戶也將很快迎來這一更新。
在OpenAI宣布這一消息之前,谷歌已經展示了其Astra項目的進展。Astra是一款實驗性的人工智能助手,通過安卓應用程序或原型眼鏡來記錄人類所看到的世界。而谷歌新推出的Gemini 2.0則進一步升級了視覺和音頻處理能力,并具備了更多代理功能,能夠代表用戶執行多步驟任務。目前,Gemini 2.0的代理功能以三個不同名稱存在:通用AI助手項目Astra、特定AI任務項目Mariner以及開發人員項目Jules。