在科技界萬眾矚目的矚目下,OpenAI于本周二震撼發布了全新工具套件,旨在賦能開發者與企業,利用OpenAI的尖端AI模型和框架,打造能夠自主執行任務的智能代理系統。這些創新工具作為OpenAI新推出的Responses API的核心組成部分,預示著AI代理技術邁入了一個全新的發展階段。
Responses API的推出,標志著OpenAI正逐步取代其原有的Assistants API,計劃在2026年上半年全面完成這一過渡。通過該API,企業得以開發定制化的AI代理,這些代理能夠執行諸如網絡搜索、公司內部文檔檢索以及網頁瀏覽等復雜任務,其功能與OpenAI的Operator產品不相上下。
盡管近年來科技界對于AI代理的炒作聲浪此起彼伏,但真正能夠清晰定義并展示AI代理實際應用價值的案例卻寥寥無幾。例如,中國初創公司Butterfly Effect近期推出的Manus AI代理平臺,雖然在網絡上引發了廣泛關注,但很快便因未能兌現諸多承諾而遭到用戶的質疑。
面對這一挑戰,OpenAI深知讓AI代理穩定運行并廣泛應用的難度之大。OpenAI的API產品負責人Olivier Godement在接受采訪時坦言:“展示AI代理的功能或許輕而易舉,但要想將其規?;瘧茫⒆層脩纛l繁使用,卻是難上加難?!?/p>
為了破解這一難題,OpenAI在今年早些時候通過ChatGPT引入了Operator和Deep Research兩款AI代理工具,它們分別能夠代表用戶瀏覽網頁和編制研究報告。盡管這兩款工具初步展示了AI代理的潛力,但在自主性方面仍有待提升。如今,借助Responses API,OpenAI希望向開發者開放構建自主AI代理所需的組件,推動開發者創造出比現有應用更加智能的代理程序。
Responses API還內置了文件搜索工具,能夠迅速掃描公司數據庫中的文件以檢索信息,同時保證不會在這些文件上訓練模型。更重要的是,開發者可以利用OpenAI的計算機使用代理(CUA)模型,該模型為Operator提供了強大的支持,能夠生成鼠標和鍵盤操作,自動化執行數據輸入、應用程序工作流等任務。
然而,值得注意的是,Responses API并不能一蹴而就地解決當前AI代理面臨的所有技術難題。盡管AI搜索工具在準確性方面相較于傳統AI模型有所提升,但仍存在10%的事實問題錯誤率。同時,AI搜索工具在處理簡短導航查詢時也面臨挑戰,且ChatGPT的引用可靠性也備受爭議。
OpenAI在官方博客中指出,CUA模型在操作系統上自動執行任務時仍不夠可靠,且容易犯下“無意”錯誤。盡管如此,OpenAI強調這些僅是代理工具的早期版本,并承諾將持續努力進行改進。
除了Responses API外,OpenAI還推出了名為Agents SDK的開源工具包,為開發者提供了將模型與內部系統集成、實施保護措施以及監控AI代理活動所需的免費工具。這一工具包是OpenAI Swarm的升級版,后者是該公司去年年底發布的多代理編排框架。
Godement表示,他期望OpenAI能夠在今年內縮小AI代理演示與實際產品之間的差距,并堅信代理將成為未來最具影響力的AI應用之一。這一觀點與OpenAI首席執行官Sam Altman一月份的宣言不謀而合,Altman曾預言2025年將是AI代理進入勞動力市場的一年。
無論2025年是否真正迎來AI代理的爆發之年,OpenAI的最新發布都彰顯了其從華而不實的演示轉向打造具有實際影響力的工具的決心。隨著技術的不斷進步和應用場景的不斷拓展,AI代理或將逐步成為推動社會進步的重要力量。