微軟公司于近期推出了一項(xiàng)名為“Windows Agent Arena”的基準(zhǔn)框架,旨在評(píng)估生成式AI智能體在Windows PC上的性能表現(xiàn)。該框架為研究人員和開(kāi)發(fā)者提供了構(gòu)建和測(cè)試AI智能體的平臺(tái)。
AI智能體具備理解用戶(hù)請(qǐng)求并自主執(zhí)行復(fù)雜操作的能力,可完成多達(dá)150項(xiàng)任務(wù),如安裝瀏覽器擴(kuò)展、修改文檔設(shè)置等。在Windows 11系統(tǒng)環(huán)境下,AI智能體的功能尤為突出。
例如,用戶(hù)只需簡(jiǎn)單語(yǔ)音指令,AI智能體便能完成一系列早晨設(shè)置,如打開(kāi)電子郵件、日歷和新聞網(wǎng)站,并匯總相關(guān)信息。AI智能體還能根據(jù)用戶(hù)需求調(diào)整系統(tǒng)設(shè)置或應(yīng)用配置。
具體示例包括在Microsoft Edge中啟用“請(qǐng)勿追蹤”、在VSCode中安裝pylance擴(kuò)展、更改搜索引擎、修改VLC設(shè)置以更改錄音存儲(chǔ)文件夾等。
微軟希望通過(guò)“Windows Agent Arena”吸引更多開(kāi)發(fā)者參與構(gòu)建AI智能體,推動(dòng)AI技術(shù)的發(fā)展。盡管當(dāng)前AI智能體的成功率仍有待提高,但其在理解和處理任務(wù)方面的能力正在不斷提升。
微軟的這一舉措不僅是推動(dòng)AI智能體發(fā)展的重要一步,也為未來(lái)AI智能體學(xué)習(xí)用戶(hù)習(xí)慣、自動(dòng)化日常任務(wù)、提高工作效率奠定了基礎(chǔ)。