月之暗面公司旗下的人工智能項目Kimi,近日推出了其最新研發(fā)的數(shù)學(xué)推理模型k0-math。據(jù)第一財經(jīng)和新浪科技的聯(lián)合報道,這款新模型在數(shù)學(xué)能力方面表現(xiàn)出色,足以與OpenAI的o1系列模型中的o1-mini和o1-preview相媲美。
Kimi的k0-math模型經(jīng)歷了嚴(yán)格的基準(zhǔn)測試。測試結(jié)果顯示,在中考、高考、考研以及包含入門競賽題的MATH等四個不同級別的數(shù)學(xué)基準(zhǔn)測試中,k0-math初代模型的成績均超越了o1-mini和o1-preview。在更為復(fù)雜的競賽級別數(shù)學(xué)題庫OMNI-MATH和AIME的基準(zhǔn)測試中,k0-math也分別達(dá)到了o1-mini最高成績的90%和83%,展現(xiàn)出強大的數(shù)學(xué)推理能力。
月之暗面的創(chuàng)始人楊植麟對k0-math的表現(xiàn)給予了高度評價。他認(rèn)為,數(shù)學(xué)場景是鍛煉AI思考能力的最佳場所。通過在數(shù)學(xué)領(lǐng)域的深入學(xué)習(xí)和訓(xùn)練,AI能夠不斷提升其邏輯推理、問題解決和創(chuàng)新能力。
楊植麟還透露,k0-math模型以及更高級的Kimi探索版將在未來幾周內(nèi)陸續(xù)上線。用戶將能夠通過Kimi網(wǎng)頁版和Kimi智能助手App體驗到這款強大的數(shù)學(xué)推理模型。