網易有道近期在人工智能領域邁出了重要一步,宣布成功研發(fā)并開源了名為“子曰-o1”的推理模型。這款模型以其獨特的分步式講解功能,在國內尚屬首次。
“子曰-o1”被定義為一款輕量級的14B參數(shù)單模型,其設計初衷是為了能在普通消費級顯卡上順利運行。通過采用先進的思維鏈技術,該模型能夠詳細展示解題步驟,憑借其強大的邏輯和推理能力,確保了更高的解題準確性,并且專門優(yōu)化了中文邏輯推理功能。
網易有道指出,當前市場上可供開源的模型數(shù)量有限,且這些模型通常參數(shù)規(guī)模龐大,無法在顯存較低的消費級顯卡上運行。盡管有些模型通過低比特量化技術實現(xiàn)了單卡部署,但這往往會導致在長思維鏈運行時出現(xiàn)不穩(wěn)定的情況。
為了解決這些問題,“子曰-o1”在開源時選擇了參數(shù)規(guī)模較小的基礎模型,確保能夠輕松進行單卡部署,并展現(xiàn)出強大的數(shù)學處理能力。通過進一步的輕量化處理,該模型能夠在消費級顯卡上流暢運行,其性能與云端部署的模型不相上下。
網易有道還強調,在壓縮模型規(guī)模的同時,“子曰-o1”利用思維鏈技術,成功打造出了國內首個能夠輸出分步式講解的思維鏈模型。這款僅14B參數(shù)的小規(guī)模模型,卻能夠復現(xiàn)OpenAI o1的單模型推理能力。為了直觀展示這一功能,網易有道還提供了相應的演示圖: