亚洲第一福利视频,欧美黑人粗大xxxxpp,国内精品一区二区三区,国产精品久久久久影院色

智快網 - 新科技與新能源行業網絡媒體

昆侖萬維Skywork-OR1系列模型:業界領先,全面開源免費,助力開發者

   發布時間:2025-04-13 22:56 作者:江紫萱

昆侖萬維近日宣布,其天工團隊在邏輯推理大模型領域取得了新的突破。基于首款中文邏輯推理大模型Skywork-o1,團隊推出了全面升級的Skywork-OR1(Open Reasoner 1)系列模型。

據悉,Skywork-OR1系列模型在邏輯推理性能上達到了業界領先水平,成功突破了大模型在邏輯理解與復雜任務求解方面的瓶頸。尤為昆侖萬維決定將這一系列模型全面開放并免費提供給開發者社區,以完全開源的形式助力技術創新。

此次開源涵蓋了三款高性能模型:Skywork-OR1-Math-7B,這是一款專注于數學領域的專項模型,同時擁有出色的代碼生成能力;Skywork-OR1-7B-Preview,融合了數學與代碼能力,是一款兼具通用性與專業性的模型;以及Skywork-OR1-32B-Preview,面向更高復雜度的任務,具備更強的推理能力,堪稱旗艦版本。

昆侖萬維采取了業界最高透明度的開源策略,不僅全面開源了模型權重和訓練數據集,還提供了完整的訓練代碼。所有資源均已在GitHub和Huggingface平臺上公開,為開發者提供了極大的便利。昆侖萬維還在Notion平臺上發布了配套的技術博客,詳細闡述了數據處理流程、訓練方法和關鍵技術發現,為社區提供了可復現的實踐參考。

目前,Skywork-OR1-7B和Skywork-OR1-32B的能力仍在持續提升中。昆侖萬維透露,將在兩周內發布這兩個模型的正式版本,并推出更為系統詳盡的技術報告,分享在推理模型訓練中的經驗與洞察。

在數學推理任務中,Skywork-OR1系列模型展現出了強大的實力。通用模型Skywork-OR1-7B-Preview和Skywork-OR1-32B-Preview在AIME24與AIME25數據集上均實現了同參數規模下的最優表現。而針對數學場景深度優化的專項模型Skywork-OR1-Math-7B更是取得了令人矚目的成績,在AIME24和AIME25上分別獲得了69.8和52.3的高分,遠超當前主流7B級別模型。

在競賽編程任務中,Skywork-OR1系列模型同樣表現出色。通用模型Skywork-OR1-7B-Preview與Skywork-OR1-32B-Preview在LiveCodeBench數據集上均取得了同等參數規模下的最優性能。特別是Skywork-OR1-32B-Preview,其代碼生成與問題求解能力已接近參數規模高達671B的DeepSeek-R1,實現了卓越的性價比。

Skywork-OR1-Math-7B不僅在數學推理任務上表現出色,還在代碼任務上展現出了較強的泛化能力。通過多階段GRPO訓練,該模型在復雜數學問題上實現了卓越表現,同時在代碼評測基準Livecodebench上的表現也從37.6%提升到43.6%,相比基線模型有了顯著提升。

Skywork-OR1-Math-7B的最終模型在AIME24和AIME25上的準確率分別達到69.8%和52.3%,超越了OpenAI-o3-mini (low),達到了當前尺寸下的最優性能。這一成績不僅驗證了昆侖萬維天工團隊訓練策略的有效性,也展示了Skywork-OR1系列模型在邏輯推理和代碼生成方面的強大實力。

 
 
更多>同類內容
全站最新
熱門內容
本欄最新
 
智快科技微信賬號
微信群

微信掃一掃
加微信拉群
電動汽車群
科技數碼群