近日,AI領域迎來了一則震撼消息,深度求索公司旗下的AI智能助手應用DeepSeek,成功在蘋果App Store美區下載榜上超越了ChatGPT,一舉奪得免費應用榜榜首的位置。
據悉,DeepSeek AI助手之所以能夠獲得如此耀眼的成績,離不開其背后強大的技術支持。該應用采用了總參數超過600B的DeepSeek-V3大模型,這一模型不僅支持智能對話、AI搜索等常規功能,更在深度思考、文件上傳等方面展現出了卓越的能力。
深度求索公司在本月早些時候,即1月20日,已經正式發布了DeepSeek-R1模型,并同步開源了模型權重。據官方介紹,DeepSeek-R1在后訓練階段大規模使用了強化學習技術,即使在標注數據極少的情況下,也能顯著提升模型的推理能力。這一模型在數學、代碼、自然語言推理等任務上的表現,已經可以與OpenAI的GPT-o1正式版相媲美。
不僅如此,根據第三方基準測試的結果顯示,DeepSeek-R1在某些方面甚至已經超越了包括OpenAI、meta和Anthropic在內的一些知名人工智能公司。為了推動技術的進一步開源和共享,深度求索公司此次將DeepSeek-R1的訓練技術全部公開,并在發布和開源R1的同時,對協議授權進行了相應的調整。
具體來說,DeepSeek公司決定將模型開源License統一使用MIT標準,這一標準化的、寬松的開源協議將完全開放源代碼,不限制商用,也無需申請。為了進一步促進技術的傳播和應用,DeepSeek還明確允許用戶進行“模型蒸餾”,即用戶可以利用模型輸出,通過模型蒸餾等方式訓練其他模型。這一舉措無疑將極大地推動AI技術的發展和普及。