英偉達近日宣布,其最新推出的DeepSeek-R1模型,在AI推理領域樹立了新的標桿。這款開放模型以其卓越的推理能力,為用戶提供了前所未有的智能體驗。
與傳統的AI模型不同,DeepSeek-R1并不直接給出答案,而是通過一系列復雜的推理過程,包括思路鏈、共識和搜索方法,來生成最佳答案。這一過程被稱為測試時間擴展,而DeepSeek-R1正是這一擴展定律的杰出代表。它充分展示了加速計算在AI推理中的關鍵作用。
由于能夠反復思考問題,DeepSeek-R1模型在推理過程中會產生更多的輸出標記,并延長生成周期。這種特性使得模型的質量不斷提高,為用戶提供了更高質量的響應。然而,要實現實時推理和更高質量的響應,需要大量的測試時計算,這也對推理部署的規模提出了更高的要求。
DeepSeek-R1在邏輯推理、數學、編碼和語言理解等任務中表現出色,其準確性遙遙領先。同時,它還具備高推理效率,能夠在短時間內完成復雜的推理任務。
為了讓開發人員能夠安全地試驗這些功能,并構建自己的專用代理,英偉達將6710億參數的DeepSeek-R1模型作為NVIDIA NIM微服務預覽版在build.nvidia.com上提供。這一舉措將極大地促進AI推理技術的發展和應用。
據悉,DeepSeek-R1 NIM微服務在單個NVIDIA HGX H200系統上每秒可處理多達3,872個令牌,性能強勁。開發人員可以通過應用程序編程接口(API)進行測試和試驗,這一接口預計很快將作為可下載的NIM微服務提供,成為NVIDIA AI Enterprise軟件平臺的一部分。
DeepSeek-R1 NIM微服務還支持行業標準API,簡化了部署過程。企業可以在其首選的加速計算基礎設施上運行NIM微服務,以最大限度地提高安全性和數據隱私。通過使用NVIDIA AI Foundry和NVIDIA NeMo軟件,企業還可以為專門的AI代理創建定制的DeepSeek-R1 NIM微服務。
這一創新不僅推動了AI推理技術的發展,也為開發人員和企業提供了更加便捷、高效的AI解決方案。隨著DeepSeek-R1的廣泛應用,我們有理由相信,未來的AI世界將更加智能、更加美好。