近日,亞馬遜云科技官方宣布,DeepSeek-R1模型已在AWS平臺上正式上線,這一消息引起了業界廣泛關注。
回顧不久前的AWS re:Invent大會,亞馬遜首席執行官Andy Jassy分享了公司在部署近1000個生成式AI應用過程中的寶貴經驗。他指出了三個核心觀察結果,這些觀察結果深刻影響了亞馬遜在企業AI實施上的策略。首先,隨著生成式AI應用規模的不斷擴大,計算成本的控制變得至關重要,用戶對性價比的追求愈發強烈。其次,構建一個真正出色的生成式AI應用其實相當具有挑戰性。最后,當給予開發者充分的自由去選擇他們想要構建的項目時,所使用的模型呈現出多樣化的趨勢。這并不意外,因為歷史一再證明,沒有一種工具能夠獨步天下。
Jassy強調,亞馬遜提供的廣泛且深入的模型庫,使客戶能夠根據自身獨特需求,選擇最合適的精確功能。AWS持續關注客戶需求和技術發展趨勢,不斷擴展其精選模型庫,將具有潛力的新模型與行業內成熟的熱門模型相結合。這種高性能和差異化模型產品的持續擴充,助力客戶始終保持在AI創新的最前沿。
提到AI創新,不得不提中國的人工智能初創公司DeepSeek。DeepSeek在2024年12月推出了DeepSeek-V3模型,緊接著在2025年1月20日,又發布了DeepSeek-R1、擁有6710億參數的DeepSeek-R1-Zero以及參數范圍在157億至700億的DeepSeek-R1-Distill模型。僅僅一周后,他們又增添了基于視覺的Janus-Pro-7B模型。這些模型不僅公開可用,而且據報道,其成本比同類模型低90%-95%,極具性價比。
DeepSeek表示,他們的模型在推理能力上表現突出,這得益于強化學習等創新訓練技術的應用?,F在,用戶可以在Amazon Bedrock和Amazon SageMaker AI平臺上輕松部署DeepSeek-R1模型。Amazon Bedrock特別適合希望通過API快速集成預訓練基礎模型的團隊,而Amazon SageMaker AI則更適合需要高級定制、訓練和部署,并能訪問底層基礎設施的組織。用戶還可以通過AWS Trainium和AWS Inferentia,在Amazon Elastic Compute Cloud (Amazon EC2)或Amazon SageMaker AI上以經濟高效的方式部署DeepSeek-R1-Distill模型。
借助AWS平臺,用戶可以利用DeepSeek-R1模型構建、測試和負責任地擴展其生成式AI創意,而無需投入大量基礎設施投資。同時,通過構建專為安全性而設計的AWS服務,用戶可以自信地推動生成式AI創新。為了確保生成式AI應用的安全性,強烈建議用戶將DeepSeek-R1模型的部署與Amazon Bedrock Guardrails集成,該功能對Amazon Bedrock和Amazon SageMaker AI的客戶均開放。
目前,用戶有多種方式在AWS上部署DeepSeek-R1模型。包括通過Amazon Bedrock Marketplace部署DeepSeek-R1模型,利用Amazon SageMaker JumpStart部署DeepSeek-R1模型,通過Amazon Bedrock Custom Model Import導入DeepSeek-R1-Distill模型,以及在Amazon EC2 Trn1實例上部署DeepSeek-R1-Distill模型。