阿里云計算有限公司近日宣布了一項重要更新,其PAI Model Gallery平臺現已支持一鍵部署DeepSeek-V3和DeepSeek-R1模型。這一功能的推出,無疑為開發者們提供了更加便捷高效的模型部署途徑。
用戶想要體驗這一便捷服務,只需簡單幾步操作。首先,需進入Model Gallery頁面。通過訪問https://pai.console.aliyun.com/#/quick-start/models鏈接并登錄PAI控制臺,根據所在區域選擇相應地域,然后在左側導航欄中找到并點擊進入指定的工作空間。在工作空間內,選擇“快速開始”下的“Model Gallery”選項,即可進入模型展示頁面。
在Model Gallery的模型列表中,用戶可以輕松找到DeepSeek系列模型。例如,點擊“DeepSeek-R1-Distill-Qwen-7B”模型卡片,即可進入該模型的詳細信息頁面。這一頁面提供了關于模型的全面介紹,幫助用戶更好地了解模型的特點和應用場景。
進入模型詳情頁后,用戶只需點擊右上角的“部署”按鈕,即可開始一鍵部署DeepSeek模型生成服務。值得注意的是,DeepSeek-R1支持vLLM加速部署,而DeepSeek-V3則更加靈活,不僅支持vLLM加速部署,還提供了Web應用部署的選項。對于DeepSeek-R1的蒸餾小模型,阿里云還提供了BladeLLM(阿里云PAI自研高性能推理框架)和vLLM兩種加速部署方式。用戶只需根據自己的需求選擇合適的部署方式和資源,即可輕松完成服務部署,生成一個PAI-EAS服務。
部署成功后,用戶可以在服務頁面查看調用的Endpoint和Token信息。為了方便用戶了解服務調用方式,阿里云還提供了預訓練模型鏈接,用戶只需點擊即可返回模型介紹頁,查看詳細的調用方式說明。這一貼心設計無疑大大降低了用戶的使用門檻,提升了開發效率。
阿里云官方教程中部署的模型為經過蒸餾的DeepSeek-R1-Distill-Qwen-7B。這一模型基于DeepSeek-R1的推理能力,通過蒸餾技術將推理模式遷移到了較小的Qwen模型上,從而在保持高性能的同時降低了資源消耗。當然,阿里云PAI Model Gallery也提供了DeepSeek-R1和DeepSeek-V3原始模型的一鍵部署服務,以滿足不同用戶的需求。
近期,DeepSeek系列模型受到了業界的廣泛關注。Gitee AI聯合沐曦首發了全套DeepSeek R1千問蒸餾模型,并提供了全免費體驗服務。同時,秘塔AI也官宣接入了滿血版DeepSeek R1推理模型。DeepSeek-R1大模型還成功登陸騰訊云,宣稱可以實現“一鍵部署、3分鐘調用”,進一步推動了AI模型在各行各業的廣泛應用。