近日,中科曙光國家先進計算產(chǎn)業(yè)創(chuàng)新中心有限公司傳來喜訊,其海光信息技術團隊宣布,已成功實現(xiàn)DeepSeek V3與R1模型與海光DCU(深度計算單元)的國產(chǎn)化適配,并正式上線供用戶使用。這一消息標志著我國在AI模型與硬件適配領域取得了又一重要進展。
用戶現(xiàn)在可以通過訪問“光合開發(fā)者社區(qū)”中的“光源”板塊,或登錄光源官網(wǎng)搜索“DeepSeek”,輕松下載并部署相關模型。這些模型基于DCU平臺,將為用戶提供更高效的AI計算體驗。
據(jù)悉,DeepSeek V3與R1模型均采用了先進的Transformer架構,并融入了Multi-Head Latent Attention(MLA)和DeepSeek MoE兩大核心技術。MLA技術通過優(yōu)化KV緩存,顯著降低了內存占用,從而提升了模型的推理效率。而DeepSeek MoE技術則通過引入輔助損失,實現(xiàn)了專家負載的智能平衡,進一步提升了模型的性能表現(xiàn)。
海光信息推出的DCU,作為一款高性能GPGPU架構的AI加速卡,憑借其自主可控的全精度通用AI加速計算解決方案,已在多個領域實現(xiàn)了規(guī)模化應用。無論是科教、金融、醫(yī)療、政務還是智算中心,DCU都展現(xiàn)出了強大的計算能力和廣泛的應用前景。
此次DeepSeek V3與R1模型與DCU的成功適配,不僅為用戶提供了更多樣化的AI計算選擇,也進一步推動了我國在AI領域的技術創(chuàng)新和產(chǎn)業(yè)發(fā)展。隨著AI技術的不斷演進和應用場景的不斷拓展,相信未來會有更多類似的技術成果涌現(xiàn),為我國的數(shù)字化轉型和智能化升級注入新的動力。