亚洲第一福利视频,欧美黑人粗大xxxxpp,国内精品一区二区三区,国产精品久久久久影院色

智快網 - 新科技與新能源行業網絡媒體

清華開源赤兔大模型推理引擎,國產芯片上DeepSeek推理成本減半性能翻倍

   發布時間:2025-03-14 20:59 作者:陸辰風

清華大學高性能計算研究所傳來重要消息,翟季冬教授團隊攜手清華系科創先鋒清程極智,共同宣布了一項重大開源成果——大模型推理引擎“赤兔 Chitu”。

這款引擎開創性地實現了在非英偉達Hopper架構GPU及眾多國產芯片上的FP8精度模型原生運行,顯著降低了推理成本,性能更是實現了翻倍。據悉,赤兔引擎被精準定位為“生產級大模型推理引擎”,旨在為用戶帶來多重優勢。

首先,赤兔引擎具備強大的多元算力適配能力。無論是NVIDIA的最新旗艦產品,還是舊款的多系列產品,亦或是國產芯片,赤兔引擎都能提供優化的支持,確保了廣泛的兼容性。

其次,赤兔引擎全場景可伸縮的特性使其應用場景更加靈活。無論是純CPU部署、單GPU部署,還是大規模集群部署,赤兔引擎都能提供可擴展的解決方案,滿足不同場景下的需求。

赤兔引擎的長期穩定運行能力也是其一大亮點。在實際生產環境中,赤兔引擎的穩定性足以承載高并發的業務流量,確保了業務的連續性和穩定性。

在部署DeepSeek-R1-671B滿血版時,赤兔引擎在A800集群的測試中展現出了卓越的性能。與部分國外開源框架相比,赤兔引擎在實現GPU使用量減少50%的同時,推理速度還提升了3.15倍,這一成績無疑令人矚目。

對于廣大開發者和用戶而言,赤兔引擎的開源無疑是一個巨大的福音。現在,大家可以通過訪問GitHub上的開源地址(https://github.com/thu-pacman/chitu),輕松獲取并體驗這款強大的大模型推理引擎。

 
 
更多>同類內容
全站最新
熱門內容
本欄最新
 
智快科技微信賬號
微信群

微信掃一掃
加微信拉群
電動汽車群
科技數碼群