摩爾線程近日宣布,已開源其高性能線性代數模板庫MUTLASS,旨在助力開發者更高效地利用摩爾線程全功能GPU的MUSA Core與Tensor Core進行編程。此舉有望加快基于國產GPU的算子開發與算法創新步伐。
MUTLASS,即MUSA Templates for Linear Algebra Subroutines,是摩爾線程專為MUSA架構打造的高性能計算庫。該庫基于開源模板庫CUTLASS進行了MUSA適配與深度定制化開發,以優化性能。
在矩陣乘法及相關操作方面,MUTLASS提供了一系列高性能的C++模板組件。這些組件采用了與muDNN庫相似的分層分解及數據搬運策略,以確保GPU性能得以充分發揮。
此次開源的版本中,摩爾線程對CuTe后端庫進行了適配,增加了對第三代MUSA架構的MMA計算原語的支持。同時,該版本還支持TF32、FP16、BF16及INT8等多種數據精度,為矩陣乘法、默認實例庫、性能測試器及相關工具包提供了初步支持。
開發者可通過訪問MUTLASS的開源地址:https://github.com/MooreThreads/mutlass,獲取該庫并應用于其項目中,從而提升基于摩爾線程GPU的開發效率與性能。
摩爾線程的這一開源舉措,有望推動國產GPU在高性能計算領域的應用與發展,為國內外開發者提供更多選擇與可能。