ITBear旗下自媒體矩陣:

摩爾線程發(fā)布MUTLASS:助力國產(chǎn)GPU高性能線性代數(shù)計算,加速算子開發(fā)與算法創(chuàng)新

   時間:2024-11-12 19:28:12 來源:ITBEAR作者:鐘景軒編輯:瑞雪 發(fā)表評論無障礙通道

【ITBEAR】摩爾線程近日宣布,已開源其高性能線性代數(shù)模板庫MUTLASS,旨在助力開發(fā)者更高效地利用摩爾線程全功能GPU的MUSA Core與Tensor Core進行編程。此舉有望加快基于國產(chǎn)GPU的算子開發(fā)與算法創(chuàng)新步伐。

MUTLASS,即MUSA Templates for Linear Algebra Subroutines,是摩爾線程專為MUSA架構(gòu)打造的高性能計算庫。該庫基于開源模板庫CUTLASS進行了MUSA適配與深度定制化開發(fā),以優(yōu)化性能。

在矩陣乘法及相關(guān)操作方面,MUTLASS提供了一系列高性能的C++模板組件。這些組件采用了與muDNN庫相似的分層分解及數(shù)據(jù)搬運策略,以確保GPU性能得以充分發(fā)揮。

此次開源的版本中,摩爾線程對CuTe后端庫進行了適配,增加了對第三代MUSA架構(gòu)的MMA計算原語的支持。同時,該版本還支持TF32、FP16、BF16及INT8等多種數(shù)據(jù)精度,為矩陣乘法、默認(rèn)實例庫、性能測試器及相關(guān)工具包提供了初步支持。

開發(fā)者可通過訪問MUTLASS的開源地址:https://github.com/MooreThreads/mutlass,獲取該庫并應(yīng)用于其項目中,從而提升基于摩爾線程GPU的開發(fā)效率與性能。

摩爾線程的這一開源舉措,有望推動國產(chǎn)GPU在高性能計算領(lǐng)域的應(yīng)用與發(fā)展,為國內(nèi)外開發(fā)者提供更多選擇與可能。

舉報 0 收藏 0 打賞 0評論 0
 
 
更多>同類資訊
全站最新
熱門內(nèi)容
網(wǎng)站首頁  |  關(guān)于我們  |  聯(lián)系方式  |  版權(quán)聲明  |  RSS訂閱  |  開放轉(zhuǎn)載  |  滾動資訊  |  爭議稿件處理  |  English Version