ITBear旗下自媒體矩陣:

d-Matrix AI芯片Corsair出貨,DIMC技術(shù)讓速度飆升10倍!

   時間:2024-11-20 17:27:13 來源:ITBEAR作者:驅(qū)動之家編輯:瑞雪 發(fā)表評論無障礙通道

【ITBEAR】微軟投資的硅谷新興企業(yè)d-Matrix近日正式宣布,其精心研發(fā)的人工智能芯片Corsair已投入市場流通。

據(jù)d-Matrix介紹,Corsair在單服務器環(huán)境下,為Llama3 8B模型提供了驚人的處理能力,每秒可處理高達60000個tokens,且每個tokens的延遲僅為1毫秒。這一數(shù)據(jù)彰顯了Corsair在高效處理大規(guī)模數(shù)據(jù)方面的卓越性能。

Corsair不僅性能出眾,還在能源效率和成本節(jié)約方面展現(xiàn)出顯著優(yōu)勢。d-Matrix聲稱,與GPU及其他替代方案相比,Corsair能夠在提供同等性能的同時,顯著降低能耗和成本。

在AI推理運算領域,數(shù)據(jù)傳輸一直是制約性能提升的關(guān)鍵瓶頸。由于AI推理需要處理大量且快速的內(nèi)存數(shù)據(jù),傳統(tǒng)解決方案往往難以兼顧這兩方面的需求。d-Matrix針對這一挑戰(zhàn),提出了創(chuàng)新的解決方案。

目前,業(yè)界主要有三種解決數(shù)據(jù)傳輸瓶頸的方法。第一種是通過采樣和流水線技術(shù)減少處理的數(shù)據(jù)量,雖然能加速深度學習,但犧牲了準確性和精確性。第二種是在傳統(tǒng)處理器附近設置專用AI引擎,如蘋果、英偉達、Intel和AMD所采用的方式,但這種方法需要集成SRAM和外部DRAM,能耗高且效率較低。

d-Matrix采用的是第三種方法,即將計算移動到內(nèi)存附近。這種被稱為數(shù)字存算一體(DIMC)的技術(shù)架構(gòu),通過降低延遲和減少消耗,顯著提升了AI推理運算的性能。DIMC技術(shù)特別適合處理AI推理中的靜態(tài)但大型權(quán)重數(shù)據(jù)集,這些數(shù)據(jù)集在推理過程中會被反復訪問,DIMC技術(shù)消除了大部分能量轉(zhuǎn)移費用和數(shù)據(jù)移動的延遲。

得益于DIMC技術(shù)的優(yōu)勢,Corsair提供了150TB/s的超高內(nèi)存帶寬,交互速度提高了10倍,能效提高了3倍。這一突破性的性能表現(xiàn),使得Corsair在AI推理運算領域具有廣泛的應用前景。

Corsair芯片還采用了行業(yè)標準的PCIe Gen5全高全長卡外形,并通過DMX Bridge卡連接成對的卡,以滿足高性能計算的需求。每張Corsair卡都由多個DIMC計算核心驅(qū)動,具備2400 TFLOP的8位峰值計算能力,同時配備了2GB的集成性能內(nèi)存和高達256GB的片外容量內(nèi)存,確保了強大的計算能力和數(shù)據(jù)存儲能力。

舉報 0 收藏 0 打賞 0評論 0
 
 
更多>同類資訊
全站最新
熱門內(nèi)容
網(wǎng)站首頁  |  關(guān)于我們  |  聯(lián)系方式  |  版權(quán)聲明  |  RSS訂閱  |  開放轉(zhuǎn)載  |  滾動資訊  |  爭議稿件處理  |  English Version