ITBear旗下自媒體矩陣:

IBM watsonx.ai平臺(tái)新上線:DeepSeek R1蒸餾模型賦能企業(yè)級(jí)AI開(kāi)發(fā)

   時(shí)間:2025-02-11 13:13:23 來(lái)源:ITBEAR編輯:快訊團(tuán)隊(duì) 發(fā)表評(píng)論無(wú)障礙通道

IBM近日在其企業(yè)級(jí)AI開(kāi)發(fā)平臺(tái)watsonx.ai上推出了DeepSeek-R1蒸餾版的Llama 3.1 8B和Llama 3.3 70B模型,這一消息引起了業(yè)界的廣泛關(guān)注。

據(jù)悉,DeepSeek不僅利用了知識(shí)蒸餾技術(shù),還通過(guò)R1模型生成的數(shù)據(jù)優(yōu)化了多個(gè)Llama和Qwen變體。這一創(chuàng)新使得用戶能夠在watsonx.ai平臺(tái)上更加高效地利用這些模型。

用戶現(xiàn)在可以通過(guò)多種方式在watsonx.ai上使用DeepSeek蒸餾模型。在平臺(tái)的“按需部署”目錄中,IBM提供了Llama蒸餾版,用戶只需簡(jiǎn)單部署即可獲得專用實(shí)例,進(jìn)行安全推理。用戶還可以利用“自定義基礎(chǔ)模型”導(dǎo)入功能,上傳如Qwen蒸餾模型等其他DeepSeek-R1變體。

DeepSeek-R1模型憑借其強(qiáng)大的推理能力,在多個(gè)領(lǐng)域展現(xiàn)出了廣泛的應(yīng)用潛力。在規(guī)劃領(lǐng)域,其獨(dú)特的“鏈?zhǔn)剿季S”邏輯有助于處理需要逐步推理的任務(wù),特別適合智能體應(yīng)用。在編程領(lǐng)域,DeepSeek-R1可用于代碼生成、調(diào)試和優(yōu)化,極大地提升了開(kāi)發(fā)效率。該模型還具備處理復(fù)雜數(shù)學(xué)問(wèn)題的能力,在科研、工程和科學(xué)計(jì)算等領(lǐng)域表現(xiàn)出色。

對(duì)于開(kāi)發(fā)者而言,watsonx.ai平臺(tái)提供了豐富的解決方案能力,幫助他們更好地利用DeepSeek-R1進(jìn)行AI解決方案開(kāi)發(fā)。開(kāi)發(fā)者可以直觀地測(cè)試和評(píng)估模型輸出,通過(guò)連接向量數(shù)據(jù)庫(kù)和嵌入模型構(gòu)建RAG(檢索增強(qiáng)生成)管道,并支持LangChain、CrewAI等主流AI框架。

IBM watsonx.ai平臺(tái)還提供了靈活的開(kāi)源模型定制選項(xiàng),支持DeepSeek-R1在不同環(huán)境下的部署。這極大地簡(jiǎn)化了智能體開(kāi)發(fā)、微調(diào)、RAG、提示工程等工作流。平臺(tái)內(nèi)置的安全機(jī)制也保障了用戶應(yīng)用的安全性。

IBM首席執(zhí)行官在本月初發(fā)表的長(zhǎng)文中透露,DeepSeek模型僅用約2000枚英偉達(dá)芯片,以大約600萬(wàn)美元的成本訓(xùn)練而成,遠(yuǎn)低于行業(yè)預(yù)期。這一成就再次證明了小型、高效的模型同樣能夠帶來(lái)實(shí)際成果,無(wú)需依賴龐大而昂貴的專有系統(tǒng)。

舉報(bào) 0 收藏 0 打賞 0評(píng)論 0
 
 
更多>同類資訊
全站最新
熱門(mén)內(nèi)容