滾動(dòng)資訊

當(dāng)前位置：首頁(yè) > 資訊 > 人工智能 > 正文內(nèi)容

豆包大模型7個(gè)月飛躍：綜合能力媲美GPT-4o，AI技術(shù)新突破！

時(shí)間：2024-12-30 16:21:48 來源：ITBEAR編輯：快訊團(tuán)隊(duì) 發(fā)表評(píng)論無障礙通道

在人工智能領(lǐng)域的一次重大進(jìn)展中，字節(jié)旗下的豆包大模型在2024年末全面展示了其跨領(lǐng)域的技術(shù)飛躍。自今年5月首次亮相以來，短短七個(gè)月內(nèi)，豆包大模型在通用語(yǔ)言處理、視頻生成、語(yǔ)音交互以及視覺理解等多個(gè)維度上，均取得了與國(guó)際頂尖技術(shù)并跑的成就。

最新版本的豆包通用模型——Doubao-pro-1215，其綜合能力相較于5月版本提升了32%，并已全面對(duì)標(biāo)GPT-4o。尤其在處理數(shù)學(xué)難題及專業(yè)知識(shí)等復(fù)雜任務(wù)時(shí)，豆包模型的表現(xiàn)甚至更為出色。這一顯著進(jìn)步得益于團(tuán)隊(duì)在數(shù)據(jù)優(yōu)化、模型稀疏度提升、強(qiáng)化學(xué)習(xí)引入以及系統(tǒng)性工程優(yōu)化等方面的不懈努力。Doubao-Pro在保持高性能的同時(shí)，實(shí)現(xiàn)了推理服務(wù)價(jià)格的大幅降低，僅為GPT-4o的八分之一。

在圖像與視頻處理領(lǐng)域，豆包大模型團(tuán)隊(duì)于9月推出了PixelDance與Seaweed兩款視頻生成模型，它們擅長(zhǎng)精準(zhǔn)理解復(fù)雜提示詞、保持鏡頭一致性、實(shí)現(xiàn)多交互主體靈活控制。同時(shí)，豆包文生圖模型持續(xù)迭代，新增了通用圖像編輯功能，使得“一句話P圖”和“一鍵生成海報(bào)”成為可能。12月發(fā)布的Doubao-vision視覺理解模型，更是將視覺與語(yǔ)言深度結(jié)合，實(shí)現(xiàn)了多感官的思考與創(chuàng)作，其在十多個(gè)主流數(shù)據(jù)集上的表現(xiàn)與Gemini 2.0和GPT-4o相當(dāng)。

語(yǔ)音方面，豆包大模型團(tuán)隊(duì)推出了全新的語(yǔ)音識(shí)別模型Seed-ASR和語(yǔ)音生成基座模型Seed-TTS，通過引入多樣化數(shù)據(jù)、融合推理鏈，賦予了模型強(qiáng)大的泛化能力。豆包語(yǔ)音模型不僅能聽懂20種以上方言?shī)A雜的對(duì)話，還能在會(huì)話中表達(dá)情感，保留人類習(xí)慣，如吞音、口音等，且在交互中可隨時(shí)被打斷，實(shí)現(xiàn)了更加自然流暢的語(yǔ)音交互。

更進(jìn)一步的是，豆包大模型已具備高品質(zhì)的“唱作”能力，從詞曲編輯、演奏生成到人聲演唱，一個(gè)AI就能組成一個(gè)樂隊(duì)。這背后依托的是Seed-Music音樂生成模型框架，它結(jié)合了語(yǔ)言模型與擴(kuò)散模型的優(yōu)勢(shì)，實(shí)現(xiàn)了音樂生成的通用框架，并提供了極高的編輯可控性。

豆包大模型團(tuán)隊(duì)還首次披露了其300萬字窗口的長(zhǎng)文本處理能力，能夠輕松閱讀上百篇學(xué)術(shù)報(bào)告，每百萬tokens的處理延遲僅需15秒，這一性能達(dá)到了業(yè)界的極限水平。這一成就得益于STRING等上下文關(guān)聯(lián)數(shù)據(jù)算法和模型加速優(yōu)化的支持，使得LLM能夠更有效地利用海量外部知識(shí)，并通過稀疏化及分布式方案將時(shí)延降至十秒級(jí)。

在代碼能力方面，豆包代碼大模型Doubao-coder的編程能力達(dá)到了專業(yè)級(jí)水平，支持超過16種編程語(yǔ)言及11類真實(shí)應(yīng)用場(chǎng)景，滿足全棧編程開發(fā)需求，包括前后端開發(fā)、機(jī)器學(xué)習(xí)等。

豆包大模型團(tuán)隊(duì)在AI基礎(chǔ)研究方面也取得了顯著成果。過去幾個(gè)月里，團(tuán)隊(duì)有57篇論文入選ICLR、CVPR、NeurIPS等國(guó)際頂級(jí)會(huì)議，并發(fā)布了下載量超百萬的開源項(xiàng)目及GitHub上的熱門項(xiàng)目。同時(shí)，團(tuán)隊(duì)與近20所高校建立了深入合作關(guān)系，支持了40多位頂尖學(xué)者參與關(guān)鍵AI技術(shù)的研發(fā)，并與清華大學(xué)AIR、北京大學(xué)分別成立了聯(lián)合實(shí)驗(yàn)室。

為了儲(chǔ)備最具潛力的研究人才，豆包大模型團(tuán)隊(duì)啟動(dòng)了“Top Seed人才計(jì)劃”，在全球范圍內(nèi)招募頂尖博士畢業(yè)生加入，共同挑戰(zhàn)世界級(jí)AI課題。目前，豆包大模型的相關(guān)技術(shù)能力已支撐了包括豆包APP、即夢(mèng)、豆包MarsCode等在內(nèi)的50多個(gè)C端應(yīng)用場(chǎng)景，其中豆包APP已成為國(guó)內(nèi)備受歡迎的AI產(chǎn)品。通過火山引擎，豆包大模型還服務(wù)了30多個(gè)行業(yè)，日均tokens調(diào)用量超過4萬億，較5月發(fā)布時(shí)增長(zhǎng)了33倍。

舉報(bào) 0 收藏 0 打賞 0評(píng)論 0

更多>同類資訊

人工智能賦能新型工業(yè)化，151項(xiàng)典型應(yīng)用案例榮耀揭榜！

01-02

特斯拉FSD v13.2.2升級(jí)，智能駕駛體驗(yàn)?zāi)芊翊蠓嵘?/a>

01-02

百度25周年：李彥宏寄語(yǔ)，技術(shù)創(chuàng)新引領(lǐng)未來，AI應(yīng)用將井噴式增長(zhǎng)

01-02

三星芯片封裝“大將”離巢，曾助力臺(tái)積電深耕二十年

01-02

2024年AI評(píng)測(cè)新風(fēng)尚：從“史密斯吃面”到游戲?qū)?zhàn)，誰(shuí)更接地氣？

01-01

支付寶集五福新升級(jí)，2025年1月20日活動(dòng)盛大啟幕！

01-01

AI陪伴成新寵，中產(chǎn)女性情感消費(fèi)新風(fēng)口？

事實(shí)上，不管是C.AI還是星野，大部分AI陪伴產(chǎn)品的流量生態(tài)靠的是IP堆疊起來的智能體，平臺(tái)作為IP的下游產(chǎn)業(yè)，手上并沒有掌握IP議價(jià)權(quán)。我們不否認(rèn)這種情緒價(jià)值在女性消費(fèi)中的主導(dǎo)作用，但如果僅靠普遍低齡的消…

01-01

2024年AI回顧：OpenAI不再一枝獨(dú)秀，應(yīng)用商業(yè)化路徑漸明朗

而這，也是大模型競(jìng)爭(zhēng)中的冰山一角，或許在不久后的將來，OpenAI都只會(huì)以相對(duì)領(lǐng)先的“領(lǐng)軍人”角色存在，更多的AI大廠會(huì)在更多的AI賽道中，你追我趕。譬如，目前國(guó)內(nèi)Chatbot主流產(chǎn)品中唯一推出付費(fèi)會(huì)員…

01-01

扎克伯格2024年拋售20億美元Meta股票，背后有何大動(dòng)作？

01-01

聯(lián)發(fā)科天璣9350即將來襲，能否超越驍龍8s Elite成新霸主？

01-01

中廠的大模型之路：立足場(chǎng)景，本地化部署成關(guān)鍵

12-31

00后學(xué)霸聯(lián)手70后老將，靈初智能破解機(jī)器人操作難題獲稚暉君青睞

靈初智能是當(dāng)前最年輕的具身智能創(chuàng)企之一，今年9月剛剛成立，上個(gè)月宣布完成由高瓴、藍(lán)馳領(lǐng)投的天使輪融資，已發(fā)布首個(gè)基于強(qiáng)化學(xué)習(xí)的端到端具身模型，能支持機(jī)器人雙靈巧手協(xié)同做復(fù)雜操作、掌握推理能力。最近，靈初智…

12-31

大模型獨(dú)角獸階躍星辰首次中標(biāo)，4200萬智算云項(xiàng)目花落誰(shuí)家？

智東西12月31日消息，12月27日，大模型獨(dú)角獸階躍星辰中標(biāo)上海某公司智算云服務(wù)平臺(tái)源代碼采購(gòu)項(xiàng)目，投標(biāo)報(bào)價(jià)4199.9萬元。12月連續(xù)中標(biāo)，包括1019.9萬元中標(biāo)北京智網(wǎng)數(shù)科的自然語(yǔ)言大模型和大模型M…

12-31

奧看科技攜手華為，榮獲優(yōu)選級(jí)伙伴認(rèn)證，共筑數(shù)字化轉(zhuǎn)型新高度！

12-31

三星2025年能否逆襲蘋果？關(guān)鍵在于這五大布局

12-31

點(diǎn)擊查看更多 +

全站最新

蔚來2024年交付量出爐：全年新車交付超22萬，同比增長(zhǎng)近四成！

比亞迪2024年銷量大增四成，全年賣出超427萬輛新能源車

吉利汽車2024年銷量大增32%，2025年目標(biāo)直指271萬輛

廣汽埃安2024年終銷量飄紅，12月全球售出46851輛再創(chuàng)新高！

嵐圖汽車銷量再創(chuàng)新高！全年賣8.57萬輛，2025年目標(biāo)直指20萬輛

零跑汽車12月交付量破4萬，同比增長(zhǎng)128%，2025目標(biāo)50萬輛

熱門內(nèi)容

本欄最新

特斯拉FSD v13.2.2升級(jí)，智能駕駛體驗(yàn)?zāi)芊翊蠓嵘?/a>

三星芯片封裝“大將”離巢，曾助力臺(tái)積電深耕二十年

2024年AI評(píng)測(cè)新風(fēng)尚：從“史密斯吃面”到游戲?qū)?zhàn)，誰(shuí)更接地氣？

AI陪伴成新寵，中產(chǎn)女性情感消費(fèi)新風(fēng)口？

2024年AI回顧：OpenAI不再一枝獨(dú)秀，應(yīng)用商業(yè)化路徑漸明朗

聯(lián)發(fā)科天璣9350即將來襲，能否超越驍龍8s Elite成新霸主？

本網(wǎng)站LOGO小熊標(biāo)志受版權(quán)保護(hù)，版權(quán)登記號(hào)：魯作登字-2015-F-025467，未經(jīng)ITBEAR官方許可，嚴(yán)禁使用。
聲明：本網(wǎng)站是公益性科普網(wǎng)站，為網(wǎng)友提供科技類資訊內(nèi)容，無障礙技術(shù)由太陽(yáng)灣捐增，為閱讀障礙用戶提供內(nèi)容聽讀服務(wù)。如本站內(nèi)容侵犯了您的權(quán)利，請(qǐng)通知我們及時(shí)刪除。
中國(guó)（山東）自由貿(mào)易試驗(yàn)區(qū) · 齊魯軟件園魯ICP備11015305號(hào)-1 商業(yè)合作入口
Copyright ? 小熊科技資訊 2007-2024 ITBEAR.COM.CN All rights reserved.

豆包大模型7個(gè)月飛躍：綜合能力媲美GPT-4o，AI技術(shù)新突破！

豆包大模型7個(gè)月飛躍：綜合能力媲美GPT-4o，AI技術(shù)新突破！