在人工智能領(lǐng)域,機(jī)器人的智能化水平一直是科研人員追求的目標(biāo)。近日,麻省理工學(xué)院(MIT)的研究團(tuán)隊(duì)取得了重大進(jìn)展,他們提出的“異構(gòu)預(yù)訓(xùn)練Transformers”(HPT)架構(gòu),為機(jī)器人實(shí)現(xiàn)通用智能奠定了堅(jiān)實(shí)基礎(chǔ)。
以往,機(jī)器人訓(xùn)練面臨著數(shù)據(jù)異質(zhì)性的問(wèn)題,即每種任務(wù)和環(huán)境都需要單獨(dú)采集數(shù)據(jù),這導(dǎo)致了訓(xùn)練過(guò)程中的重復(fù)勞動(dòng)和數(shù)據(jù)采集成本高昂。而HPT架構(gòu)的提出,正是為了解決這一難題。
研究團(tuán)隊(duì)指出,HPT的優(yōu)勢(shì)不僅在于其高通用性,更在于其高效和低成本。通過(guò)減少任務(wù)專用數(shù)據(jù)量,HPT在模擬和實(shí)際測(cè)試中均表現(xiàn)出色,性能比傳統(tǒng)訓(xùn)練方式提升了20%以上。
在HPT架構(gòu)中,策略神經(jīng)網(wǎng)絡(luò)被分為三個(gè)模塊:Stem、Trunk和Head。這種模塊化設(shè)計(jì)使得HPT能夠靈活應(yīng)對(duì)不同的任務(wù)和環(huán)境。Stem層負(fù)責(zé)將傳感器數(shù)據(jù)轉(zhuǎn)換為標(biāo)準(zhǔn)化令牌,Trunk層則通過(guò)Transformer架構(gòu)將這些令牌轉(zhuǎn)換為通用潛在表示,最后由Head層輸出具體的機(jī)器人動(dòng)作指令。
研究團(tuán)隊(duì)還建立了一個(gè)龐大的數(shù)據(jù)集,包含52個(gè)數(shù)據(jù)集和20萬(wàn)條機(jī)器人軌跡,以支撐HPT的通用化訓(xùn)練。這一舉措為機(jī)器人學(xué)習(xí)提供了豐富的數(shù)據(jù)資源,進(jìn)一步推動(dòng)了通用智能的發(fā)展。
HPT架構(gòu)還特別強(qiáng)調(diào)了本體感知的重要性。本體感知賦予機(jī)器人對(duì)自身狀態(tài)的把控力,在執(zhí)行高精度任務(wù)時(shí)尤為關(guān)鍵。通過(guò)將視覺和本體感知信號(hào)作為等同重要的數(shù)據(jù)源進(jìn)行處理,HPT使得機(jī)器人能夠以更全面的方式理解任務(wù)。
總的來(lái)說(shuō),MIT研究團(tuán)隊(duì)的這項(xiàng)成果為機(jī)器人通用智能的發(fā)展開辟了新的道路。通過(guò)異構(gòu)預(yù)訓(xùn)練Transformers架構(gòu)的創(chuàng)新應(yīng)用,我們有理由相信,未來(lái)機(jī)器人將在更多領(lǐng)域展現(xiàn)出強(qiáng)大的智能化能力。