【ITBEAR】在機(jī)器人學(xué)習(xí)領(lǐng)域的頂級會議CoRL 2024上,清華大學(xué)高陽團(tuán)隊?wèi){借其杰出研究榮獲X-Embodiment Workshop最佳論文獎,該獎項代表了前沿技術(shù)與重大突破。
高陽團(tuán)隊的研究聚焦于數(shù)據(jù)規(guī)模定律在機(jī)器人操作模仿學(xué)習(xí)中的應(yīng)用。他們通過大量實驗探索了如何通過合適的數(shù)據(jù)量實現(xiàn)零樣本泛化,這一成果對機(jī)器人技術(shù)的進(jìn)一步發(fā)展具有重要意義。
研究過程中,團(tuán)隊收集了超過4萬次演示,并進(jìn)行了1.5萬次以上的機(jī)器人實測,以嚴(yán)謹(jǐn)?shù)目茖W(xué)態(tài)度確保了研究結(jié)果的可靠性。他們發(fā)現(xiàn),策略的泛化能力主要受到環(huán)境和物體多樣性的影響,而不僅僅是演示的數(shù)量。
基于這一發(fā)現(xiàn),高陽團(tuán)隊設(shè)計了一種高效的數(shù)據(jù)收集方案。令人驚訝的是,僅需四名采集者花費一個下午的時間,就能收集到足夠的數(shù)據(jù),使兩個任務(wù)在新環(huán)境和新對象上的成功率達(dá)到約90%。這一成果無疑為機(jī)器人技術(shù)的實際應(yīng)用提供了強(qiáng)有力的支持。
為了驗證其研究的實用性,團(tuán)隊還將機(jī)器人部署在了各種真實環(huán)境中,包括火鍋店、咖啡館等日常生活場景。結(jié)果顯示,模型在這些新環(huán)境中展現(xiàn)出了出色的泛化能力,超出了研究人員的預(yù)期。
高陽團(tuán)隊還深入探討了策略泛化能力與訓(xùn)練物體數(shù)量、環(huán)境數(shù)量等因素的關(guān)系。他們發(fā)現(xiàn),這些因素與策略的泛化能力之間呈現(xiàn)出冪律分布的關(guān)系,這一發(fā)現(xiàn)為未來的機(jī)器人學(xué)習(xí)研究提供了新的思路。
高陽團(tuán)隊的研究成果不僅獲得了學(xué)術(shù)界的認(rèn)可,也為機(jī)器人技術(shù)的實際應(yīng)用開辟了新的道路。他們的努力將為未來機(jī)器人學(xué)習(xí)領(lǐng)域的發(fā)展注入新的活力。