滾動資訊

當(dāng)前位置：首頁 > 資訊 > 業(yè)界動態(tài) > 正文內(nèi)容

靈初智能Psi R0：強(qiáng)化學(xué)習(xí)賦能，雙靈巧手挑戰(zhàn)長程任務(wù)

時間：2024-12-30 15:37:23 來源：ITBEAR編輯：快訊團(tuán)隊(duì) 發(fā)表評論無障礙通道

靈初智能在近期正式揭曉了其最新研發(fā)成果——基于強(qiáng)化學(xué)習(xí)（RL）技術(shù)的端到端具身模型Psi R0。這款模型在雙靈巧手的協(xié)同操作上實(shí)現(xiàn)了突破，能夠串聯(lián)并混合訓(xùn)練多種技能，生成具備邏輯推理能力的智能體，從而成功完成一系列復(fù)雜的、長距離的靈巧操作任務(wù)。

Psi R0不僅具備出色的操作技能，還展現(xiàn)出了跨物品和跨場景的泛化能力。在電商場景中，商品打包是一個典型的長流程任務(wù)，需要對成千上萬件商品進(jìn)行抓取、掃碼、放置以及塑料袋打結(jié)等一系列操作。令人驚嘆的是，Psi R0憑借其雙靈巧手，能夠流暢地完成這一系列繁瑣的步驟，據(jù)官方介紹，這一表現(xiàn)足以替代一個完整的工作崗位。

靈初智能透露，Psi R0模型利用了海量的仿真數(shù)據(jù)進(jìn)行訓(xùn)練，通過雙向訓(xùn)練框架將多種技能串聯(lián)起來，率先在開放環(huán)境中完成了長程任務(wù)。該模型展現(xiàn)出了強(qiáng)大的泛化能力和魯棒性，能夠在不同的環(huán)境和條件下穩(wěn)定工作。

為了實(shí)現(xiàn)這一目標(biāo)，靈初智能開發(fā)了一種獨(dú)特的技能訓(xùn)練框架。該框架從物體的時空軌跡中提取關(guān)鍵信息，構(gòu)建出通用的目標(biāo)函數(shù)，從而解決了獎勵函數(shù)設(shè)計(jì)困難的問題。在后訓(xùn)練階段，通過引入少量的高質(zhì)量真實(shí)機(jī)器數(shù)據(jù)，進(jìn)一步提升了長程任務(wù)的成功率。

雙向訓(xùn)練框架中的轉(zhuǎn)移可行性函數(shù)在技能串聯(lián)過程中起到了至關(guān)重要的作用。該函數(shù)能夠微調(diào)技能，提高串聯(lián)的成功率和泛化性，同時賦予模型自主切換技能的能力。當(dāng)遇到操作失敗時，Psi R0能夠迅速調(diào)整策略，確保任務(wù)的高成功率。

這一創(chuàng)新不僅展示了靈初智能在強(qiáng)化學(xué)習(xí)領(lǐng)域的技術(shù)實(shí)力，也為機(jī)器人技術(shù)的發(fā)展開辟了新的方向。Psi R0的成功應(yīng)用，預(yù)示著未來機(jī)器人在長程靈巧操作任務(wù)中將發(fā)揮更加重要的作用，為工業(yè)自動化和智能化進(jìn)程注入新的動力。

Psi R0的出色表現(xiàn)也離不開其背后的算法和數(shù)據(jù)處理技術(shù)的支持。靈初智能在算法優(yōu)化和數(shù)據(jù)處理方面投入了大量的研發(fā)資源，確保了Psi R0能夠在各種復(fù)雜環(huán)境中穩(wěn)定工作，并展現(xiàn)出卓越的性能。

舉報(bào) 0 收藏 0 打賞 0評論 0

更多>同類資訊

AMD RX 9070系列上市倒計(jì)時，RX 9070 XT或要等到二月才見面？

01-02

小米POCO X7 Pro鋼鐵俠定制版來襲，1月9日全球首發(fā)性能如何？

01-02

OPPO Reno13心動白來襲！宋雨琦代言，2599元起售新體驗(yàn)

01-02

劉強(qiáng)東再回老家發(fā)紅包，每戶數(shù)千元，60歲以上老人萬元現(xiàn)金

三言科技1月2日消息，1月1日，江蘇宿遷，，村民稱劉強(qiáng)東準(zhǔn)備在8號給老家村民發(fā)放現(xiàn)金和禮品，“村里通知讓復(fù)印戶口本和身份證，1400多戶，每家大概有幾千元禮品，60歲以上老人有一萬元現(xiàn)金”。劉強(qiáng)東曾稱當(dāng)年…

01-02

易微聯(lián)攜手俄羅斯兩大語音助手，開啟智能家居出海新篇章

01-02

愛普生：以“省小精”筑夢，共繪人與地球多彩未來

01-02

間歇期不是休止符，量子之歌以終身學(xué)習(xí)為帆，助你人生再啟航

01-02

重塑記憶力，講真學(xué)堂科學(xué)訓(xùn)練策略助你大腦潛能大爆發(fā)！

01-02

數(shù)字賦能城市新魅力：烏鎮(zhèn)研討會共探數(shù)字城市品牌發(fā)展之路

01-02

英偉達(dá)Blackwell架構(gòu)GPU測試難度大增，耗時竟達(dá)Hopper三到四倍

01-02

蓮花跑車回歸本名：歷經(jīng)五年終奪“蓮花”中文商標(biāo)

01-02

中芯國際：中國芯片產(chǎn)業(yè)崛起的核心力量

01-02

俞敏洪深情致謝東方甄選團(tuán)隊(duì)：共克時艱，共創(chuàng)輝煌2025！

01-02

張朝陽跨年直播硬核講量子力學(xué)：微觀世界，原來可以這樣解釋！

01-02

RTX 5090移動版將首搭3GB GDDR7，24GB大顯存來襲？

01-02

點(diǎn)擊查看更多 +

全站最新

OPPO Reno13心動白來襲！宋雨琦代言，2599元起售新體驗(yàn)

中國新能源崛起背后的秘密：這位“隱藏大佬”功不可沒！

奧特英雄賽羅空降北京，王府井奧萊UPTOWN一周年展，等你來戰(zhàn)！

廣汽傳祺新能源轉(zhuǎn)型加速，MPV銷量突破70萬，領(lǐng)跑中國汽車新時代？

三國殺董昭：瞞天過海新神將，斗地主中如何克制他的強(qiáng)勢輔助？

2024年末多家車企集體召回，廣汽傳祺7.4萬輛GS8領(lǐng)銜

熱門內(nèi)容

本欄最新

OPPO Reno13心動白來襲！宋雨琦代言，2599元起售新體驗(yàn)

易微聯(lián)攜手俄羅斯兩大語音助手，開啟智能家居出海新篇章

愛普生：以“省小精”筑夢，共繪人與地球多彩未來

間歇期不是休止符，量子之歌以終身學(xué)習(xí)為帆，助你人生再啟航

數(shù)字賦能城市新魅力：烏鎮(zhèn)研討會共探數(shù)字城市品牌發(fā)展之路

英偉達(dá)Blackwell架構(gòu)GPU測試難度大增，耗時竟達(dá)Hopper三到四倍

本網(wǎng)站LOGO小熊標(biāo)志受版權(quán)保護(hù)，版權(quán)登記號：魯作登字-2015-F-025467，未經(jīng)ITBEAR官方許可，嚴(yán)禁使用。
聲明：本網(wǎng)站是公益性科普網(wǎng)站，為網(wǎng)友提供科技類資訊內(nèi)容，無障礙技術(shù)由太陽灣捐增，為閱讀障礙用戶提供內(nèi)容聽讀服務(wù)。如本站內(nèi)容侵犯了您的權(quán)利，請通知我們及時刪除。
中國（山東）自由貿(mào)易試驗(yàn)區(qū) · 齊魯軟件園魯ICP備11015305號-1 商業(yè)合作入口
Copyright ? 小熊科技資訊 2007-2024 ITBEAR.COM.CN All rights reserved.

靈初智能Psi R0：強(qiáng)化學(xué)習(xí)賦能，雙靈巧手挑戰(zhàn)長程任務(wù)

靈初智能Psi R0：強(qiáng)化學(xué)習(xí)賦能，雙靈巧手挑戰(zhàn)長程任務(wù)