近期,國內人形機器人領域的領頭羊優(yōu)必選公司宣布,正在驗證其DeepSeek技術在人形機器人應用場景中的有效性。這項技術涵蓋多模態(tài)人機交互、復雜指令理解以及工業(yè)任務分解與規(guī)劃等多個方面,有望通過深度思考能力解決復雜任務中的挑戰(zhàn),使人形機器人的行為表現(xiàn)更接近人類。
優(yōu)必選并非孤例。就在優(yōu)必選宣布這一消息的前兩天,硅谷著名人形機器人公司Figure的創(chuàng)始人Brett Adcock在社交媒體上宣布,公司將終止與OpenAI的合作,轉而自主開發(fā)端到端的機器人AI。Adcock還透露,F(xiàn)igure已取得重大突破,將在未來30天內展示前所未有的技術成果。
業(yè)界普遍認為,F(xiàn)igure的這一轉變可能與DeepSeek等開源模型的興起有關。事實上,近期傳出與DeepSeek達成深度合作的宇樹科技,同樣以制造經濟型人形機器人而聞名。DeepSeek的出現(xiàn),似乎正在悄然改變人形機器人行業(yè)的格局。
DeepSeek之所以受到如此關注,主要在于它直擊了人形機器人當前的兩大痛點:成本與數(shù)據。訓練一個具備具身智能的機器人,需要消耗大量算力,這對于初創(chuàng)公司而言是一筆不小的負擔。數(shù)據匱乏也是整個行業(yè)面臨的難題。DeepSeek R1通過提供低成本的推理服務,以及改進算法以降低高質量數(shù)據獲取成本,為人形機器人公司解決了這一難題。
與OpenAI o1相比,DeepSeek R1在推理成本上具有顯著優(yōu)勢。這不僅讓人形機器人公司能夠擺脫高昂算力的束縛,還能將更多資金投入到機器人本體的研發(fā)中,加速產品迭代。更重要的是,DeepSeek R1作為頂級推理模型,能夠低成本地提供數(shù)學、代碼以及自然語言推理等能力,使人形機器人在面對復雜任務時表現(xiàn)出色。
DeepSeek的開源策略為人形機器人公司提供了新的選擇。通過基于DeepSeek模型進行二次開發(fā),公司可以構建自己的技術閉環(huán),掌握核心技術的主動權。這不僅降低了技術門檻,還能讓公司將更多資源集中在硬件開發(fā)和實際應用的優(yōu)化上。
以Figure為例,與OpenAI的合作雖然帶來了技術上的便利,但也意味著在技術上的依賴和成本上的劣勢。而DeepSeek的開源模型不僅提供了經濟高效的解決方案,還能幫助公司構建自主的技術閉環(huán),適配自身的迭代路線和產品節(jié)奏。
值得注意的是,DeepSeek不僅在推理模型上取得了突破,還推出了全新的視覺語言模型DeepSeek-VL。這一模型追求基于現(xiàn)實場景的領先性能,并保留了強大的語言能力。這對于人形機器人而言具有重要意義,因為語言能力是實現(xiàn)人機交互的關鍵。
DeepSeek-VL的推出,為人形機器人行業(yè)帶來了新的可能性。雖然目前僅公開了兩個版本的模型,但其基于現(xiàn)實場景的領先性能和強大的語言能力,已經引起了業(yè)界的廣泛關注。對于人形機器人廠商而言,DeepSeek-VL可能成為加速人形機器人走向落地的關鍵因素之一。