近期,全球英文技術社區(qū)對中國人工智能(AI)產(chǎn)業(yè)的迅猛發(fā)展表達了震驚與不解。這一情緒的觸發(fā)點主要集中在兩大創(chuàng)新成果上:宇樹科技(Unitree)的輪足式機器狗B2-W和開源MoE模型DeepSeek-V3。
宇樹科技,曾經(jīng)被視為波士頓動力的追隨者,其產(chǎn)品形態(tài)和商業(yè)定位一度缺乏亮點。然而,自B系列型號問世以來,宇樹的機器狗在靈活性方面已能與波士頓動力相媲美。特別是B2-W的推出,更是令人刮目相看。它采用了更具挑戰(zhàn)性但同時也更難平衡的動輪方案,并在短短一年內(nèi)完成了戶外復雜環(huán)境的訓練。許多國外網(wǎng)友在觀看相關視頻后,甚至懷疑這是計算機生成的圖像(CGI),而非真實場景。
波士頓動力作為行業(yè)先驅(qū),曾短暫嘗試過動輪方案,但其測試方案遠多于宇樹。然而,由于美國科技行業(yè)對制造業(yè)的普遍忽視,波士頓動力最終難逃被多次轉(zhuǎn)賣的命運?,F(xiàn)代汽車在2020年以折扣價從軟銀手中購得波士頓動力,而軟銀又是在2017年從谷歌手中接手的。谷歌之所以出售,是因為覺得該項目過于燒錢,難以承受。
這一現(xiàn)象反映了美國科技行業(yè)對制造業(yè)的深刻偏見。A16Z的合伙人馬克·安德森在2011年曾發(fā)表文章《軟件吞噬世界》,指出軟件公司因其邊際成本低而注定將接管一切。這一觀點在隨后的十幾年里得到了部分驗證,但也導致了美國科技行業(yè)對制造業(yè)的嚴重忽視。如今,從投行到企業(yè),從CEO到程序員,美國人對制造業(yè)的厭棄已成為本能。
然而,軟件終究不能脫離硬件運行。在制造業(yè)領域,中國憑借強大的供應鏈和試錯資本,正在迅速追趕并超越西方。宇樹的機器狗和DeepSeek的MoE模型就是這一趨勢的生動寫照。在“從零到一”的創(chuàng)新階段,這些新興科技的原型機往往產(chǎn)自歐美。但在“從一到十”的落地階段,中國的追趕成果開始密集呈現(xiàn)。進入“從十到百”的量產(chǎn)階段后,中國的供應鏈成本直接決定了比賽的勝負。
DeepSeek-V3的推出更是讓全球大模型廠商震驚。在微軟、meta、谷歌都在爭相構建10萬卡集群進行大模型訓練時,DeepSeek僅用了2000個GPU、不到600萬美金和2個月的時間,就實現(xiàn)了與GPT-4o和Claude 3.5 Sonnet相當?shù)男阅堋_@一成果不僅大幅降低了成本,還保持了高質(zhì)量,且是開源的。評論區(qū)里充斥著“中國人怎么做到的?”這樣的疑問。
DeepSeek的創(chuàng)始人梁文鋒表示,公司從不缺錢,缺的是高端芯片。在算力受限的情況下,中國的大模型公司不得不尋求更高效的解決方案。這種適得其反的劇情,無疑是對美國科技行業(yè)偏見的諷刺。梁文鋒還提到,他的幾家公司從量化交易到大模型開發(fā),并非金融轉(zhuǎn)為科技的過程,而是數(shù)學技能在不同應用場景之間的切換。
在采訪中,梁文鋒展現(xiàn)出了清醒和聰明的特質(zhì)。他認為,中國AI的發(fā)展不能永遠處于跟隨的位置。過去三十多年里,中國基本沒有參與到真正的技術創(chuàng)新中。但現(xiàn)在,隨著經(jīng)濟體量的增長和大廠利潤的增加,中國已經(jīng)具備了創(chuàng)新的能力。他強調(diào),中國AI的發(fā)展需要整個技術社區(qū)和產(chǎn)業(yè)的共同努力,需要有人站到技術的前沿。
梁文鋒的樂觀態(tài)度和對未來的堅定信念令人印象深刻。他表示,中國AI的發(fā)展需要時間和過程,需要被事實教育。當硬核創(chuàng)新的人功成名就時,群體性想法就會改變。他相信,隨著越來越多像他這樣的80后、90后站上主流舞臺,中國AI的未來將更加光明。