英偉達(dá)、宇樹(shù)、銀河通用問(wèn)答全文:未來(lái)10年機(jī)器人如何改變世界
在2025年的世界機(jī)器人大會(huì)(WRC)上,英偉達(dá)Omniverse與仿真模擬技術(shù)副總裁 Rev Lebaredian、宇樹(shù)科技創(chuàng)始人王興興、銀河通用創(chuàng)始人兼CTO王鶴罕見(jiàn)同框。
在一場(chǎng)媒體溝通會(huì)上,他們圍繞物理AI、仿真、機(jī)器人平臺(tái)與商業(yè)落地、合成數(shù)據(jù)與具身智能模型的產(chǎn)業(yè)化路徑,展開(kāi)了深入交流。
Rev Lebaredian首先拋出核心判斷:過(guò)去三四十年,計(jì)算機(jī)和IT產(chǎn)業(yè)放大了各行各業(yè)的能力,但影響“大多還停留在”信息空間“,也就是可以數(shù)字化的內(nèi)容?;ヂ?lián)網(wǎng)讓計(jì)算機(jī)走進(jìn)日常生活,并帶來(lái)幾十年的增長(zhǎng),但”IT 行業(yè)的總規(guī)模約為5萬(wàn)億美元“,相比全球超過(guò)100萬(wàn)億美元的所有產(chǎn)業(yè)總量,只是小部分。他指出其他行業(yè)更大的價(jià)值在于觸達(dá)物理世界的”原子領(lǐng)域——交通、制造、物流、醫(yī)療等。
“而今天,隨著人工智能的出現(xiàn),我們終于有了讓機(jī)器具備‘物理智能’的能力,可以把物理世界和信息世界真正連接起來(lái)。”他強(qiáng)調(diào),這意味著計(jì)算機(jī)的力量將進(jìn)入100萬(wàn)億美元的物理世界市場(chǎng),而機(jī)器人正是實(shí)現(xiàn)這一躍遷的橋梁。
在他看來(lái),中國(guó)具備在這一跨越中脫穎而出的獨(dú)特條件。比如,全球近一半的人工智能研究人員和開(kāi)發(fā)者在中國(guó),本土還擁有無(wú)可匹敵的電子制造能力,以及可供大規(guī)模部署和測(cè)試的龐大制造業(yè)基礎(chǔ)。
談到英偉達(dá)的角色,他指出,公司使命是打造專門(mén)針對(duì)“最難問(wèn)題”的計(jì)算機(jī),要推動(dòng)機(jī)器人發(fā)展、物理 AI 落地,英偉達(dá)提出必須構(gòu)建三類計(jì)算機(jī):一是嵌入機(jī)器人本體的計(jì)算機(jī),例如人形機(jī)器人搭載的 Jetson Thor;二是 AI 工廠計(jì)算機(jī),用于在部署前通過(guò) DGX、HGX 系統(tǒng)處理海量數(shù)據(jù)、訓(xùn)練模型;三是仿真計(jì)算機(jī),通過(guò)物理定律生成數(shù)據(jù)并提前測(cè)試機(jī)器人,測(cè)試速度可快于現(xiàn)實(shí)時(shí)間。
目前,宇樹(shù)科技和銀河通用等機(jī)器人企業(yè)都和英偉達(dá)進(jìn)行了合作,比如銀河通用的G1 Premium人形機(jī)器人,就是首批搭載 NVIDIA Jetson Thor 的人形機(jī)器人之一,在工業(yè)碼垛、拆垛及物料箱搬運(yùn)等復(fù)雜場(chǎng)景中展現(xiàn)出流暢性與作業(yè)速度。宇樹(shù)科技則在其新型人形機(jī)器人 R1上部署了英偉達(dá)全棧機(jī)器人技術(shù),通過(guò)Isaac Sim高仿真平臺(tái)優(yōu)化運(yùn)動(dòng)與操控能力,并借助Isaac Lab系統(tǒng)實(shí)現(xiàn)快速策略迭代。
王興興表示:“某種意義上,我將人形機(jī)器人視為通用機(jī)器人的重要載體?!痹谌诵螜C(jī)器人的設(shè)計(jì)上,他認(rèn)為結(jié)構(gòu)并不如想象中復(fù)雜,“本質(zhì)上是由若干關(guān)節(jié)電機(jī)串聯(lián)而成”,因此未來(lái)當(dāng)通用 AI 成熟,“每個(gè)人都可以輕松制造一臺(tái)人形機(jī)器人,就像今天人們可以購(gòu)買(mǎi)電腦零部件組裝一臺(tái)電腦一樣,未來(lái)若AI足夠強(qiáng)大,對(duì)硬件的要求會(huì)越來(lái)越低?!?/p>
從宇樹(shù)科技的產(chǎn)品歷程看,去年,宇樹(shù)推出一款售價(jià)約9.9萬(wàn)元人民幣的人形機(jī)器人,其架構(gòu)成為全球較為主流的設(shè)計(jì)。今年發(fā)布的新版本售價(jià)約3.9萬(wàn)元人民幣,支持外觀定制,“目前現(xiàn)貨可供,預(yù)計(jì)量產(chǎn)在年底前完成?!蓖跖d興說(shuō)道。
其他產(chǎn)品線上,宇樹(shù)科技近期發(fā)布了A2機(jī)器狗,自重約37千克,持續(xù)負(fù)載可達(dá)30千克,空載續(xù)航可行駛20公里。同時(shí),宇樹(shù)科技重視機(jī)器人上肢和手部的研發(fā),王興興介紹道:“目前已自主開(kāi)發(fā)一款約20自由度的靈巧手,目標(biāo)是讓機(jī)器人真正能夠執(zhí)行日常任務(wù),而不僅是完成展示性動(dòng)作。希望在未來(lái)一到兩年內(nèi)實(shí)現(xiàn)自然交互,例如在沒(méi)有預(yù)先適配的情況下,直接指令機(jī)器人去為某人倒水?!?/p>
王鶴則從具身智能的底層邏輯切入。他指出,通用機(jī)器人將成為下一個(gè)價(jià)值數(shù)萬(wàn)億美元、數(shù)萬(wàn)億人民幣市場(chǎng)的關(guān)鍵性、革命性產(chǎn)品。這種革命性產(chǎn)品背后包含多個(gè)核心要素,第一個(gè)是機(jī)器人的本體,第二是驅(qū)動(dòng)它運(yùn)轉(zhuǎn)的具身智能模型。模型背后則是數(shù)據(jù)支撐,王鶴表示:“我們與英偉達(dá)一致認(rèn)為,合成數(shù)據(jù)是推動(dòng)具身智能快速落地的關(guān)鍵。目前,真實(shí)世界數(shù)據(jù)僅占我們訓(xùn)練數(shù)據(jù)的1%,其余99%均為合成數(shù)據(jù)。”
與此同時(shí),銀河通用和英偉達(dá)官宣了基于Isaac平臺(tái)的下一代人形機(jī)器人項(xiàng)目,“目前銀河通用為輪式形態(tài),下一代將采用純雙足設(shè)計(jì),基于OpenWBT_Isaac進(jìn)行數(shù)據(jù)采集與遙控控制。無(wú)論在仿真環(huán)境還是現(xiàn)實(shí)環(huán)境,該平臺(tái)可訓(xùn)練并部署多種任務(wù)能力,例如推車(chē)、拾取地面物體等?!蓖斛Q說(shuō)道。
他認(rèn)為,在未來(lái)的十年,人形機(jī)器人的整個(gè)占比不會(huì)小,“我預(yù)計(jì)未來(lái)每三年人形機(jī)器人的產(chǎn)值會(huì)乘10,那么我們現(xiàn)在頭部是賣(mài)1000臺(tái),三年后就是1萬(wàn)臺(tái),再三年后就是10萬(wàn)臺(tái),如果賣(mài)幾十萬(wàn)元一臺(tái)的話,就達(dá)到了1000億元,超過(guò)了整個(gè)工業(yè)機(jī)械臂的總產(chǎn)值?!?/p>
王鶴進(jìn)一步表示:“在未來(lái)10年,我們將看到的是一個(gè)能夠超越當(dāng)前所有工業(yè)機(jī)器人量的機(jī)器人市場(chǎng)。再往后10年,可能是超越汽車(chē)手機(jī)這個(gè)市場(chǎng)量的萬(wàn)億市場(chǎng),所以不能低估它,但也沒(méi)有大家想的那么快?!?/p>
從現(xiàn)場(chǎng)交流來(lái)看,要讓機(jī)器人真正走出實(shí)驗(yàn)室并規(guī)模化部署,既需要頂層算力與仿真能力構(gòu)建技術(shù)底座,也需要成本可控且可量產(chǎn)的硬件工程,以及以合成數(shù)據(jù)驅(qū)動(dòng)的大規(guī)模訓(xùn)練體系。正如王興興所言,“AI 與機(jī)器人技術(shù)將像電力與蒸汽機(jī)的發(fā)明一樣,使人類文明邁向新的高度?!?/p>
以下是英偉達(dá)Omniverse與仿真模擬技術(shù)副總裁Rev Lebaredian、宇樹(shù)科技創(chuàng)始人王興興、銀河通用創(chuàng)始人兼CTO王鶴的媒體問(wèn)答全文(經(jīng)記者整理,不改變?cè)猓?/p>
1、在像醫(yī)療和養(yǎng)老這樣高精度應(yīng)用場(chǎng)景中,NVIDIA Omniverse如何確保用仿真數(shù)據(jù)訓(xùn)練的機(jī)器人具備可靠性和安全性?
Rev:如果你想構(gòu)建一個(gè)能夠在現(xiàn)實(shí)世界中行動(dòng)且安全可靠的機(jī)器人系統(tǒng),實(shí)際上唯一的選擇就是使用仿真。舉個(gè)例子,你希望系統(tǒng)足夠智能,能夠應(yīng)對(duì)那些很少發(fā)生的特殊情況,甚至應(yīng)對(duì)你希望永遠(yuǎn)不會(huì)發(fā)生的緊急情況。
以自動(dòng)駕駛為例,我們絕對(duì)不希望車(chē)撞到人或者孩子,但當(dāng)街上出現(xiàn)小孩時(shí),車(chē)輛的大腦該如何反應(yīng),如何獲取訓(xùn)練這類系統(tǒng)的數(shù)據(jù)呢?唯一的辦法就是通過(guò)仿真。因?yàn)槲覀兘^不可能將孩子置于汽車(chē)前作為訓(xùn)練樣本,這樣做是不道德的、危險(xiǎn)的,而且耗時(shí)且昂貴。
即使訓(xùn)練完系統(tǒng),在將它部署到現(xiàn)實(shí)世界之前,也需要在這些相同場(chǎng)景中進(jìn)行測(cè)試,確保在真正發(fā)生類似情況時(shí),它能夠正確反應(yīng)。因此,真正的選擇只有通過(guò)仿真實(shí)現(xiàn),因?yàn)楝F(xiàn)實(shí)世界測(cè)試過(guò)慢、成本高且危險(xiǎn),我們不希望機(jī)器人在現(xiàn)實(shí)世界先失敗。
換句話說(shuō),如果我們無(wú)法讓仿真足夠準(zhǔn)確以測(cè)試機(jī)器人,那么我們將無(wú)法制造出可靠的機(jī)器人。幸運(yùn)的是,目前已有非常準(zhǔn)確的仿真器。不過(guò),這些仿真器計(jì)算量大且成本高昂,我們面臨的真正挑戰(zhàn)是如何提升仿真速度,使其在大規(guī)模系統(tǒng)構(gòu)建中具有成本效益,這也是我們一直努力的方向。
2、你認(rèn)為未來(lái)幾年內(nèi),驅(qū)動(dòng)人工智能機(jī)器人的仿真領(lǐng)域會(huì)有哪些關(guān)鍵技術(shù)趨勢(shì)將改變整個(gè)行業(yè)?能否分享一些中國(guó)生態(tài)合作伙伴如何利用英偉達(dá)仿真技術(shù)加速產(chǎn)品創(chuàng)新的案例?
Rev:我認(rèn)為目前最大的趨勢(shì),實(shí)際上是所有在常規(guī)人工智能領(lǐng)域出現(xiàn)的技術(shù)和發(fā)展,正被應(yīng)用到物理人工智能中。其中最重要的突破是推理能力的提升。比如DeepSeek將推理能力帶入了開(kāi)源領(lǐng)域,現(xiàn)在我們也看到了其他各種模型。
我們?cè)谥悄芩缴蠈?shí)現(xiàn)了飛躍,將同樣的技術(shù)應(yīng)用到物理人工智能,是機(jī)器人領(lǐng)域的一個(gè)重大突破。如果我們要制造這類機(jī)器人——比如能給你拿水的機(jī)器人——根據(jù)翻譯理解,可能在今年年底或明年,我們的機(jī)器人將能更自然地與人互動(dòng),并完成復(fù)雜的多步驟任務(wù)。這是非常關(guān)鍵的能力。而將這種能力與仿真結(jié)合,我認(rèn)為這是一個(gè)可能還未被廣泛理解,但將成為重大突破的點(diǎn)。
目前我們面臨的主要問(wèn)題是人工智能極度依賴數(shù)據(jù),而獲取合適的數(shù)據(jù)非常困難。我們現(xiàn)有的推理模型,尤其是對(duì)物理世界的推理,現(xiàn)在可以幫助我們改善數(shù)據(jù)生成和數(shù)據(jù)創(chuàng)建的流程。
如今我們生成的數(shù)據(jù),即使是合成數(shù)據(jù),也需要大量人工參與,人工去構(gòu)建虛擬世界和仿真環(huán)境,判斷該生成哪些數(shù)據(jù)才能讓智能系統(tǒng)更聰明。但是,如果我們把正在開(kāi)發(fā)的人工智能技術(shù)用在數(shù)據(jù)生成流程中,就可以實(shí)現(xiàn)自動(dòng)化,打造“自動(dòng)駕駛”的合成數(shù)據(jù)生成。
*博客內(nèi)容為網(wǎng)友個(gè)人發(fā)布,僅代表博主個(gè)人觀點(diǎn),如有侵權(quán)請(qǐng)聯(lián)系工作人員刪除。