人形機器人該怎么做?應用目標是什么?
人形機器人為何這兩年突破很快?當前研究的熱門是哪三樣?未來在工業(yè)和家庭等應用的突破點是什么?在日前上海“2025 中國人形機器人生態(tài)大會”上,哈爾濱工業(yè)大學機器人研究所所長 趙杰談了他的思考。包括8 個部分:①半馬比賽是個里程碑,②為何這兩年成果很多?③肢體、小腦、大腦需協同發(fā)展,?“仿生”是拓展,而非復制人,?產業(yè)鏈從老三樣向軟硬一體化過渡,?發(fā)展階段:四橫三縱,?應用方面,工業(yè)在先,家用遙遠,?人形機器人的終極目標。
哈工大機器人所所長 趙杰
1 半馬比賽是個里程碑
人形機器人現在很火,2025 年4 月北京亦 莊還進行了“人形機器人半程馬拉松賽”,之后有些自媒體及外行人對人形機器人產生了質疑和負面觀點,一些影響還很大。
實際上,很多先驅10 年前就在做人形機器人,當年就被問到:能不能把機器人拉到操場上轉一圈?現在經過10 年,機器人不僅能在操場上,甚至還在馬路上走了21 公里—— 盡管給機器人換了幾次電,因為有些技術(例如電源)不是機器人領域要解決的核心,而是其他學科要解決的,機器人行業(yè)解決不了所有的問題。
因此,或許這次半馬賽會成為人形機器人發(fā)展的一個里程碑事件,至少解決了過去在實驗室里能走幾步,發(fā)展到近幾年能翻幾個跟頭,甚至現在已經能夠拉出去遛了,這是人形機器人往前走的必須一步。
而且這種以比賽的形式出現,一是向社會的展示,不管它是正面還是負面的;二是展示了人形機器人企業(yè)的整體自信心,因為畢竟21 公里,我們還是有好幾款機器人走完了。所以我們應該從正面的角度來肯定這件事。
2 已做了20 年,為何不如這兩年吸引眼球?
趙杰所長等專家這兩年經常被問到這樣一個問題:國家863 計劃時(注:始于1986 年3 月),機器人專家組就開始支持雙足機器人,20 多年取得的成果為何不如這兩年多?
的確,這兩年人形機器人得到了快速發(fā)展。原因主要有三點。①驅動力不同。當年863 計劃部署的項目是做科研,現在很多初創(chuàng)公司是以產品驅動的。②投資金額不同。我國前20 年在人形機器人或稱仿雙足機器人方面的總投資約1.4 億元,可能還不如現在一家初創(chuàng)公司1 年的投入。③新技術的加持。例如現在有的可以翻跟頭,有的能像人一樣以自然步態(tài)行走,……這些得益于現在端到端等新技術。
3 肢體、小腦、大腦需協同發(fā)展
首先觀察人類。一些殘疾人沒有上肢、只有雙足,叫身殘志堅,可以做一些簡單的工作;上肢健全,下肢癱瘓,也可以服務社會。類比機器人,機器人要想服務社會,還是要先把上肢做好;關于行走,是否還可以有其他形式?
還有像霍金一樣的全身癱瘓,但大腦特別聰明。相反,如果大腦不好用,就干不了活。即大腦和肢體要協同起來。
所以人形機器人的肢體、小腦、大腦必須要協同發(fā)展。
4 “ 仿生”是拓展,而非復制人
波士頓動力的新一代Atlas 電動機器人出來以后,給了業(yè)界非常好的啟示。例如人類的腦袋轉不了360°,腰轉不了360°,但新一代機器人是行的,可以比人更靈活。人的進化并不非是最優(yōu)的。
所以“仿生”一定要拓展人的能力,而非一味地復制人的能力。復制的結果可能還不如人。
5 產業(yè)鏈從老三樣向軟硬一體化過渡
隨著生成式AI加持,人形機器人推動了整個機器人產業(yè)鏈的延展。但是過去和現在的很多人形機器人企業(yè)還在熱衷宣傳減速器、電驅、關節(jié)如何好,實際上到了這個階段,不僅是人形機器人,AI 和機器人的深度融合一定會驅動機器人的產業(yè)鏈延展,是軟硬件一體化的產業(yè)鏈。
機器人產業(yè)已從原來的老三樣—— 減速器、電機、控制器,到了硬件新三樣:專用的傳感器,高算力的芯片,智能終端,以及新的軟三樣:操作系統(tǒng)、模型、數據。這是未來機器人產業(yè)鏈的一個大的構架。
我們要做的事情還有很多。例如減速器,我們大量用的諧波、行星都存在一些問題,會不會有一些新的高效率正逆向傳動類的減速器?對于觸覺/ 電子皮膚/ 觸覺傳感器,國內外已做了好多,哪種技術路線更實用?關于手,不要小看手,現在我們做的手為什么用不了?因為沒有感知的功能。所以這些方面的挑戰(zhàn),說明我們的產業(yè)鏈現在應該從關注老三樣要向整個的軟硬一體化來過渡。
6 發(fā)展階段:四橫三縱
在一些專家學者的觀點基礎上,趙杰所長進行了補充完善,總結為四橫三縱。
人形機器人的發(fā)展階段有四橫,與人的成長過程類似。首先,出生時肢體不會走;第二,慢慢地隨著肢體的健壯、小腦的發(fā)育,人開始會走了;第三,有了大腦,能對一些通用的基本智能進行理解,例如四五歲的小孩可能不識字,但至少能識別一些東西,完成一些基本動作。第四,知識賦能,就像去學校上學,只有學習才能賦予它很多智慧和技能。
縱向可以分成三類。一類是電動、液壓等類型。還有一類是創(chuàng)新型的,包括現在正在探討的熱點,諸如電動型要進入家庭,養(yǎng)老要與老人接觸,這些技術方案是不是最終的形態(tài)?實際上,想做到與人交互,本質是安全,目前還是挺難達到的。第三類是未來要探討的,例如是否還有其他形態(tài)?例如肌腱驅動的繩驅等,是不是還有很多其他的形態(tài)?
有了這個四橫三縱后,整個的技術體系應該是什么?從肢體、小腦、大腦到知識賦能,前沿技術是什么?共性技術是什么?產業(yè)鏈是什么?整機是什么樣的應用場景?相比海外,我們有跟跑的地方、并跑的地方,也有領跑的地方。一些專家正在整理這些,看看下一步到底如何來發(fā)展。
就運動控制的技術路線而言,趙杰所長在與很多專家討論,例如都知道端到端的訓練效果好,但是其泛化能力、遷移能力怎樣?即在這臺機器上訓練的,在另一臺機器上是不是好使?具體有以下兩點。
● 模型驅動。早期的Atlas是令人佩服的,沒有什么訓練,純是模型驅動。電動的Atlas 也是用端到端訓練的。之后還在模型的基礎上加入了強化學習,這條路線可能是未來可持續(xù)性的。
● 數據驅動。所謂的數據驅動、端到端、無模型等,正因為解釋不清楚,它的泛化遷移能力會非常差,短期內一次性解決是可以的,長期真正要落地到實際/ 產業(yè)的時候,其可持續(xù)性與否還是值得關注的。
7 應用:工業(yè)在先,家用遙遠
第一個是公共服務。可能公共服務會最早突破?,F在的人形機器人主要賣給科研院所,還有一些個人、娛樂機構甚至公共場所。隨著大語言模型的出現,至少對話能力增強了,答非所問減少了。這方面近一兩年已經開始在做了,但是這個市場很容易飽和,可能再有一年半載就達到飽和了。
第二個是工業(yè)場景。趙杰所長去過很多車廠,看到人形機器人。先不談這些場合是否一定要由雙足機器人來做,至少說明已在這個場合試驗,這就是進步,但是離真正用起來還有距離。我們不期望人形機器人做得比人快多少,至少它類似人,才能有用。
為什么工業(yè)場景能早于家庭場景?工業(yè)場景里用人手干活時,98%是人用工具來干活的,不是完全用手擰螺絲,而是用螺絲刀、扳手等。正因為用工具,可以把工具做快換,就可以完成一些技能型的工作。但是家用的手/ 爪真正要做好/ 實用,可能跟做機器人本體的難度差不多。所以從這個角度來看,工業(yè)場景較為容易,家庭場景挺難的。至少目前看,家庭場景方面,最先實現的也許是家庭服務類的,但是真正做點家務,真正地去服侍老人/ 養(yǎng)老/ 助老這方面可能還很遠很遠。
所以我們把人形機器人定義成未來產業(yè)。5年后的產業(yè)不是未來產業(yè),叫嶄新產業(yè)。至少10年以后的才能叫未來產業(yè)。我們現在所做的人形機器人是為未來做的,如果真的做成,未來一定是一個較大的增量。
8 終極目標是什么?
未來的機器人/ 人形機器人到底能干點什么事?愿景是什么?希望成為未來制造業(yè)的機器工人,家政服務業(yè)的機器保姆,照顧老人的機器孝子。
這個愿景實現以后會帶來什么?重構了機器人在人類社會的身份地位和生產關系。機器人將不再僅僅是生產生活的工具,而是人類生活和工作中不可或缺的伙伴。這是人形機器人的價值所在。
(本文來源于《EEPW》202507)
評論