MIT 的 3 合一訓(xùn)練工具簡化了機(jī)器人的學(xué)習(xí)
教會(huì)機(jī)器人新技能過去需要編碼專業(yè)知識(shí)。但新一代的機(jī)器人可能只需要任何人就能學(xué)習(xí)。
工程師們正在設(shè)計(jì)能夠“通過示范學(xué)習(xí)”的機(jī)器人助手。這種更自然的訓(xùn)練策略使人們能夠引導(dǎo)機(jī)器人完成一項(xiàng)任務(wù),通常有三種方式:通過遙控,例如操作操縱桿遠(yuǎn)程控制機(jī)器人;通過物理移動(dòng)機(jī)器人來完成動(dòng)作;或者自己執(zhí)行任務(wù),同時(shí)機(jī)器人觀看并模仿。
通過實(shí)踐學(xué)習(xí)的機(jī)器人通常只采用這三種演示方法中的一種進(jìn)行訓(xùn)練。但麻省理工學(xué)院(MIT)的工程師們現(xiàn)在開發(fā)了一種三合一訓(xùn)練界面,允許機(jī)器人通過這三種訓(xùn)練方法中的任何一種來學(xué)習(xí)任務(wù)。該界面是一種手持的、配備傳感器的工具,可以連接到許多常見的協(xié)作機(jī)械臂 。人們可以使用該附件通過遠(yuǎn)程控制機(jī)器人、物理操作機(jī)器人或親自演示任務(wù)來教機(jī)器人執(zhí)行任務(wù)——無論他們更喜歡哪種方式或哪種方式最適合手頭的任務(wù)。
MIT 團(tuán)隊(duì)在標(biāo)準(zhǔn)的協(xié)作機(jī)械臂上測(cè)試了他們稱之為“多功能演示界面”的新工具。具有制造專業(yè)知識(shí)的志愿者使用該界面執(zhí)行了在工廠地面上常見的兩項(xiàng)手動(dòng)任務(wù)。
研究人員表示,新的界面提供了更高的訓(xùn)練靈活性,這可能擴(kuò)大與機(jī)器人互動(dòng)的用戶和“教師”類型。它還可能使機(jī)器人能夠?qū)W習(xí)更廣泛的技能。例如,一個(gè)人可以遠(yuǎn)程訓(xùn)練機(jī)器人處理有毒物質(zhì),而在生產(chǎn)線的下一階段,另一個(gè)人可以物理地移動(dòng)機(jī)器人,模擬打包產(chǎn)品的動(dòng)作,在生產(chǎn)線末端,另一個(gè)人可以使用附件在機(jī)器人觀看的同時(shí)繪制公司標(biāo)志,機(jī)器人通過學(xué)習(xí)也能做到同樣的事情。
“我們正試圖創(chuàng)造高度智能和技能的隊(duì)友,他們能夠與人類有效合作,完成復(fù)雜的工作,”麻省理工學(xué)院航空航天系的研究生 Mike Hagenow 說。“我們相信靈活的演示工具將遠(yuǎn)遠(yuǎn)超出制造車間,在其他領(lǐng)域也能幫助機(jī)器人得到更廣泛的應(yīng)用,例如家庭或護(hù)理環(huán)境?!?/p>
Hagenow 將在 10 月的 IEEE 智能機(jī)器人與系統(tǒng) (IROS) 會(huì)議上展示一篇詳細(xì)介紹新界面的論文 。該論文的 MIT 合著者包括 Dimosthenis Kontogiorgos,他是麻省理工學(xué)院計(jì)算機(jī)科學(xué)與人工智能實(shí)驗(yàn)室 (CSAIL) 的一名博士后;Yanwei Wang 博士 ’25,他最近獲得了電氣工程與計(jì)算機(jī)科學(xué)博士學(xué)位;以及麻省理工學(xué)院教授、航空航天系主任 Julie Shah。
由 MIT 開發(fā)的便攜式設(shè)備,可用于教機(jī)器人新技能。 | 來源:MIT
一起訓(xùn)練
馬斯在 MIT 的團(tuán)隊(duì)設(shè)計(jì)可以在工作場(chǎng)所、醫(yī)院和家庭中與人類一起工作的機(jī)器人。她研究的主要重點(diǎn)是開發(fā)能夠讓人們“在職”教機(jī)器人新任務(wù)或技能的系統(tǒng)。例如,這樣的系統(tǒng)將幫助工廠車間工人快速自然地調(diào)整機(jī)器人的動(dòng)作以改善其任務(wù),而不是停下來從頭開始重新編程機(jī)器人的軟件——而工人可能并不一定具備這種技能。
該團(tuán)隊(duì)的新工作建立在機(jī)器人學(xué)習(xí)中的一個(gè)新興策略之上,該策略稱為“從演示中學(xué)習(xí)”,或 LfD,其中機(jī)器人被設(shè)計(jì)為以更自然、直觀的方式進(jìn)行訓(xùn)練。在查閱 LfD 文獻(xiàn)時(shí),Hagenow 和 Shah 發(fā)現(xiàn)迄今為止開發(fā)的 LfD 訓(xùn)練方法通常分為三大類:遠(yuǎn)程操作、運(yùn)動(dòng)覺訓(xùn)練和自然教學(xué)。
一種訓(xùn)練方法可能比其他兩種對(duì)特定的人或任務(wù)更有效。沙赫和哈根諾瓦想知道他們是否可以設(shè)計(jì)一個(gè)工具,將三種方法結(jié)合起來,使機(jī)器人能夠從更多的人那里學(xué)習(xí)更多的任務(wù)。
“如果我們能把這三種不同的人想要與機(jī)器人互動(dòng)的方式結(jié)合起來,它可能為不同的任務(wù)和不同的人帶來好處,”Hagenow 說。
麻省理工學(xué)院開發(fā)了一種手持界面,使您能夠使用三種訓(xùn)練方法中的任何一種來教機(jī)器人新技能:自然教學(xué)(左上角)、運(yùn)動(dòng)教學(xué)(中間)和遠(yuǎn)程操作。 | 來源:麻省理工學(xué)院
手頭的任務(wù)
針對(duì)這一目標(biāo),團(tuán)隊(duì)設(shè)計(jì)了一種新的多功能演示界面(VDI)。該界面是一個(gè)手持式附件,可以安裝在典型的協(xié)作機(jī)器人手臂上。該附件配備了一個(gè)攝像頭和標(biāo)記器,用于跟蹤工具的位置和隨時(shí)間推移的運(yùn)動(dòng),以及力傳感器來測(cè)量執(zhí)行特定任務(wù)時(shí)施加的壓力。
當(dāng)該界面安裝到機(jī)器人上時(shí),整個(gè)機(jī)器人可以遠(yuǎn)程控制,界面的攝像頭會(huì)記錄機(jī)器人的運(yùn)動(dòng),機(jī)器人可以利用這些數(shù)據(jù)自行學(xué)習(xí)任務(wù)。類似地,當(dāng)界面連接時(shí),人們可以手動(dòng)移動(dòng)機(jī)器人完成一個(gè)任務(wù)。VDI 也可以拆卸并由人手持以執(zhí)行所需任務(wù)。攝像頭會(huì)記錄 VDI 的運(yùn)動(dòng),當(dāng)重新安裝到機(jī)器人上時(shí),機(jī)器人也可以用來模仿該任務(wù)。
為測(cè)試附件的可用性,團(tuán)隊(duì)將界面和協(xié)作機(jī)械臂帶到當(dāng)?shù)貏?chuàng)新中心,制造專家在那里學(xué)習(xí)和測(cè)試可以改進(jìn)工廠流程的技術(shù)。研究人員設(shè)置了一個(gè)實(shí)驗(yàn),要求中心的志愿者使用機(jī)器人和界面的三種培訓(xùn)方法完成兩項(xiàng)常見的制造任務(wù):壓配合和成型。在壓配合中,用戶訓(xùn)練機(jī)器人將銷釘壓入孔中,類似于許多緊固任務(wù)。對(duì)于成型,一名志愿者訓(xùn)練機(jī)器人將一種橡膠狀、面團(tuán)狀的物質(zhì)均勻地推滾在中心桿的表面,類似于某些熱成型任務(wù)。
對(duì)于這兩個(gè)任務(wù),志愿者們被要求使用每種訓(xùn)練方法,首先使用操縱桿遠(yuǎn)程操作機(jī)器人,然后進(jìn)行運(yùn)動(dòng)學(xué)操作,最后,拆卸機(jī)器人的附件,并讓機(jī)器人“自然地”執(zhí)行任務(wù),同時(shí)記錄附件的力和運(yùn)動(dòng)。
研究人員發(fā)現(xiàn),志愿者們通常更喜歡自然方法而不是遠(yuǎn)程操作和運(yùn)動(dòng)學(xué)訓(xùn)練。這些用戶都是制造領(lǐng)域的專家,他們提出了每種方法可能在其他方法上有優(yōu)勢(shì)的場(chǎng)景。例如,遠(yuǎn)程操作可能更適合訓(xùn)練機(jī)器人處理危險(xiǎn)或有毒物質(zhì)。運(yùn)動(dòng)學(xué)訓(xùn)練可以幫助工人調(diào)整負(fù)責(zé)搬運(yùn)重包裝的機(jī)器人的位置。自然教學(xué)可以在演示涉及精細(xì)和精確操作的任務(wù)時(shí)帶來好處。
“我們?cè)O(shè)想在柔性制造環(huán)境中使用我們的演示界面,其中一個(gè)機(jī)器人可能協(xié)助執(zhí)行一系列從特定類型的演示中受益的任務(wù),”Hagenow 表示,他計(jì)劃根據(jù)用戶反饋改進(jìn)附件的設(shè)計(jì),并將使用新設(shè)計(jì)來測(cè)試機(jī)器人學(xué)習(xí)?!拔覀儗⑦@項(xiàng)研究視為展示如何通過擴(kuò)展終端用戶在教學(xué)中與機(jī)器人互動(dòng)的方式來實(shí)現(xiàn)協(xié)作機(jī)器人的更大靈活性。”
評(píng)論