來源:天天炫技
這年頭,人形機器人都有清華的學(xué)士帽戴!
【資料圖】
這位走出清華二校門的機器人,簡直要把門口參加暑期研習(xí)營的小孩們饞哭?了。?
不?僅擁?有清華紫學(xué)士帽,在剛剛結(jié)束的WAIC“具身通用人工智能”論壇上,這個名叫小星的人形機器人,還和圖靈獎得主、中國科學(xué)院院士姚期智合影貼貼。
是誰羨慕了?我不說。
小星這“人”,出自清華大學(xué)交叉信息研究院(IIIS)陳建宇團隊,整機結(jié)構(gòu)、電機、減速器、驅(qū)動器、步態(tài)算法等機器人軟硬件將通通自研。
陳建宇,31歲的清華叉院助理教授,28歲時,就已經(jīng)以叉院博導(dǎo)的身份走在從教之路上。
博士畢業(yè)于UC伯克利,本科就讀于清華大學(xué)精密儀器系,研究領(lǐng)域包括機器人學(xué)、強化學(xué)習(xí)、自動駕駛等。
人形機器人小星
一起來認識一下,這位青年博導(dǎo)“教”出來的人形機器人——
體重28kg,身高1.2m,加上雙手后,全身上下具有34個自由度。
在行走方面,小星在不同類型的地面上都可以穩(wěn)步前進,比如落滿枯葉的林間小道:
?
?
或者是公園花壇旁的水泥上坡路:
腳下的地皮換成草坪,也不妨礙它踏步前進:
?
總之就走得還挺穩(wěn)的,速度也還不錯。
與此同時,它還能利用雙手提供一些服務(wù)功能,遞個燒烤、端杯咖啡什么的:
在液壓驅(qū)動和電機驅(qū)動二者之間,小星采用了成本優(yōu)勢更高的后者。
為了研發(fā)高性能、低成本的人形機器人,團隊堅持最新一代的準直驅(qū)力控方案,用高扭矩密度電機搭配低減速比減速器,用電流環(huán)直接力控搭配動態(tài)雙足行走算法。
這種方案對電機扭矩要求極高,因此團隊也一直在探究新的電機設(shè)計方案。
目前所研制的電機扭矩密度已達到了30Nm/kg,是TQ電機(目前工業(yè)界最強)的兩倍以上。
如此一來,無論是行走還是擺臂動作,小星都能保持在一個比較靈活的狀態(tài)。
不過,陳建宇也坦然表示,目前小星機器人硬件上搭載的算法智能性還不夠高,小星的現(xiàn)階段表現(xiàn),還沒有發(fā)揮硬件可以支持的極限。
因此,團隊的另一項主要工作就是推進前沿的機器人智能算法,目前走的是動力學(xué)模型+優(yōu)化控制和物理仿真+強化學(xué)習(xí)這兩條機器人領(lǐng)域最前沿的路徑。
相比于傳統(tǒng)的機器人算法,二者都更為通用,并且可以更多地利用動力學(xué)來提高性能。
這兩大方法也是陳建宇博士期間的主攻研究方向。
2017年,陳建宇提出了一系列實時軌跡優(yōu)化算法并成功應(yīng)用于無人車上。
從2018年起,陳建宇的研究重點轉(zhuǎn)向了更為前瞻的方法——深度強化學(xué)習(xí)算法。在這一階段,他做出了領(lǐng)域內(nèi)較早的幾個基于自學(xué)習(xí)方法的復(fù)雜道路環(huán)境自動駕駛工作。
“從數(shù)學(xué)上來說,無人車也是一類機器人,我們研究的算法對于無人車和機器人來說都是通用的?!?陳建宇表示,在無人車時期關(guān)于強化學(xué)習(xí)的經(jīng)驗,不少都可以遷移到人形機器人的研究上,“當然,無人車和人形機器人的關(guān)注點不全相同,比如無人車在底層控制方面相對簡單,而對上層的決策規(guī)劃和交互等關(guān)注較多”。
通過強化學(xué)習(xí)結(jié)合人體運動數(shù)據(jù),小星在高精度物理仿真中學(xué)會了高度擬人的步態(tài)行走:
還能挖掘出硬件的極限性能,達到4m/s的奔跑速度:
除了靈活的雙腿,小星的雙手也很靈巧。
通過大規(guī)模并行仿真強化學(xué)習(xí)訓(xùn)練,小星學(xué)會操控其二十多個自由度的雙臂靈巧手來完成各類任務(wù)。
此外,為了協(xié)調(diào)小星手腳之間的協(xié)同工作,團隊還提出了一種分布式技能學(xué)習(xí)算法。
?
“我想,人形機器人是所有機器人學(xué)家的夢想!”從本科起,陳建宇就開始關(guān)注雙足步態(tài)算法,他的本科畢業(yè)設(shè)計,做的就是雙足機器人落腳點規(guī)劃。
2020年畢業(yè)回國,在探索過無人車、機械臂、機器狗后,于2021年底開始構(gòu)思籌劃研發(fā)自己的人形機器人。
籌備了半年,想通了技術(shù)路徑,也就是去年春夏之交,陳建宇開啟了自己的新目標:
打造人形通用機器人,以及搭載在上面的“通用智能”。
具身通用人工智能
目前人形機器人存在的技術(shù)難題是什么?陳建宇總結(jié)了最受關(guān)注的三個方面:
首先,由于人形機器人具備高度集成性和復(fù)雜性,硬件本體構(gòu)建具有較高挑戰(zhàn)性;
其次是運動小腦的構(gòu)建,如何控制雙腿行走和操控雙臂完成各種任務(wù),還未被很好解決;
最后是人形機器人的“大腦”,如何將目前只有語言功能的大模型拓展到物理世界,并讓其進行行為決策,是實現(xiàn)具身通用智能體至關(guān)重要的一環(huán)。
——這就引出近期最火的技術(shù)話題之一,具身智能。
5月的ITF World 2023半導(dǎo)體大會上,黃仁勛在演講中明確表態(tài),下一波AI浪潮就是具身智能(Embodied Intelligence)。
所謂具身智能,就是能夠理解、推理并與物理世界互動的智能系統(tǒng),可以理解為有身體,并支持物理交互的AI智能體。
而具身智能的終極目標,就是具身通用人工智能。以ChatGPT為代表的通用人工智能雖然帶來了極大的轟動,但其只有語言與文本處理的能力。未來我們一定需要更加有用的具身的通用人工智能。
7月WAIC的具身通用人工智能論壇,邀請了包括姚期智先生、Sergey Levine、Anca Dragan、Koushil Sreenath、Jiajun Wu等國內(nèi)外知名大咖學(xué)者一起探討具身AGI的未來,內(nèi)容涵蓋決策控制、感知認知、本體構(gòu)建、算力支持、大模型理論等。
小星也在論壇上進行了現(xiàn)場首秀,獲得了大量關(guān)注。
國際上,一些團隊已在這個方向上有了初步的成果:
今年年初,谷歌推出5620億參數(shù)的多模態(tài)具身視覺語言模型PaLM-E,可以執(zhí)行各種復(fù)雜的機器人指令而無需重新訓(xùn)練。
哪怕受到干擾,也能完成“幫忙從抽屜里拿薯片”的指令。
?
?
李飛飛團隊也新近發(fā)布了具身智能最新成果,大模型接入機器人,把復(fù)雜指令轉(zhuǎn)化成具體行動規(guī)劃,無需額外數(shù)據(jù)和訓(xùn)練。
人類可以很隨意地用自然語言給機器人下達指令,如“打開上面的抽屜,小心花瓶!”
陳建宇團隊也在推進這方面的研究工作。
并且做出了世界上第一篇大模型結(jié)合人形機器人的學(xué)術(shù)工作。
他們用大模型來指導(dǎo)小星的上層任務(wù)規(guī)劃,用強化學(xué)習(xí)來獲取小星的底層控制器。
與此同時,還提出了一套新的框架來解決上層規(guī)劃和下層執(zhí)行之間的對齊問題,以確保下層控制能很好地執(zhí)行上層規(guī)劃的任務(wù)。
“我們發(fā)現(xiàn),一些簡單的操作場景,接入13B的開源模型就比較夠用了?!标惤ㄓ罘窒砹藢嶒炦^程中的發(fā)現(xiàn),“作為定位家庭服務(wù)的機器人,對數(shù)理邏輯、推演等功能的要求并不太高。”
緊接著,量子位又把“大模型幻覺在具身智能身上的解決思路”這個問題拋給了陳建宇。
比起網(wǎng)絡(luò)世界里的胡說八道,現(xiàn)實世界人形機器人受到帶有幻覺的指令,似乎是一件更為嚴肅、需要正視的事情。
思考片刻后,陳建宇給出了他的答案,那就是可能需要兩手解決方案,一方面是大模型產(chǎn)品本身對幻覺的控制,另一方面,在底層的控制也要加強。
之前我在研究無人車對安全性的要求時,會設(shè)計一些方案提升無人車的行為安全,具身智能也可以采取相同的思路,在機器人收到“不安全”的指令時,及時識別,更改到安全區(qū)域范圍。
所以,添加一個完全基于物理規(guī)律,類似于安全護盾的底層保護層,或許是不錯的辦法。
本文來自微信公眾號:量子位 (ID:QbitAI),作者:衡宇
關(guān)鍵詞:
國家發(fā)改委等部門:賦予民營企業(yè)職稱評審權(quán),允許技術(shù)實力較強的規(guī)模以上民營企業(yè)單獨或聯(lián)合組建職稱評審委員會,開展自主評審
金融界8月1日消息,國家發(fā)展改革委等部門發(fā)布關(guān)于實施促進民營經(jīng)濟發(fā)展
慶“八一”主題共建活動開展
日前,和平區(qū)總工會勞模協(xié)會組織勞動模范及部分社區(qū)學(xué)生來到武警天津市
《精忠報國》2023特別版,致敬人民軍隊
“我是家園的盾牌,愿做祖國鋒利的長矛。”八一建軍節(jié),一曲特別版《精
女足世界杯丨綜合消息:澳大利亞奇跡大勝 日本威震西班牙
新華社澳大利亞阿德萊德7月31日電(記者樹文、肖世堯、岳東興)澳大利
法眼|民企內(nèi)部人背信損企肥私,如何設(shè)置入刑門檻?
民營企業(yè)工作人員背信“損企肥私”,亦將遭受刑罰。正在向社會征求意見
關(guān)于我們 加入我們 聯(lián)系我們 商務(wù)合作 粵ICP備2022077823號
創(chuàng)氪網(wǎng) www.m.cn-everich.com 版權(quán)所有 技術(shù)支持:廣州中創(chuàng)互聯(lián)網(wǎng)信息服務(wù)有限公司
投稿投訴聯(lián)系郵箱:317 493 128 @qq.com