蛇年春晚舞臺(tái)上,穿著花棉襖轉(zhuǎn)手絹的“顯眼包”人形機(jī)器人迅速走紅,后續(xù)的銷售市場(chǎng)供不應(yīng)求。該人形機(jī)器人研發(fā)企業(yè)負(fù)責(zé)人近日在接受媒體采訪時(shí)透露,今年年底前,人形機(jī)器人會(huì)達(dá)到一個(gè)新量級(jí),并將于明年應(yīng)用于一些基礎(chǔ)服務(wù)業(yè)和工業(yè)領(lǐng)域。
行走、跳舞、空翻、避障、跋山涉水……世界上人形機(jī)器人的研發(fā)成果日新月異。人們購(gòu)買人形機(jī)器人當(dāng)然不只是為了娛樂(lè),而是要讓它們工作。這是不是意味著人形機(jī)器人的時(shí)代即將來(lái)臨?它離走入大眾生活的目標(biāo)還有多遠(yuǎn)?未來(lái)的智能升級(jí)又有哪些值得期待的變化呢?



2025年2月21日,上海舉辦全球開(kāi)發(fā)者先鋒大會(huì),一名觀眾與宇樹(shù)科技人形機(jī)器人握手。
機(jī)器人技術(shù)發(fā)展歷經(jīng)三代更迭
機(jī)器人(Robot)是一種能夠半自主或全自主工作的智能機(jī)器,而人形機(jī)器人(Android)是一種旨在模仿人類外觀和行為的機(jī)器人。無(wú)論是模擬人類行為或思想,還是模擬其他生物的機(jī)械(如機(jī)器狗、機(jī)器貓等),都是機(jī)器人。在現(xiàn)代工業(yè)領(lǐng)域,機(jī)器人專指能自動(dòng)執(zhí)行任務(wù)的人造機(jī)器設(shè)備,用以取代或協(xié)助人類工作,它們一般是機(jī)電設(shè)備,由計(jì)算機(jī)程序或電子電路控制。
早在2000多年前,世界上就有關(guān)于機(jī)器人的描述和制造。比如,公元前2世紀(jì),古希臘人發(fā)明了一個(gè)可以借助蒸汽唱歌的機(jī)器人,其動(dòng)力來(lái)自水、空氣和蒸汽壓力。中國(guó)東漢時(shí)期,科學(xué)家張衡發(fā)明了測(cè)量路程用的“計(jì)里鼓車”機(jī)器人,車上裝有木人、鼓和鐘,每走1里擊鼓1次,每走10里擊鐘一次;三國(guó)時(shí)期,蜀漢丞相諸葛亮研制出的木牛流馬是最早的陸地軍用機(jī)器人。
20世紀(jì)50年代,美國(guó)發(fā)明家喬治·德沃爾與約瑟夫·恩格爾伯格一起發(fā)明了第一款工業(yè)機(jī)器人Unimate001,這也是第一個(gè)由電腦控制的數(shù)字化機(jī)器人。到了現(xiàn)代,日本早稻田大學(xué)的加藤一郎團(tuán)隊(duì)在1973年研發(fā)出世界上第一臺(tái)真人大小的人形智能機(jī)器人WABOT-1,它有兩只手、兩條腿,體內(nèi)有肢體控制系統(tǒng)、視覺(jué)系統(tǒng)和對(duì)話系統(tǒng),胸部裝有兩個(gè)攝像頭,手部裝有觸覺(jué)傳感器。
簡(jiǎn)單梳理機(jī)器人的技術(shù)發(fā)展,可以分為三代。
第一代是可編程機(jī)器人,可根據(jù)操作員所編的程序完成一些簡(jiǎn)單的重復(fù)性操作。這一代機(jī)器人從20世紀(jì)60年代后半期開(kāi)始投入使用,目前廣泛應(yīng)用于工業(yè)界。
第二代是感知機(jī)器人,也稱自適應(yīng)機(jī)器人,是在第一代機(jī)器人的基礎(chǔ)上發(fā)展起來(lái)的,具有不同程度的感知能力。這類機(jī)器人在工業(yè)界雖有應(yīng)用,但還不廣泛。
第三代機(jī)器人可稱為智能機(jī)器人,具有識(shí)別、推理、規(guī)劃和學(xué)習(xí)等能力,能夠感知外界并做出行為選擇,以及在非特定的環(huán)境下作業(yè)。如果不以人形為限制的話,現(xiàn)在的智能駕駛系統(tǒng)也可稱為智能機(jī)器人,不過(guò)這類機(jī)器人還在試驗(yàn)階段,僅少部分特定使用。
機(jī)器人為何要向“人形”發(fā)展
現(xiàn)在的機(jī)器人大部分都是非人形的,主要應(yīng)用于工業(yè),即通常所說(shuō)的工業(yè)機(jī)器人。它們大多應(yīng)用于制造業(yè)工廠里的生產(chǎn)線,還應(yīng)用于射出成型業(yè)(制造業(yè)中的核心技術(shù),廣泛應(yīng)用于塑膠和復(fù)合材料的生產(chǎn))、建筑業(yè),以及石油鉆探、礦石開(kāi)采、太空探索、水下探索、清理毒害物質(zhì)、搜救、醫(yī)學(xué)、軍事等領(lǐng)域。
工業(yè)機(jī)器人的作用是幫助人們工作,相比之下,人們更喜歡人形機(jī)器人,也就是具有人形的智能機(jī)器人。它們既能幫人干活,還有娛樂(lè)功能,甚至還出現(xiàn)了能與人交談的聊天機(jī)器人。
工業(yè)和信息化部發(fā)布的《人形機(jī)器人創(chuàng)新發(fā)展指導(dǎo)意見(jiàn)》指出,人形機(jī)器人集成人工智能、高端制造、新材料等先進(jìn)技術(shù),有望成為繼計(jì)算機(jī)、智能手機(jī)、新能源汽車后的顛覆性產(chǎn)品。但是,研發(fā)人形機(jī)器人和使其成為人類可廣泛使用的產(chǎn)品極具挑戰(zhàn)性。
首先,人形機(jī)器人應(yīng)當(dāng)擁有具身智能(EmbodiedArtificialIntelligence,EAI),即將人工智能融入人形機(jī)器人,讓它們具有像人一樣感知、學(xué)習(xí)和與環(huán)境動(dòng)態(tài)交互的能力,并伺機(jī)行動(dòng)。想擁有具身智能,人形機(jī)器人需要擁有人工智能領(lǐng)域的諸多技術(shù),如計(jì)算機(jī)視覺(jué)(模式識(shí)別、圖像處理)、自然語(yǔ)言理解與交流(語(yǔ)音識(shí)別、合成、對(duì)話)、認(rèn)知與推理(各種物理和社會(huì)常識(shí))、機(jī)器人學(xué)(機(jī)械、控制、設(shè)計(jì)、運(yùn)動(dòng)規(guī)劃、任務(wù)規(guī)劃等)、博弈與倫理(人機(jī)、代理人的交互、對(duì)抗與合作,機(jī)器人與社會(huì)融合等)、機(jī)器學(xué)習(xí)(各種統(tǒng)計(jì)的建模、分析工具和計(jì)算方法)。
其次,人們希望人形機(jī)器人能干家務(wù),并且與人互動(dòng),這是人類文化、心理認(rèn)同以及生物自然演化規(guī)律所決定的。既然要求機(jī)器人為人工作,它的“人形”就是人類的共識(shí),也是現(xiàn)在和未來(lái)機(jī)器人研發(fā)和應(yīng)用的方向,人形機(jī)器人只有呈現(xiàn)與人盡可能接近的相貌、語(yǔ)言、膚色、身高、體重和心理、行為方式,才能為人類或特定人群所完全接受。人們喜歡機(jī)器人與自己有相似的相貌和行為,是人類在演化中形成的一種心理定勢(shì)。人形機(jī)器人受青睞是緣于信任,而信任起源于最基本的心理認(rèn)同和親和力,只有信任和認(rèn)同機(jī)器人,才有可能讓其為人服務(wù)。
現(xiàn)在研發(fā)者對(duì)于機(jī)器人的“人形”只是初步要求,未來(lái)的人形機(jī)器人很有可能按照各個(gè)國(guó)家和民族的人(生物形狀)的大數(shù)據(jù)和平均值為模板,研發(fā)出更有真實(shí)感的人形機(jī)器人,以便能更好地進(jìn)行指揮和操控。
從科學(xué)的角度來(lái)看,人形機(jī)器人的研發(fā)本身就會(huì)考慮到生物和人類演化的規(guī)律。現(xiàn)代陸地生物和人類之所以演化為四條腿和兩條腿走路,是因?yàn)殛懙丨h(huán)境要求生物具有應(yīng)對(duì)自然中各種地形的行動(dòng)能力和特征,如能跨、跳、跑、走,能上坡下坎、攀援、游泳等。因此,人形機(jī)器人是對(duì)陸生動(dòng)物和人類“仿生”的必然選擇?梢韵胍(jiàn),未來(lái)有一天,外貌、身材、肌肉、溫度、表情等方面都像人的人形機(jī)器人,是社會(huì)接納度最高的智能產(chǎn)品。
中國(guó)人形機(jī)器人躋身世界前列
當(dāng)前,全球人形機(jī)器人研發(fā)企業(yè)主要分布在美國(guó)、中國(guó)、日本、英國(guó)等國(guó)。中國(guó)有宇樹(shù)科技、智元機(jī)器人、優(yōu)必選、傅利葉智能、小米、中國(guó)電科21所機(jī)器人工程中心等,競(jìng)爭(zhēng)激烈。2023年12月19日,中國(guó)電科21所機(jī)器人工程中心公開(kāi)展示了其研發(fā)的第一代人形機(jī)器人電科機(jī)器人1號(hào)。它身高1.62米,體重60千克,擁有39個(gè)自由度(包括手指關(guān)節(jié)),單臂最大負(fù)載5千克,雙臂最大負(fù)載10千克,最快行走速度5千米/小時(shí),可拿杯子、搬箱子,在斜坡、碎石地、草地等非平整路面上如履平地。
而在蛇年春晚舞臺(tái)上火出圈的16個(gè)人形機(jī)器人H1,名為福兮,身高約1.8米,體重約47千克。這種機(jī)器人的移動(dòng)速度為3.3米/秒,是目前世界上走得最快的人形機(jī)器人,潛在運(yùn)動(dòng)性能大于5米/秒,電池容量864Wh,可快速更換電池。
前面提到的人形機(jī)器人的核心特征具身智能,在福兮身上已經(jīng)具備了一些。福兮依靠高精度3D激光SLAM自主定位和導(dǎo)航、多智能體協(xié)同規(guī)劃、先進(jìn)組網(wǎng)方案等技術(shù),不僅能夠在舞臺(tái)上確保精準(zhǔn)定位和穩(wěn)定連接,讓動(dòng)作和隊(duì)形達(dá)到復(fù)制、粘貼的效果,強(qiáng)大的集群協(xié)同控制系統(tǒng)還讓它能及時(shí)隨舞臺(tái)變化做出相應(yīng)調(diào)整。同時(shí),福兮配備了360度全景深度感知技術(shù),就像長(zhǎng)了許多雙眼睛,能全面感知和看清周圍環(huán)境,讓它得心應(yīng)手地完成轉(zhuǎn)手絹這樣的技術(shù)活兒。扭胯、甩手、擺臂、轉(zhuǎn)手絹、扭秧歌……在AI驅(qū)動(dòng)全身運(yùn)動(dòng)控制技術(shù)的控制下,福兮手上功夫靈巧,身體動(dòng)作整齊。福兮還能完成原地空翻動(dòng)作,它的最大關(guān)節(jié)扭矩能達(dá)到360牛頓·米(N·m),完成許多真人表演者都難以實(shí)現(xiàn)的高難度動(dòng)作。
H1人形機(jī)器人是我國(guó)民用機(jī)器人公司宇樹(shù)科技于2023年8月推出的產(chǎn)品,2024年5月,該公司又推出了G1人形機(jī)器人。G1身高約1.27米,體重約35千克,具有超于常人的靈活性,小跑速度大于2米/秒,擁有23-43個(gè)關(guān)節(jié),最大關(guān)節(jié)扭矩達(dá)到120牛頓·米,可進(jìn)行動(dòng)態(tài)站起、坐下折疊、舞棍等高難度的動(dòng)態(tài)動(dòng)作。G1還可選配Dex3-1力控靈巧手,通過(guò)力位混合控制,模擬人手的精準(zhǔn)操作能力,可以砸核桃、搬重物,也可以拿取雞蛋等易碎物品、輕松開(kāi)啟汽水瓶蓋,或完成焊接等精細(xì)作業(yè)。G1的感知和傳感能力源自它搭載的IntelRealSenseD435和LIVOX-MID3603D激光雷達(dá),能夠進(jìn)行360度的探測(cè)感知,可以更好地適應(yīng)周圍環(huán)境。
去年,在面向開(kāi)發(fā)者的全球人工智能大會(huì)上,全球9家機(jī)器人公司研發(fā)的9臺(tái)人形機(jī)器人亮相,中國(guó)人形機(jī)器人占了兩臺(tái):一是宇樹(shù)科技的H1,二是小鵬公司研發(fā)的PX5。前者是中國(guó)首款“能跑的全尺寸通用人形機(jī)器人”,后者能踢足球、越障行走、騎平衡車等。這表明,中國(guó)的人形機(jī)器人已進(jìn)入國(guó)際一流水平行列。
預(yù)計(jì)最早2028年進(jìn)入消費(fèi)市場(chǎng)
展望國(guó)際,其他一些科技公司的人形機(jī)器人目前正處于領(lǐng)先水平。
2014年,美國(guó)波士頓動(dòng)力公司研發(fā)了第一代阿特拉斯(Atlas),是雙足人形機(jī)器人,四肢為4個(gè)液壓所驅(qū)動(dòng)。阿特拉斯由航空級(jí)鋁和鈦制造,身高6英尺(1.8米),重330磅(150千克),用藍(lán)光LED照明。它配備了兩個(gè)視覺(jué)系統(tǒng),一個(gè)激光測(cè)距儀和一個(gè)立體照相機(jī),由一個(gè)機(jī)載電腦控制,可在崎嶇道路上行走自如。2016年,阿特拉斯升級(jí)到能自主搬運(yùn)東西、開(kāi)門等,遇到較強(qiáng)沖擊力時(shí)可以像人類一樣,踉蹌兩步后找到平衡,甚至能在摔倒后站起來(lái)。隨后,阿特拉斯的技能一路開(kāi)掛,可以踩碎石、爬雪地、撐竿跳、后空翻,甚至完成高難度體操、跑酷等。美國(guó)的特斯拉公司同樣在研發(fā)人形機(jī)器人。2022年10月,特斯拉展示了其人形機(jī)器人擎天柱(Optimus),它可以在工廠周圍移動(dòng)部件,用扳手給汽車安裝螺栓。擎天柱的下一個(gè)奮斗目標(biāo)是成為用得起的家庭“伙伴”,會(huì)做飯、修剪草坪和照顧老人等。
據(jù)業(yè)界預(yù)測(cè),人形機(jī)器人應(yīng)用到工廠的時(shí)間是2024年至2027年,應(yīng)用到消費(fèi)市場(chǎng)的時(shí)間為2028年至2031年。到2035年時(shí),全球人形機(jī)器人的產(chǎn)量將達(dá)到140萬(wàn)臺(tái),市場(chǎng)規(guī)模約380億美元。
但是,在人形機(jī)器人全面進(jìn)入市場(chǎng)之前,還有許多瓶頸需要打通。
在技術(shù)上,人形機(jī)器人需要進(jìn)一步改進(jìn)行為動(dòng)作,使之與人相似或一樣。比如,在蛇年春晚表演結(jié)束后,福兮退場(chǎng)是被演員推著走的,有點(diǎn)像“扶老奶奶過(guò)馬路”。雖然福兮的速度可以達(dá)到最快3.3米/秒(人的平均步速是1.48-1.51米/秒),但顯然福兮的退場(chǎng)既趕不上人的速度,也達(dá)不到高質(zhì)量的具身智能,即能觀察實(shí)地情況,像人一樣快速退場(chǎng)。此外,人形機(jī)器人的有些部件需要高精度磨床,由于其數(shù)量有限,導(dǎo)致產(chǎn)量難以提高。同時(shí),人形機(jī)器人操控軟件(如抓取物體)和交互軟件(無(wú)需訓(xùn)練即可接收人類的語(yǔ)音指令)的研發(fā)仍存在較大的進(jìn)步空間。
價(jià)格是人形機(jī)器人的另一個(gè)重要瓶頸。目前的人形機(jī)器人還處于產(chǎn)業(yè)化初期,成本高昂,普遍10萬(wàn)美元起步。未來(lái)的人形機(jī)器人至少要降至1萬(wàn)美元,才有可能被人們普遍接受。
安全問(wèn)題也不容忽視。2024年1月,有消息稱特斯拉公司的擎天柱襲擊了一名工程師,地面還留有血跡。雖被公司認(rèn)定為謠言,但人們對(duì)于人形機(jī)器人能否嚴(yán)格遵守“機(jī)器人不得傷害人類”的核心準(zhǔn)則仍然存疑。另一個(gè)敏感的問(wèn)題就是倫理準(zhǔn)則,比如,能否讓人形機(jī)器人參與戰(zhàn)爭(zhēng)?但現(xiàn)實(shí)情況是,非人形機(jī)器人已經(jīng)在俄烏戰(zhàn)場(chǎng)上出現(xiàn)。
也許,當(dāng)上述所有問(wèn)題都得到妥善解決時(shí),人形機(jī)器人才能為人類提供高質(zhì)量、高水平、多方面的服務(wù)。作為人工智能技術(shù)的集成體現(xiàn),人形機(jī)器人是未來(lái)產(chǎn)業(yè)的一個(gè)重要賽道。如今人形機(jī)器人的研發(fā)如火如荼,它正在飛速發(fā)展的科學(xué)環(huán)境中不斷升級(jí),一步步向走進(jìn)大眾生活這個(gè)目標(biāo)靠近。