悶熱的場館里,興奮的議論聲,所有人生怕錯過這場AI讓機(jī)器人進(jìn)化的盛宴。
8月21日,2024世界機(jī)器人大會(WRC)在北京開幕。在這場由169家企業(yè)攜600余款產(chǎn)品的展會中,具身智能以幾乎單獨“承包”一個場館的陣仗,27家公司的人形機(jī)器人和機(jī)器狗吸納了最多的觀眾。
在眾多機(jī)器人的演示中,光錐智能發(fā)現(xiàn)各家企業(yè)執(zhí)行復(fù)雜任務(wù)的能力明顯變強(qiáng),實用性也得到了很大的提升。
相比去年機(jī)器人更多演示跳舞、對話、走兩步的簡單任務(wù)能力,今年有偉景智能機(jī)器人摘水果、優(yōu)必選機(jī)器人檢修汽車、星辰智能機(jī)器人寫毛筆字、加速進(jìn)化的人形機(jī)器人足球比賽。宇數(shù)科技在表演了連續(xù)側(cè)身翻跳躍的機(jī)器狗外,還帶來了定價9.9萬元的人形機(jī)器人——G1。在眾多廠商機(jī)器人的能力演示和價格的發(fā)布中,人形機(jī)器人距離走向現(xiàn)實的時刻越來越近。
“大模型的發(fā)展,極大地促進(jìn)了人形機(jī)器人的進(jìn)步。”
科大訊飛副總裁、研究院院長劉聰對光錐智能稱,不管是“大腦”感知和理解的能力,還是“小腦”的運(yùn)動控制能力都大幅提升。
進(jìn)一步,逐際動力聯(lián)合創(chuàng)始人兼COO張力認(rèn)為,AI的進(jìn)化讓機(jī)器人實現(xiàn)了跨越式的提升,“通用人工智能讓軟件、算法能夠幫助機(jī)器人去實現(xiàn)很多以前根本完成不了的事”,
隨著AI大模型的突破,今天的人形機(jī)器人開始向著自動駕駛的方向發(fā)展。在借鑒了端到端大模型讓汽車一邊理解世界,一邊快速迭代的進(jìn)化中,機(jī)器人也展現(xiàn)出了能夠理解復(fù)雜指令和學(xué)習(xí)更流暢的動作。同時,在大模型訓(xùn)練需求下,人形機(jī)器人也來到了數(shù)據(jù)驅(qū)動智能迭代的階段。而各家機(jī)器人廠商也在試圖從家用、工業(yè)、倉儲物流、零售等一系列場景中占得一席之地。希望以單一場景為中心取得數(shù)據(jù)和迭代的閉環(huán)后,打通不同領(lǐng)域,最終走向通用。
盡管在過去AI發(fā)展的十年中,機(jī)器人曾經(jīng)歷多次希望和幻滅。但通過本次機(jī)器人的明確進(jìn)化方向,星塵智能創(chuàng)始人來杰興奮地稱,“下一個十年,最值得做的就是人形機(jī)器人”。
機(jī)器人正在掀起一場資本、技術(shù)和產(chǎn)業(yè)的共同狂歡。
資本相信人形機(jī)器人
“這兩年看到最多的投資,除了大模型就是機(jī)器人”,劉聰對光錐智能稱。
雖然人形機(jī)器人行業(yè)尚處能力演示的階段,但投資者和創(chuàng)業(yè)者們都知道,不能錯過這場風(fēng)口。
在回顧近一年來的投資趨勢后,我們發(fā)現(xiàn)人形機(jī)器人作為熱度最高的機(jī)器人終極形態(tài),技術(shù)和難度都最高的同時,也在資本市場中占領(lǐng)了高地。
創(chuàng)業(yè)者層面,IT桔子數(shù)據(jù)顯示,2023年1月至今國內(nèi)共成立了29家人形機(jī)器人公司,其中有22家已經(jīng)獲得至少1輪融資。其中,由前華為天才少年“稚暉君”創(chuàng)立的智元機(jī)器人,在成立17個月就完成了七輪融資,投前估值已達(dá)70億元。
站在資本的角度,根據(jù)《中國電子報》的不完全統(tǒng)計,2024年上半年全球人形機(jī)器人領(lǐng)域融資事件超過22起,融資金額超過70億元。對于人形機(jī)器人的投資熱情,不少投資機(jī)構(gòu)的布局堪稱“掃貨”。
藍(lán)馳創(chuàng)投合伙人曹巍表示,在機(jī)器人領(lǐng)域已經(jīng)投資了超過10家早期項目。經(jīng)緯創(chuàng)投更是手握宇樹科技、智元機(jī)器人、銀河通用、星塵智能,四家人形機(jī)器人公司的“明星天團(tuán)”。
“行業(yè)和資本都對機(jī)器人的未來很樂觀,畢竟這是個萬億的市場”。在大會現(xiàn)場,優(yōu)必選全球營銷總監(jiān)李卓對光錐智能稱。
于是,人形機(jī)器人在軟件、硬件、資本推動、前沿應(yīng)用效果的共同作用下,成了AI時代最熱門的賽道。
以宇樹科技在2023年初才開始探索人形機(jī)器人的經(jīng)驗為例。之前不做人形機(jī)器人的理由,王興興認(rèn)為,“全球人形機(jī)器人的控制技術(shù),大家都做的不是特別理想。性能上不去,達(dá)不到實用或者干活的階段,所以過去很多年都沒做人形機(jī)器人”。
如今,隨著機(jī)器人軟硬件技術(shù)升級,人形機(jī)器人正逐漸從實驗室走到實際的運(yùn)用場景中。今年7月,馬斯克稱特斯拉工廠已有兩臺Optimus機(jī)器人在進(jìn)行電池搬運(yùn)工作。在本次機(jī)器人大會現(xiàn)場,我們也看到了優(yōu)必選的人形機(jī)器能執(zhí)行簡單的汽車質(zhì)檢任務(wù)。
誠然,以人類熟練工的角度來衡量,機(jī)器人“員工”的效率還是太低。但若是與規(guī)模疊加,人形機(jī)器人24小時連軸工作的特性,還是吸引了汽車、物流、科研院所、AI科技等不同行業(yè)的嘗試意愿,共同催促著人形機(jī)器人的交付進(jìn)程。
“在2022年底,我們還沒做人形機(jī)器人,但已經(jīng)有一些客戶找我們想買人形機(jī)器人了”,王興興認(rèn)為宇樹科技的人形機(jī)器人進(jìn)展都是順勢而為的結(jié)果。
不過,獵豹移動董事長兼CEO、獵戶星空董事長傅盛認(rèn)為機(jī)器人行業(yè)還有很多方面需要打磨,尤其是“兩條腿走路”的人形機(jī)器人要面臨物理學(xué)的限制,“雙足機(jī)器人的技術(shù)過于復(fù)雜,它必須依賴于機(jī)械結(jié)構(gòu)。機(jī)械結(jié)構(gòu)的迭代不會像自動駕駛那么快,每年能進(jìn)步的幅度不多。”
但總之,行業(yè)內(nèi)的玩家們在人形機(jī)器人的預(yù)計成熟時間上,達(dá)成了基本的一致意見。李卓對光錐智能表示稱,“預(yù)計行業(yè)還有3-5年才能徹底成熟”。
在頭部創(chuàng)業(yè)者們看來,此時此刻的人形機(jī)器人恰如2019年,特斯拉剛推出FSD芯片、百度Apollo剛拿到多張測試牌照的自動駕駛,一切都充滿了希望。
一切,都是因為人形機(jī)器人在本輪AI大模型的影響下,實現(xiàn)了根本性的改變。
AI進(jìn)化,機(jī)器人更像人
“一個是大語言模型,另一個是端到端算法。”
光輪智能創(chuàng)始人兼CEO謝晨如此總結(jié)著本輪機(jī)器人進(jìn)化的最大原因。
在大會現(xiàn)場,無論是人形機(jī)器人、機(jī)器狗,甚至差異化設(shè)計的餐飲機(jī)器人都表現(xiàn)出了“更合理”的動作表現(xiàn)。以一年周期為對比,今年大會上的機(jī)器人操作明顯流暢了許多。
較為明顯的例子,可以從機(jī)器人做冰淇淋這一簡單任務(wù)中看出。在去年的世界機(jī)器人大會上,機(jī)械臂的運(yùn)動基本上是單調(diào)地執(zhí)行“轉(zhuǎn)圈”。而今年遨博智能的冰激淋機(jī)器人動作明顯更加流暢,機(jī)械臂僅轉(zhuǎn)了一圈,就將冰淇淋接了出來。
不同的動作流暢度,意味著機(jī)器人任務(wù)執(zhí)行的底層邏輯發(fā)生了改變。
“原先機(jī)器人操作設(shè)計是模塊化的,底層是學(xué)習(xí)加規(guī)則混合的方案。”星海圖聯(lián)合創(chuàng)始人、清華大學(xué)交叉信息學(xué)院助理教授、MARS Lab主任趙行解釋稱,“這種模式有點像之前自動駕駛的物體檢測-決策-規(guī)劃-控制的過程。例如做一個抓取策略,之前我們要對物體進(jìn)行檢測、狀態(tài)和姿態(tài)估計。但現(xiàn)實情況的物體大多沒什么姿態(tài)可言,就像一張紙鋪在桌子上,很難定義姿態(tài)和關(guān)鍵點。”
這與自動駕駛的發(fā)展過程如出一轍。此前的機(jī)器人動作規(guī)劃與自動駕駛發(fā)展到“端到端”前,遇到得是同樣的問題——在特定場景的開發(fā)模式下,只能靠規(guī)則寫有限的動作,無法適應(yīng)真實世界的無限場景。
機(jī)器人只能操作有限形狀和種類的物體,就像是自動駕駛只能在封閉路段使用一樣“雞肋”。而有了“端到端”的機(jī)器學(xué)習(xí)之后,如同汽車能夠自己學(xué)習(xí)如何掉頭一樣,機(jī)器人也能學(xué)習(xí)如何抓取不同形狀、顏色、柔軟程度不同的物體。
參考自動駕駛結(jié)合大模型的趨勢,機(jī)器人在結(jié)合了多模態(tài)大模型后,也開始能理解現(xiàn)實世界。在現(xiàn)場,銀河通用機(jī)器人展示的便是藥店值班的場景。機(jī)器人在拿取貨架上的藥品之余,看到有東西掉到地上還能自己撿起來。
AI大模型對于機(jī)器人能力提升的重要性,劉聰認(rèn)為主要體現(xiàn)在三個方面:
首先,大模型顯著提升了機(jī)器人解決復(fù)雜任務(wù)的能力,根據(jù)理解,把復(fù)雜任務(wù)拆解成一系列可執(zhí)行的任務(wù)。
接下來,在多模態(tài)大模型的能力下,機(jī)器人可以依托視覺、觸覺等在更復(fù)雜地場景里做事。
最后,體現(xiàn)在運(yùn)動能力上,機(jī)器人可以根據(jù)AI合成的數(shù)據(jù)做模擬訓(xùn)練。如果沒有大模型,機(jī)器人實現(xiàn)的功能會相對受限。
由此也看出,數(shù)據(jù)是除了大模型技術(shù)外,制約機(jī)器人下一步進(jìn)化最關(guān)鍵的要素。
為了獲取足夠用于機(jī)器人訓(xùn)練的數(shù)據(jù),不少廠商通過真實數(shù)據(jù)和仿真數(shù)據(jù)結(jié)合的方式解決。在真實數(shù)據(jù)的獲取中,廠商一般通過真人動作和機(jī)器人遙操作的方式,將任務(wù)過程中的數(shù)據(jù)“喂”給大模型。而仿真數(shù)據(jù)則是通過搭建一個盡量真實的場景,設(shè)定盡可能多的建模和現(xiàn)實參數(shù),讓虛擬化的機(jī)器人進(jìn)行訓(xùn)練。
不過,上述的兩種方式還是存在著各自的短板,當(dāng)前機(jī)器人行業(yè)還遠(yuǎn)未達(dá)到數(shù)據(jù)飛輪的啟動時刻。一方面真實數(shù)據(jù)的成本極高,機(jī)器人當(dāng)前還達(dá)不到自動駕駛般的普及度。在真實數(shù)據(jù)足夠多之前,廠商需要花長時間和配備數(shù)據(jù)標(biāo)準(zhǔn)團(tuán)隊來一點點積累。而對于仿真數(shù)據(jù)而言,最大的問題還是現(xiàn)實仿真不夠真實。機(jī)器人在模擬世界能成功,但導(dǎo)入到現(xiàn)實世界就會有一定的失敗率。
“現(xiàn)階段,對機(jī)器人行業(yè)最大的一個限制,還是AI不太夠。AI模型、AI的訓(xùn)練數(shù)據(jù)集、AI的場景的落地部署,都完全遠(yuǎn)遠(yuǎn)不夠。”王興興稱。
而隨著AI的發(fā)展,趙行預(yù)判,“隨著更高效的算法和算法的泛化能力提升,未來機(jī)器人學(xué)習(xí)一個技能的數(shù)據(jù)量將會從現(xiàn)在的幾千、幾萬,下降到一千甚至幾百幾十的數(shù)量級。”
參考自動駕駛行業(yè)由量產(chǎn)帶來的數(shù)據(jù)飛輪,為了進(jìn)一步解決數(shù)據(jù)問題,不少機(jī)器人廠商正在探索從量產(chǎn)中“拿”數(shù)據(jù)了。
搶銷量
人形機(jī)器人站在量產(chǎn)前夜
價格,是人形機(jī)器人走向量產(chǎn)的一大制約因素。
據(jù)光錐智能在世界機(jī)器人大會上向各家了解,智元機(jī)器人合伙人兼營銷服副總裁姜青松稱,一臺1.7m高的人形機(jī)器人行業(yè)內(nèi)售價大概為60-70萬。
相比前幾年數(shù)百萬起的波士頓動力,這些價格已經(jīng)是少數(shù)行業(yè)能接受的“嘗鮮價”,但離大規(guī)模普及還非常遙遠(yuǎn)。
王興興稱,“現(xiàn)在還沒有真正到商業(yè)閉環(huán)。一臺機(jī)器人達(dá)不到比人還低的成本,商業(yè)價值依舊不是正向的。”
這是因為,從研發(fā)成本角度,由于人形機(jī)器人的不成熟,公司的研發(fā)過程會在技術(shù)布局、硬件選用、場景設(shè)計等環(huán)節(jié)中設(shè)置充分的冗余空間。這導(dǎo)致產(chǎn)品在前期研發(fā)成本的分?jǐn)傁拢?ldquo;背”上了大量除必要硬件之外的“隱性成本”。
而在銷售環(huán)節(jié)結(jié)束之后,機(jī)器人公司還要繼續(xù)為應(yīng)用效果負(fù)責(zé)。“廠商要為工業(yè)應(yīng)用試點客戶,配置專門的駐場團(tuán)隊來進(jìn)行后續(xù)研發(fā)和維護(hù)”,在大會現(xiàn)場,一位參展商這樣告訴光錐智能。
雖然當(dāng)前的客戶需求和產(chǎn)品都非常不標(biāo)準(zhǔn)化,但是光錐智能在大會現(xiàn)場發(fā)現(xiàn),不少廠商已經(jīng)嘗試在不同的需求下,制定了相應(yīng)的產(chǎn)品策略,試圖讓機(jī)器人的銷售更加順暢。
基本上,光錐智能了解到多家廠商的通用人形機(jī)器人售價集中在50-60萬元的區(qū)間,并搭配廉價的量產(chǎn)版本作為產(chǎn)品線補(bǔ)充。例如,四足機(jī)器人銷量最高的宇樹科技,其通用人形機(jī)器人H1售價就定在了50-60萬,最新的G1人形智能體也發(fā)布了量產(chǎn)版本,售價僅9.9萬人民幣起。
另一邊,眾擎機(jī)器人的人形機(jī)器人銷售更加極致,為了降低成本,在拿掉了機(jī)器人的“頭和雙臂”后,眾擎DG01干脆把“大雙足機(jī)器人”的價格干到了3.85萬。
這或許意味著,人形機(jī)器人的第一輪價格戰(zhàn)快要來了。
但更大規(guī)模的降價,還得依靠量產(chǎn)。
日前,智元機(jī)器人預(yù)計今年的出貨量為200臺,已經(jīng)是行業(yè)頭部水平。而上一個階段中,商用清潔機(jī)器人的單家出貨量也僅在一年千臺左右。
什么時候能突破一年萬臺,甚至十幾萬臺的銷量,才是機(jī)器人真正的“iPhone時刻”。
為了達(dá)到量產(chǎn)目標(biāo),頭部人形機(jī)器人廠商已經(jīng)把第一個場景瞄向了工廠。
在全球范圍,除了特斯拉正在使用的自家機(jī)器人Optimus外,OpenAI 投資的Figure已經(jīng)與寶馬合作,計劃在美國南 卡羅來納州落地Figure01機(jī)器人。而美國機(jī)器人制造商Apptronik則與奔馳合作,Apollo機(jī)器人已經(jīng)在奔馳的流水線上搬箱子了。
在國內(nèi),當(dāng)前落地最快的還是人形機(jī)器人唯一一家上市公司優(yōu)必選。今年以來,優(yōu)必選的人形機(jī)器人已經(jīng)進(jìn)入蔚來汽車、東風(fēng)柳汽、吉利汽車、一汽等多家車企“打工”。隨著優(yōu)必選在經(jīng)典制造業(yè)場景的落地,人形機(jī)器人在質(zhì)檢、搬貨、分揀、擰螺絲、裝配等環(huán)節(jié),初步驗證了行業(yè)應(yīng)用的可行性。
“目前機(jī)器人行業(yè)尚在早期,但隨著大模型的加持,技術(shù)和產(chǎn)品的從0到1,有望在三年內(nèi)一起突破。”謝晨總結(jié)道。
榜單收錄、高管收錄、融資收錄、活動收錄可發(fā)送郵件至news#citmt.cn(把#換成@)。
海報生成中...