7月26日,2025世界人工智能大會(WAIC 2025)在上海盛大開幕。作為全球人工智能領(lǐng)域最重要的年度盛會之一,今年的WAIC以“智能時(shí)代 同球共濟(jì)”為主題,吸引了800多家國內(nèi)外領(lǐng)先企業(yè)參展,帶來了3000余款智能科技展品。在現(xiàn)場,一片108平米的展臺人潮涌動,格外熱鬧,——這是中國具身智能的代表企業(yè)智平方(AI² Robotics)的展區(qū)。
智平方的通用智能機(jī)器人AlphaBot(愛寶)系列無疑是展區(qū)的焦點(diǎn)。它憑借一個(gè)硬件形態(tài)和一個(gè)基座大模型Alpha Brain,在現(xiàn)場真正上演了多場景、多任務(wù)的“技能秀”——打冰淇淋/咖啡/飲料、2X2碼垛、打架子鼓。三場看似簡單的演示,不僅將愛寶在生活、工業(yè)、娛樂三大場景背后的空間感知、長程柔性、全域全身、快速學(xué)習(xí)等技術(shù)底色展現(xiàn)得淋漓盡致,更是智平方對機(jī)器人通用性這一理念的踐行。
觀眾一邊拍攝視頻,一邊驚嘆:“這已經(jīng)不像是一臺普通的機(jī)器人,而是一個(gè)真正的‘智能伙伴’。”
打冰淇淋/咖啡/飲料:空間感知與長程柔性的實(shí)力秀
在生活服務(wù)體驗(yàn)區(qū),智平方特地搭建了一個(gè)全場景軟飲吧,直指特斯拉Optimus餐吧,讓愛寶秒變“全能店員”�,F(xiàn)場觀眾可以自由選擇自己喜歡的口味和配料,無論是香醇的咖啡、清甜的冰淇淋,還是特調(diào)飲料,愛寶都能在軟飲吧服務(wù)場景中無縫切換,精準(zhǔn)制作。其中,一杯咖啡或冰淇淋的制作時(shí)間大約在1分半到2分鐘,而飲料則更快,1分鐘左右就能完成。
以打冰淇淋為例,當(dāng)收到類似“愛寶,我想要一杯冰淇淋”的觀眾需求時(shí),愛寶就會抬起左手手臂,拿起紙杯,放置到冰淇淋出口下方,右手精準(zhǔn)地握住冰淇淋機(jī)的手柄,緩緩壓下,冰淇淋開始順滑地旋轉(zhuǎn)落進(jìn)杯子。等杯子裝滿后,愛寶立即松開手柄,將冰淇淋遞給觀眾。整個(gè)過程動作行云流水、毫無頓挫。
其實(shí),這不只是場簡單的機(jī)械運(yùn)動。愛寶依靠智平方自研的全域全身VLA(GOVLA)大模型,能夠迅速完成復(fù)雜的空間感知與控制:杯子的位置、手柄的角度、冰淇淋旋轉(zhuǎn)的高度都在它的掌控之中。而且,它不僅能操作眼前這一臺冰淇淋機(jī),它還能夠基于同一款硬件和同一個(gè)預(yù)訓(xùn)練大模型,根據(jù)觀眾需求在冰淇淋機(jī)、咖啡機(jī)、飲料機(jī)之間自由切換,展現(xiàn)出極強(qiáng)的跨設(shè)備執(zhí)行泛化能力。
更重要的是,愛寶的每個(gè)動作不是由單獨(dú)指令驅(qū)動,而是大模型賦予其長程柔性能力的體現(xiàn)。從識別觀眾的需求開始,它就可以自主規(guī)劃,進(jìn)行拿杯子、按下冰淇淋機(jī)手柄、遞冰淇淋等一系列操作,像一位經(jīng)驗(yàn)豐富的店員一樣,從容不迫、可靠地完成整套服務(wù)流程。
2X2碼垛:“全域全身”的工業(yè)硬實(shí)力
在工業(yè)演示區(qū),愛寶展示了其“全域全身”的碼垛搬箱技能。只見愛寶來來回回,在展區(qū)里準(zhǔn)確抓起箱子,將它們穩(wěn)穩(wěn)碼放到托盤上。不到60秒,愛寶就能完成一次碼垛,穩(wěn)定性和效率讓圍觀者連連稱贊。
這背后更是智平方在GOVLA大模型上的突破。愛寶能夠像人類一樣在工廠環(huán)境中自由移動,而不是局限于固定工位,自主規(guī)劃最優(yōu)路徑,靈活搬運(yùn)不同種類、大小、角度、顏色的箱體。它通過多模態(tài)感知精準(zhǔn)識別箱體狀態(tài),像熟練工人一樣把垛碼放得整整齊齊。當(dāng)垛形不規(guī)范時(shí),它會智能調(diào)整抓取策略;遇到突發(fā)狀況也能自動糾錯(cuò),確保作業(yè)流程持續(xù)運(yùn)行。
相比傳統(tǒng)的工業(yè)機(jī)器人只能在固定工位完成重復(fù)動作,愛寶的優(yōu)勢在于它的全域行動、全身協(xié)同的工作能力。愛寶全身擁有34+自由度,可連續(xù)工作6小時(shí),單臂負(fù)載最高可達(dá)10公斤,作業(yè)高度最高可達(dá)2.4米。這種穩(wěn)定性和高效性,使它成為制造業(yè)當(dāng)下在“招工難、用工貴”困境下的理想補(bǔ)充。
打架子鼓:快速學(xué)習(xí),實(shí)現(xiàn)速度與精準(zhǔn)的默契配合
最讓現(xiàn)場觀眾興奮的,莫過于愛寶在娛樂區(qū)的架子鼓表演。隨著經(jīng)典曲目《We Will Rock You》節(jié)奏的起伏,愛寶的手臂在鼓面上快速而準(zhǔn)確地?fù)舸�,�?.375秒就能完成一次敲擊,鼓與鼓之間的切換僅需0.75秒,堪比一個(gè)經(jīng)過專業(yè)訓(xùn)練的鼓手。
愛寶之所以能做到這樣快而準(zhǔn),靠的是融入“異構(gòu)輸入+異步頻率”創(chuàng)新架構(gòu)設(shè)計(jì)的GOVLA大模型。模型架構(gòu)借鑒了人類的“雙系統(tǒng)”思維模式,且把“雙系統(tǒng)”模塊中的“快系統(tǒng)”嵌入“慢系統(tǒng)”:慢系統(tǒng)負(fù)責(zé)整體樂曲理解和節(jié)奏把控,而快系統(tǒng)則專注于快速、精準(zhǔn)的動作執(zhí)行。它們相互協(xié)作,讓愛寶既能“聽懂”鼓譜,又能毫秒級完成復(fù)雜的鼓擊動作。
此外,GOVLA大模型的高幀率控制能力(可達(dá)200-1000Hz)讓整個(gè)演奏過程如絲般順滑,沒有延遲。對愛寶而言,樂譜只是一串?dāng)?shù)據(jù),它可以通過搭載的大模型快速學(xué)習(xí)掌握新曲目,未來甚至能挑戰(zhàn)120 BPM以上的快節(jié)奏演奏。據(jù)介紹,本次曲目的演示,愛寶只學(xué)習(xí)了大約24小時(shí)。
這場“鼓點(diǎn)秀”讓人看到,具身智能不僅能做標(biāo)準(zhǔn)化作業(yè),還能學(xué)會需要速度與精準(zhǔn)度配合的藝術(shù)表現(xiàn)。同時(shí),機(jī)器人打架子鼓這一藝術(shù)演示,也是智平方探索機(jī)器人從實(shí)用價(jià)值向情緒價(jià)值延伸的一種嘗試。
自研具身大模型發(fā)揮關(guān)鍵力量
三場演示的背后,智平方自主研發(fā)的端到端具身大模型Alpha Brain是關(guān)鍵。GOVLA作為Alpha Brain的核心技術(shù),不同于傳統(tǒng)機(jī)器人分模塊控制的方式,它通過統(tǒng)一的模型架構(gòu),將多模態(tài)信息整合處理,實(shí)現(xiàn)了從感知到動作的“端到端閉環(huán)控制”。
GOVLA大模型讓愛寶擁有全域行動和全身協(xié)同能力,突破了傳統(tǒng)機(jī)器人“固定工位”的局限,以及從簡單任務(wù)到長程復(fù)雜任務(wù)的推理能力。而且,GOVLA大模型快慢系統(tǒng)融合的創(chuàng)新設(shè)計(jì),有效解決了復(fù)雜推理與快速行動難以兼得的難題,讓愛寶機(jī)器人能夠?qū)崿F(xiàn)即想即動零延遲。
智平方在VLA技術(shù)上的突破并非一日之功。作為中國最早提出并系統(tǒng)性研發(fā)端到端VLA技術(shù)范式的創(chuàng)企,早在2024年,它與北大等頂尖機(jī)構(gòu)聯(lián)合發(fā)布的RoboMamba模型,不僅比Pi的OpenVLA更早公開應(yīng)用,還在未見任務(wù)的泛化能力上顯著超越當(dāng)時(shí)SOTA的Google RT 系列模型。今年聯(lián)合頭部高校發(fā)布的FiS-VLA,則進(jìn)一步提升了機(jī)器人在復(fù)雜環(huán)境中的響應(yīng)速度和泛化能力。這些成果不僅讓智平方躋身國際前沿,更讓全球看到了中國具身智能的技術(shù)厚度。
從展會舞臺走向產(chǎn)業(yè)落地
WAIC上的三大演示只是愛寶能力的縮影。作為中國具身智能的“產(chǎn)業(yè)派”,智平方從不止步于技術(shù)展示,而是將核心技術(shù)真正投入到高強(qiáng)度的產(chǎn)業(yè)場景中。
在汽車制造領(lǐng)域,智平方已與頭部車企展開合作。搭載GOVLA大模型的愛寶進(jìn)駐到汽車工廠,在上下料、物流轉(zhuǎn)運(yùn)、貼標(biāo)簽、收納保護(hù)布等環(huán)節(jié)中進(jìn)行應(yīng)用探索。這標(biāo)志著國產(chǎn)具身大模型首次獲得汽車制造全場景驗(yàn)證,是領(lǐng)先技術(shù)獲得頂級工業(yè)場景深度打磨的里程碑。
生物科技領(lǐng)域同樣是智平方的重要突破口。今年4月,智平方與華熙生物攜手,正在合作部署愛寶執(zhí)行無菌車間的物料轉(zhuǎn)運(yùn)、智能拆包和視覺檢驗(yàn)等操作,替代人工在高風(fēng)險(xiǎn)區(qū)域的重復(fù)性勞動,有效降低交叉污染風(fēng)險(xiǎn),并通過大模型的快速學(xué)習(xí)能力適應(yīng)多變的工藝流程。
在半導(dǎo)體制造中,愛寶已進(jìn)入吉利科技旗下晶能微電子生產(chǎn)基地,通過超強(qiáng)的跨任務(wù)泛化性能,高效執(zhí)行上下料、產(chǎn)線間物料轉(zhuǎn)運(yùn)等任務(wù)。今年,智平方也將和晶能微電子一起,推動愛寶在半導(dǎo)體制造場景的大規(guī)模使用。
除了工業(yè)場景,智平方還將業(yè)務(wù)拓展到公共服務(wù)領(lǐng)域。今年第三季度,愛寶將首次進(jìn)入國內(nèi)一線城市的機(jī)場,展現(xiàn)其在開放復(fù)雜環(huán)境下的自主行動和多任務(wù)處理能力。
這些落地案例背后,凸顯了智平方一貫的務(wù)實(shí)精神:不追求噱頭,而是扎根行業(yè)需求,通過真實(shí)應(yīng)用不斷打磨機(jī)器人性能與可靠性。它用一個(gè)又一個(gè)驗(yàn)證場景告訴市場,通用智能機(jī)器人并非遙不可及的概念,而是一項(xiàng)能夠切實(shí)改變生產(chǎn)方式與服務(wù)模式的新質(zhì)生產(chǎn)力。
智平方成立于2023年4月,短短兩年多時(shí)間,公司已經(jīng)成為國際媒體和行業(yè)關(guān)注的焦點(diǎn)。CNN、CNBC等全球頂級媒體相繼報(bào)道其突破性進(jìn)展,在剛剛結(jié)束的第三屆鏈博會上,首次參展的英偉達(dá)更是邀請愛寶亮相其核心展區(qū)。
智平方創(chuàng)始人兼CEO郭彥東博士曾說:“通用智能機(jī)器人會像智能手機(jī)和智能汽車一樣,成為人們生活中不可或缺的智能終端。”如今,這一愿景正在一步步走進(jìn)現(xiàn)實(shí)。
榜單收錄、高管收錄、融資收錄、活動收錄可發(fā)送郵件至news#citmt.cn(把#換成@)。
海報(bào)生成中...