[No.L001]
7月31日消息,據(jù)外媒報道,用手抓東西是嬰兒學(xué)會做的第一件事,但這絕不是一件簡單的事情,它會隨著人的成長而變得更加復(fù)雜多變,這種復(fù)雜性使得機器很難掌握人類的行為能力。
不過,美國連續(xù)創(chuàng)業(yè)家伊隆·馬斯克(Elon Musk)和薩姆·艾爾特曼(Sam Altman)支持的OpenAI公司研究人員,已經(jīng)創(chuàng)造出一套系統(tǒng),它不僅能像人類一樣抓握和操縱物體,而且還是自行領(lǐng)悟出這些行為能力的,根本無需人類教導(dǎo)。
許多機器人和機械手已經(jīng)精通某些抓握或其他動作,比如工廠里的機器人可以比人類更靈巧地揮舞螺栓槍。但是幫助機器人完成這項任務(wù)的軟件很可能是手寫的,而且非常復(fù)雜。即使是在同一條生產(chǎn)線上,比如焊接,也需要一個全新的系統(tǒng)。
對于人類來說,拿起蘋果和拿起杯子似乎沒什么區(qū)別。不過,差異是確實存在的,只是我們的大腦會自動填補空白,讓我們可以隨機應(yīng)變,安全地握住不熟悉的物體。這是機器人遠遠落后于人類的領(lǐng)域。
此外,你不能僅僅通過訓(xùn)練機器人去做人類能做的事,你必須提供數(shù)以百萬計的例子來充分展示,人類如何操控成千上萬個給定的物體。
OpenAI的研究人員認為,解決方案就是根本不使用人類數(shù)據(jù)。取而代之的是,他們讓計算機在模擬中反復(fù)嘗試和失敗,慢慢地學(xué)習(xí)如何移動手指,以便它所掌握的對象能夠按照需要移動。
研究人員稱這套系統(tǒng)為Dactyl,他們只為其提供手指的位置和三種手持對象的攝像頭視角。但在訓(xùn)練時,所有這些數(shù)據(jù)都是在虛擬環(huán)境中進行模擬的。
在這種環(huán)境中,計算機不需要實時工作。它可以在幾秒鐘內(nèi)嘗試上千種不同的方法去抓住一個對象,分析結(jié)果并將數(shù)據(jù)轉(zhuǎn)發(fā)到下一次嘗試中。這只機械手本身就像影子般靈巧的手,也比大多數(shù)機械手復(fù)雜。
除了需要了解的不同物體和姿勢之外,還有其他隨機參數(shù),比如指尖的摩擦力、場景的顏色和燈光等等。你不能模擬現(xiàn)實中的每個方面,但是你可以確保系統(tǒng)不只是在一個藍色的房間里工作,或在帶有特殊標記的立方體上工作。
研究人員在這個問題上投入了大量的精力:6144個CPU和8個GPU,在50個小時內(nèi)收集了大約100年的經(jīng)驗。然后他們將這個系統(tǒng)首次應(yīng)用到現(xiàn)實世界中,它展示了許多令人驚訝的類人行為。
我們在不經(jīng)意間用手做的事情,比如把一個蘋果轉(zhuǎn)過來看看有沒有擦傷,或者把一杯咖啡遞給朋友時,需要用很多小技巧來穩(wěn)定或移動物體。Dactyl重新創(chuàng)建了其中的幾個過程,例如用拇指和中指握住物體,而用剩下的手指將其旋轉(zhuǎn)到想要的方向。
這個系統(tǒng)的偉大之處在于它的運動的自然性,以及它們是通過反復(fù)試驗而獨立完成的,它與任何特定的形狀或物體類型無關(guān)。就像人類一樣,Dactyl的確可以控制和操縱被放在它手里的任何東西。
這種靈活性被稱為泛化,對于必須與現(xiàn)實世界交互的機器人來說,這一點很重要。對于世界上的每個物體和每種情況來說,手工編碼行為模式是不可能的,但是機器人能夠在依賴核心理解能力的前提下適應(yīng)并填補這些空白。
榜單收錄、高管收錄、融資收錄、活動收錄可發(fā)送郵件至news#citmt.cn(把#換成@)。
海報生成中...