OpenAI機(jī)械手成精了無(wú)需訓(xùn)練能自行掌握人類(lèi)行為

2018/07/31 10:21 騰訊科技編譯/金鹿

　　7月31日消息，據(jù)外媒報(bào)道，用手抓東西是嬰兒學(xué)會(huì)做的第一件事，但這絕不是一件簡(jiǎn)單的事情，它會(huì)隨著人的成長(zhǎng)而變得更加復(fù)雜多變，這種復(fù)雜性使得機(jī)器很難掌握人類(lèi)的行為能力。

　　不過(guò)，美國(guó)連續(xù)創(chuàng)業(yè)家伊隆·馬斯克(Elon Musk)和薩姆·艾爾特曼(Sam Altman)支持的OpenAI公司研究人員，已經(jīng)創(chuàng)造出一套系統(tǒng)，它不僅能像人類(lèi)一樣抓握和操縱物體，而且還是自行領(lǐng)悟出這些行為能力的，根本無(wú)需人類(lèi)教導(dǎo)。

　　許多機(jī)器人和機(jī)械手已經(jīng)精通某些抓握或其他動(dòng)作，比如工廠里的機(jī)器人可以比人類(lèi)更靈巧地?fù)]舞螺栓槍。但是幫助機(jī)器人完成這項(xiàng)任務(wù)的軟件很可能是手寫(xiě)的，而且非常復(fù)雜。即使是在同一條生產(chǎn)線上，比如焊接，也需要一個(gè)全新的系統(tǒng)。

　　對(duì)于人類(lèi)來(lái)說(shuō)，拿起蘋(píng)果和拿起杯子似乎沒(méi)什么區(qū)別。不過(guò)，差異是確實(shí)存在的，只是我們的大腦會(huì)自動(dòng)填補(bǔ)空白，讓我們可以隨機(jī)應(yīng)變，安全地握住不熟悉的物體。這是機(jī)器人遠(yuǎn)遠(yuǎn)落后于人類(lèi)的領(lǐng)域。

　　此外，你不能僅僅通過(guò)訓(xùn)練機(jī)器人去做人類(lèi)能做的事，你必須提供數(shù)以百萬(wàn)計(jì)的例子來(lái)充分展示，人類(lèi)如何操控成千上萬(wàn)個(gè)給定的物體。

　　OpenAI的研究人員認(rèn)為，解決方案就是根本不使用人類(lèi)數(shù)據(jù)。取而代之的是，他們讓計(jì)算機(jī)在模擬中反復(fù)嘗試和失敗，慢慢地學(xué)習(xí)如何移動(dòng)手指，以便它所掌握的對(duì)象能夠按照需要移動(dòng)。

　　研究人員稱(chēng)這套系統(tǒng)為Dactyl，他們只為其提供手指的位置和三種手持對(duì)象的攝像頭視角。但在訓(xùn)練時(shí)，所有這些數(shù)據(jù)都是在虛擬環(huán)境中進(jìn)行模擬的。

　　在這種環(huán)境中，計(jì)算機(jī)不需要實(shí)時(shí)工作。它可以在幾秒鐘內(nèi)嘗試上千種不同的方法去抓住一個(gè)對(duì)象，分析結(jié)果并將數(shù)據(jù)轉(zhuǎn)發(fā)到下一次嘗試中。這只機(jī)械手本身就像影子般靈巧的手，也比大多數(shù)機(jī)械手復(fù)雜。

　　除了需要了解的不同物體和姿勢(shì)之外，還有其他隨機(jī)參數(shù)，比如指尖的摩擦力、場(chǎng)景的顏色和燈光等等。你不能模擬現(xiàn)實(shí)中的每個(gè)方面，但是你可以確保系統(tǒng)不只是在一個(gè)藍(lán)色的房間里工作，或在帶有特殊標(biāo)記的立方體上工作。

　　研究人員在這個(gè)問(wèn)題上投入了大量的精力：6144個(gè)CPU和8個(gè)GPU，在50個(gè)小時(shí)內(nèi)收集了大約100年的經(jīng)驗(yàn)。然后他們將這個(gè)系統(tǒng)首次應(yīng)用到現(xiàn)實(shí)世界中，它展示了許多令人驚訝的類(lèi)人行為。

　　我們?cè)诓唤?jīng)意間用手做的事情，比如把一個(gè)蘋(píng)果轉(zhuǎn)過(guò)來(lái)看看有沒(méi)有擦傷，或者把一杯咖啡遞給朋友時(shí)，需要用很多小技巧來(lái)穩(wěn)定或移動(dòng)物體。Dactyl重新創(chuàng)建了其中的幾個(gè)過(guò)程，例如用拇指和中指握住物體，而用剩下的手指將其旋轉(zhuǎn)到想要的方向。

　　這個(gè)系統(tǒng)的偉大之處在于它的運(yùn)動(dòng)的自然性，以及它們是通過(guò)反復(fù)試驗(yàn)而獨(dú)立完成的，它與任何特定的形狀或物體類(lèi)型無(wú)關(guān)。就像人類(lèi)一樣，Dactyl的確可以控制和操縱被放在它手里的任何東西。

　　這種靈活性被稱(chēng)為泛化，對(duì)于必須與現(xiàn)實(shí)世界交互的機(jī)器人來(lái)說(shuō)，這一點(diǎn)很重要。對(duì)于世界上的每個(gè)物體和每種情況來(lái)說(shuō)，手工編碼行為模式是不可能的，但是機(jī)器人能夠在依賴(lài)核心理解能力的前提下適應(yīng)并填補(bǔ)這些空白。

IT產(chǎn)業(yè)網(wǎng)微信二維碼logo

　　榜單收錄、高管收錄、融資收錄、活動(dòng)收錄可發(fā)送郵件至news#citmt.cn（把#換成@）。

海報(bào)生成中...

分享到微博分享到微信一鍵復(fù)制

標(biāo)題鏈接已成功復(fù)制

OpenAI機(jī)械手成精了無(wú)需訓(xùn)練能自行掌握人類(lèi)行為

最新新聞

熱門(mén)新聞

新動(dòng)態(tài)

關(guān)注度

最話題

OpenAI機(jī)械手成精了 無(wú)需訓(xùn)練能自行掌握人類(lèi)行為

相關(guān)閱讀

最新新聞

熱門(mén)新聞

新動(dòng)態(tài)

關(guān)注度

最話題

OpenAI機(jī)械手成精了無(wú)需訓(xùn)練能自行掌握人類(lèi)行為