手机看片日韩日韩久久,日韩区一区二区精品视频免费
首頁(yè) > 重磅

OpenAI機(jī)械手成精了 無(wú)需訓(xùn)練能自行掌握人類(lèi)行為

2018/07/31 10:21      騰訊科技 編譯/金鹿


  7月31日消息,據(jù)外媒報(bào)道,用手抓東西是嬰兒學(xué)會(huì)做的第一件事,但這絕不是一件簡(jiǎn)單的事情,它會(huì)隨著人的成長(zhǎng)而變得更加復(fù)雜多變,這種復(fù)雜性使得機(jī)器很難掌握人類(lèi)的行為能力。

  不過(guò),美國(guó)連續(xù)創(chuàng)業(yè)家伊隆·馬斯克(Elon Musk)和薩姆·艾爾特曼(Sam Altman)支持的OpenAI公司研究人員,已經(jīng)創(chuàng)造出一套系統(tǒng),它不僅能像人類(lèi)一樣抓握和操縱物體,而且還是自行領(lǐng)悟出這些行為能力的,根本無(wú)需人類(lèi)教導(dǎo)。

  許多機(jī)器人和機(jī)械手已經(jīng)精通某些抓握或其他動(dòng)作,比如工廠里的機(jī)器人可以比人類(lèi)更靈巧地?fù)]舞螺栓槍。但是幫助機(jī)器人完成這項(xiàng)任務(wù)的軟件很可能是手寫(xiě)的,而且非常復(fù)雜。即使是在同一條生產(chǎn)線上,比如焊接,也需要一個(gè)全新的系統(tǒng)。

  對(duì)于人類(lèi)來(lái)說(shuō),拿起蘋(píng)果和拿起杯子似乎沒(méi)什么區(qū)別。不過(guò),差異是確實(shí)存在的,只是我們的大腦會(huì)自動(dòng)填補(bǔ)空白,讓我們可以隨機(jī)應(yīng)變,安全地握住不熟悉的物體。這是機(jī)器人遠(yuǎn)遠(yuǎn)落后于人類(lèi)的領(lǐng)域。

  此外,你不能僅僅通過(guò)訓(xùn)練機(jī)器人去做人類(lèi)能做的事,你必須提供數(shù)以百萬(wàn)計(jì)的例子來(lái)充分展示,人類(lèi)如何操控成千上萬(wàn)個(gè)給定的物體。

  OpenAI的研究人員認(rèn)為,解決方案就是根本不使用人類(lèi)數(shù)據(jù)。取而代之的是,他們讓計(jì)算機(jī)在模擬中反復(fù)嘗試和失敗,慢慢地學(xué)習(xí)如何移動(dòng)手指,以便它所掌握的對(duì)象能夠按照需要移動(dòng)。

  研究人員稱(chēng)這套系統(tǒng)為Dactyl,他們只為其提供手指的位置和三種手持對(duì)象的攝像頭視角。但在訓(xùn)練時(shí),所有這些數(shù)據(jù)都是在虛擬環(huán)境中進(jìn)行模擬的。

  在這種環(huán)境中,計(jì)算機(jī)不需要實(shí)時(shí)工作。它可以在幾秒鐘內(nèi)嘗試上千種不同的方法去抓住一個(gè)對(duì)象,分析結(jié)果并將數(shù)據(jù)轉(zhuǎn)發(fā)到下一次嘗試中。這只機(jī)械手本身就像影子般靈巧的手,也比大多數(shù)機(jī)械手復(fù)雜。

  除了需要了解的不同物體和姿勢(shì)之外,還有其他隨機(jī)參數(shù),比如指尖的摩擦力、場(chǎng)景的顏色和燈光等等。你不能模擬現(xiàn)實(shí)中的每個(gè)方面,但是你可以確保系統(tǒng)不只是在一個(gè)藍(lán)色的房間里工作,或在帶有特殊標(biāo)記的立方體上工作。

  研究人員在這個(gè)問(wèn)題上投入了大量的精力:6144個(gè)CPU和8個(gè)GPU,在50個(gè)小時(shí)內(nèi)收集了大約100年的經(jīng)驗(yàn)。然后他們將這個(gè)系統(tǒng)首次應(yīng)用到現(xiàn)實(shí)世界中,它展示了許多令人驚訝的類(lèi)人行為。

  我們?cè)诓唤?jīng)意間用手做的事情,比如把一個(gè)蘋(píng)果轉(zhuǎn)過(guò)來(lái)看看有沒(méi)有擦傷,或者把一杯咖啡遞給朋友時(shí),需要用很多小技巧來(lái)穩(wěn)定或移動(dòng)物體。Dactyl重新創(chuàng)建了其中的幾個(gè)過(guò)程,例如用拇指和中指握住物體,而用剩下的手指將其旋轉(zhuǎn)到想要的方向。

  這個(gè)系統(tǒng)的偉大之處在于它的運(yùn)動(dòng)的自然性,以及它們是通過(guò)反復(fù)試驗(yàn)而獨(dú)立完成的,它與任何特定的形狀或物體類(lèi)型無(wú)關(guān)。就像人類(lèi)一樣,Dactyl的確可以控制和操縱被放在它手里的任何東西。

  這種靈活性被稱(chēng)為泛化,對(duì)于必須與現(xiàn)實(shí)世界交互的機(jī)器人來(lái)說(shuō),這一點(diǎn)很重要。對(duì)于世界上的每個(gè)物體和每種情況來(lái)說(shuō),手工編碼行為模式是不可能的,但是機(jī)器人能夠在依賴(lài)核心理解能力的前提下適應(yīng)并填補(bǔ)這些空白。

IT產(chǎn)業(yè)網(wǎng)微信二維碼logo

  榜單收錄、高管收錄、融資收錄、活動(dòng)收錄可發(fā)送郵件至news#citmt.cn(把#換成@)。

海報(bào)生成中...

分享到微博

掃描二維碼分享到微信

分享到微信
一鍵復(fù)制
標(biāo)題鏈接已成功復(fù)制

最新新聞

熱門(mén)新聞