訂閱
糾錯(cuò)
加入自媒體

谷歌:未來機(jī)器人可以邊玩邊學(xué)

據(jù)外媒報(bào)道,近日,谷歌大腦展示了如何讓機(jī)器人沒有目標(biāo)地“玩”也可以變得更聰明。谷歌通過模擬遠(yuǎn)程操縱機(jī)器人獲得了一個(gè)數(shù)據(jù)集“Learning from Play data(LfP)”。在遠(yuǎn)程操作中,研究人員讓機(jī)器人用機(jī)械手和機(jī)械臂與現(xiàn)實(shí)世界交互,但是沒有具體的目標(biāo)。

谷歌將這個(gè)數(shù)據(jù)集用于系統(tǒng)內(nèi),該系統(tǒng)試圖對(duì)這些有趣的動(dòng)作序列進(jìn)行分類,并將它們映射到一個(gè)潛在的空間。同時(shí),系統(tǒng)中的另一個(gè)模塊試圖查看潛在空間并提出可以將機(jī)器人從其當(dāng)前狀態(tài)轉(zhuǎn)換到其目標(biāo)狀態(tài)的動(dòng)作序列。

谷歌將使用這個(gè)數(shù)據(jù)集的方法與使用行為克隆技術(shù)等方法做比較,結(jié)果發(fā)現(xiàn)使用LfP數(shù)據(jù)集的機(jī)器人表現(xiàn)更穩(wěn)定,且在大部分任務(wù)中成功率都較高。有趣的是,研究人員還發(fā)現(xiàn),使用LfP數(shù)據(jù)集訓(xùn)練的機(jī)器人在首次失敗后會(huì)多次重新嘗試完成任務(wù),且在從未接受過任務(wù)標(biāo)簽訓(xùn)練的情況下,機(jī)器人的潛在規(guī)劃空間會(huì)學(xué)會(huì)嵌入任務(wù)語義。

聲明: 本文系OFweek根據(jù)授權(quán)轉(zhuǎn)載自其它媒體或授權(quán)刊載,目的在于信息傳遞,并不代表本站贊同其觀點(diǎn)和對(duì)其真實(shí)性負(fù)責(zé),如有新聞稿件和圖片作品的內(nèi)容、版權(quán)以及其它問題的,請(qǐng)聯(lián)系我們。

發(fā)表評(píng)論

0條評(píng)論,0人參與

請(qǐng)輸入評(píng)論內(nèi)容...

請(qǐng)輸入評(píng)論/評(píng)論長度6~500個(gè)字

您提交的評(píng)論過于頻繁,請(qǐng)輸入驗(yàn)證碼繼續(xù)

  • 看不清,點(diǎn)擊換一張  刷新

暫無評(píng)論

暫無評(píng)論

人工智能 獵頭職位 更多
掃碼關(guān)注公眾號(hào)
OFweek人工智能網(wǎng)
獲取更多精彩內(nèi)容
文章糾錯(cuò)
x
*文字標(biāo)題:
*糾錯(cuò)內(nèi)容:
聯(lián)系郵箱:
*驗(yàn) 證 碼:

粵公網(wǎng)安備 44030502002758號(hào)