深度思維推出可自我訓(xùn)練“機(jī)器貓”，可快速學(xué)習(xí)新任務(wù)

2023-06-29 11:10:18 來源: 科技日?qǐng)?bào)

【資料圖】

圖片來源：深度思維

谷歌“深度思維”公司研究人員最近將人工智能與一款名為“機(jī)器貓”的機(jī)器人結(jié)合起來，預(yù)計(jì)它將在自我訓(xùn)練機(jī)器人的世界中實(shí)現(xiàn)一大飛躍。利用大型語言模型背后的相同技術(shù)研發(fā)的“機(jī)器貓”，不僅可快速學(xué)習(xí)新任務(wù)，還可通過構(gòu)建自己的性能數(shù)據(jù)來提高性能。研究論文發(fā)表在預(yù)印本服務(wù)器arXiv上。

到目前為止，機(jī)器人通常執(zhí)行特定的、預(yù)先編程的任務(wù)。隨著大型語言模型的引入，機(jī)器人技能集開始擴(kuò)大。研究人員表示，“機(jī)器貓”具有良性的訓(xùn)練循環(huán)。學(xué)習(xí)的新任務(wù)越多，它學(xué)習(xí)更多新任務(wù)的能力就越好。

“機(jī)器貓”領(lǐng)會(huì)新任務(wù)的速度非常快，例如學(xué)會(huì)將各種形狀的拼圖塊放入適當(dāng)?shù)目字谢驅(qū)⑺湃胪胫?。隨后它還能夠“基于數(shù)百萬條軌跡的數(shù)據(jù)集” 繼續(xù)前進(jìn)并執(zhí)行更復(fù)雜的任務(wù)，這些數(shù)據(jù)集來自先前的任務(wù)和新的自生成數(shù)據(jù)，這類似于人類在特定領(lǐng)域加深學(xué)習(xí)時(shí)發(fā)展出的更多樣化的技能。

隨著“機(jī)器貓”技術(shù)的改進(jìn)，其新學(xué)到的行為將被轉(zhuǎn)移到其他機(jī)器人上，而其他機(jī)器人又以這些技能為基礎(chǔ)。演示中，該機(jī)器人通過人類控制的機(jī)械臂進(jìn)行了100到1000次演示，微調(diào)了其性能，然后對(duì)衍生模型進(jìn)行特定任務(wù)的訓(xùn)練，并將數(shù)據(jù)輸入到通用指令池中。

“機(jī)器貓”最初在接觸以前未學(xué)過的任務(wù)時(shí)，有36%的成功率，但隨著時(shí)間的推移，通過自我訓(xùn)練，它的成功率提高了一倍。目前它只需100次演示就可完成一項(xiàng)新任務(wù)。

研究人員表示，這一研發(fā)成果減少了對(duì)人類監(jiān)督訓(xùn)練的需求，是創(chuàng)建通用機(jī)器人的重要一步。

關(guān)鍵詞：

深度思維推出可自我訓(xùn)練“機(jī)器貓”，可快速學(xué)習(xí)新任務(wù)

您可能也感興趣:

今日熱點(diǎn)

天天亮點(diǎn)！浙江溫州：全市已有30個(gè)用于企業(yè)節(jié)能的儲(chǔ)能項(xiàng)目

久負(fù)盛名的拼音久負(fù)盛名|全球視點(diǎn)

水網(wǎng)與碧道并行廣東佛山鋪開水城相融綠美畫卷

更多

更多

排行

最近更新

今日要聞

深度思維推出可自我訓(xùn)練“機(jī)器貓”，可快速學(xué)習(xí)新任務(wù)

您可能也感興趣:

今日熱點(diǎn)

天天亮點(diǎn)！浙江溫州：全市已有30個(gè)用于企業(yè)節(jié)能的儲(chǔ)能項(xiàng)目

久負(fù)盛名的拼音 久負(fù)盛名|全球視點(diǎn)

水網(wǎng)與碧道并行 廣東佛山鋪開水城相融綠美畫卷

為您推薦

胡錫進(jìn)昨日宣布進(jìn)入中國股市，A股今日大漲！|微速訊

能吃能喝能上天，還能保存上千年！多地高校錄取通知書上新

遠(yuǎn)大住工控股股東張劍擬增持1000萬-3000萬股H股股份

內(nèi)蒙古“教育招生考試中心填報(bào)志愿輔助系統(tǒng)”上線，助力考生填報(bào)志愿|全球微動(dòng)態(tài)

更多

更多

排行

最近更新

今日要聞

深度思維推出可自我訓(xùn)練“機(jī)器貓”，可快速學(xué)習(xí)新任務(wù)

久負(fù)盛名的拼音久負(fù)盛名|全球視點(diǎn)

水網(wǎng)與碧道并行廣東佛山鋪開水城相融綠美畫卷

胡錫進(jìn)昨日宣布進(jìn)入中國股市，A股今日大漲！|微速訊

能吃能喝能上天，還能保存上千年！多地高校錄取通知書上新

內(nèi)蒙古“教育招生考試中心填報(bào)志愿輔助系統(tǒng)”上線，助力考生填報(bào)志愿|全球微動(dòng)態(tài)