首頁財(cái)經(jīng) > 正文

DeepMind發(fā)布提高翻譯質(zhì)量的算法ReST

2023-08-25 06:42:07 來源: 鞭牛士

【資料圖】

谷歌DeepMind于8月21日發(fā)布論文，提出一種使LLM與人類偏好對(duì)齊更簡(jiǎn)單的算法ReST（Reinforced Self-Training）。不同于RLHF（基于人類反饋的強(qiáng)化學(xué)習(xí)）使用人類反饋改進(jìn)語言模型，ReST通過生成和使用離線數(shù)據(jù)進(jìn)行訓(xùn)練，從而使得LLM與人類偏好保持一致。研究團(tuán)隊(duì)表示，雖然ReST可用于所有生成任務(wù)，但本文的重點(diǎn)是機(jī)器翻譯。研究者在機(jī)器翻譯任務(wù)上進(jìn)行了實(shí)驗(yàn)，測(cè)試基準(zhǔn)包括IWSLT 2014、WMT 2020和Web Domain。結(jié)果表明，ReST可以極大地提高翻譯質(zhì)量。

關(guān)鍵詞：

您可能也感興趣:

今日熱點(diǎn)

平郵單號(hào)查詢系統(tǒng)（平郵單號(hào)查詢）

8米34！王嘉男最后一跳刷出賽季最佳，成功躋身男子跳遠(yuǎn)決賽

董事會(huì)有什么人組成（董事會(huì)有哪些職位）

更多

更多

排行

最近更新

DeepMind發(fā)布提高翻譯質(zhì)量的算法ReST
記者：吉達(dá)聯(lián)合愿出超1億鎊報(bào)價(jià)薩拉赫，并對(duì)達(dá)成交易很有信心
酒后砸壞公共財(cái)物，刑拘！
沖繩哪個(gè)離島最好玩沖繩旅游攻略景點(diǎn)推薦
截至6月底全國(guó)13.74億人持有社保卡——小小社?？?服務(wù)大民生
大運(yùn)河考古重要發(fā)現(xiàn)：天津十四倉遺址為元代漕運(yùn)重要見證
黃浦江→寶塔山→太行山，華東政法大學(xué)舉辦“馬克思主義新聞...
暴雨預(yù)警！四川等9省區(qū)市部分地區(qū)有大到暴雨局地大暴雨
《孤注一擲》成影史第19部30億票房影片
周雨彤太會(huì)買首飾了吧！珍珠+碎銀，太顯貴太顯白了！
啟園：面朝太湖，風(fēng)光秀美
博物館里的海洋丨南宋外貿(mào)的“移動(dòng)”支付！
8月23日昨日漲停板塊漲幅達(dá)3%
科銳國(guó)際：上半年?duì)I收超47億元增7.88% 技術(shù)總投入增三成
“搶鹽潮”在多地上演，擔(dān)心的事還是發(fā)生了
下好產(chǎn)業(yè)升級(jí)“先手棋” 跑出高質(zhì)量發(fā)展“加速度”
山東棗莊：下調(diào)住房公積金貸款首付款比例多子女家庭最高貸款60萬
盈利能力大幅提升，看網(wǎng)易云音樂(9899.HK)在中國(guó)音樂新周期下...
美團(tuán)（03690）2023年Q2財(cái)報(bào)：服務(wù)零售需求旺盛季度營(yíng)收增至680億元
耐克股價(jià)創(chuàng)1980年IPO以來最長(zhǎng)連跌紀(jì)錄
泰山農(nóng)商銀行北上高支行：開展“牽手七夕，相會(huì)農(nóng)商”活動(dòng)
日本核污染水今日下午開始排海基本情況講解
商務(wù)部回應(yīng)日本福島核污染水排海
22日至28日全省大部分景區(qū)氣象風(fēng)險(xiǎn)等級(jí)較高建議游客減少進(jìn)山游玩
4名緬甸妙瓦底電詐犯罪嫌疑人被押解回國(guó)
鄉(xiāng)村樂事
【鄉(xiāng)村振興在青?！快`芝撐開致富傘——“鄉(xiāng)村行看振興”系...
2023年主題教育專題組織生活會(huì)個(gè)人對(duì)照檢查發(fā)言材料
是否參與了汽車車內(nèi)的虛擬與現(xiàn)實(shí)、以及VR視野操作？銀寶山新...
蘋果缺鉀會(huì)有什么后果？該如何補(bǔ)充？蘋果補(bǔ)鉀的小技巧！

今日要聞

關(guān)于本站管理團(tuán)隊(duì) 版權(quán)申明網(wǎng)站地圖聯(lián)系合作招聘信息

Copyright © 2005-2023 創(chuàng)投網(wǎng) - www.mallikadua.com All rights reserved
聯(lián)系我們:39 60 29 14 2@qq.com
皖I(lǐng)CP備2022009963號(hào)-3