GPT-4 由 8 個(gè) MoE 模型組成，真的嗎？|環(huán)球快看點(diǎn)

2023-06-26 15:32:46 來(lái)源: 商業(yè)新知網(wǎng)

(相關(guān)資料圖)

讓大家沒想到的是，被傳的神乎其神的GPT-4依舊是大力出奇跡的產(chǎn)物?；氐絜nsemble的老路上去了，OpenAI一直在畫的AGI的大餅感覺又離我們遠(yuǎn)了。

黑客 George Hotz 在一個(gè)播客中透露，GPT-4 是由 8 個(gè) 2200 億參數(shù)的 MoE 模型組成的，每個(gè)模型都針對(duì)不同的數(shù)據(jù)和任務(wù)分布進(jìn)行了訓(xùn)練，然后通過(guò)一些小技巧將它們混合起來(lái)。他還說(shuō)，這樣做是因?yàn)閱蝹€(gè)模型的參數(shù)規(guī)模已經(jīng)達(dá)到了極限，而且訓(xùn)練時(shí)間越長(zhǎng)效果越差，所以他們采用了多模型集成的方法來(lái)提高性能。他認(rèn)為，OpenAI 對(duì)此保密的原因是不想讓別人知道他們的模型并不是那么先進(jìn)，只要花更多的錢就能復(fù)制。

這個(gè)說(shuō)法得到了 PyTorch 創(chuàng)始人 Soumith Chintala 的認(rèn)可2，他表示自己也聽過(guò)類似的傳聞，但只有 George Hotz 在公開場(chǎng)合說(shuō)出來(lái)了。不過(guò)，也有人對(duì)這個(gè)說(shuō)法表示懷疑或質(zhì)疑134，認(rèn)為這樣的模型推理成本太高，而且沒有充分利用 GPT-4 的潛力。目前，OpenAI 還沒有對(duì)這個(gè)爆料做出任何回應(yīng)或證實(shí)。

這件事情很可能是真的，理由如下：

已知的Prior：

1.多個(gè)信源認(rèn)為GPT4比GPT3.5參數(shù)量大至少一個(gè)數(shù)量級(jí)，也就是1.7萬(wàn)億以上。

2. OpenAI去年六月發(fā)表過(guò)技術(shù)報(bào)告說(shuō)他們訓(xùn)練LLM用了MoE.

現(xiàn)在的觀測(cè)：

有人說(shuō)GPT4是一個(gè)1.76萬(wàn)億參數(shù)的MoE

網(wǎng)友得知秘訣后，打算自己也要訓(xùn)練一個(gè)LLaMA集合體與GPT-4競(jìng)爭(zhēng)。

關(guān)鍵詞：

今日熱點(diǎn)

排行

最近更新

GPT-4 由 8 個(gè) MoE 模型組成，真的嗎？|環(huán)球快看點(diǎn)
異動(dòng)快報(bào)：ST通脈（603559）6月26日13點(diǎn)2分觸及漲停板
廈門：461個(gè)省市重點(diǎn)項(xiàng)目建設(shè)提速世界速遞
今日聚焦!公安部：快偵快破打架斗毆、尋釁滋事等夏季多發(fā)案件
中國(guó)今年做到的，“超過(guò)美國(guó)過(guò)去50年的總和”
世界看熱訊：中央氣象臺(tái)：我國(guó)近海海域?qū)⒂?-7級(jí)風(fēng)
蛋仔派對(duì)熊貓保育員皮膚怎么獲得熊貓保育員皮膚獲取方法[多圖]
持續(xù)做強(qiáng)養(yǎng)老“第三支柱”（財(cái)經(jīng)眼·創(chuàng)新金融服務(wù) 助力“...
看點(diǎn)：年輕人為養(yǎng)老行業(yè)帶來(lái)“新機(jī)” 托舉起更美的夕陽(yáng)紅
“上汽紅巖杯”第四屆上海市集裝箱運(yùn)輸行業(yè)駕駛員（新能源車...
環(huán)球熱資訊！什么牌子的化妝品好(女士化妝護(hù)膚品哪個(gè)牌子好?)
環(huán)球滾動(dòng):【受權(quán)發(fā)布】北京26日發(fā)布雷電黃色預(yù)警
東離劍游紀(jì)官網(wǎng)在哪下載最新官方下載安裝地址_環(huán)球短訊
轉(zhuǎn)發(fā)學(xué)習(xí)精密減速器人形機(jī)器人關(guān)鍵零部件，產(chǎn)業(yè)格局解析每...
每日播報(bào)!社企聯(lián)盟聚力共創(chuàng)幸福鄰里 ——浦發(fā)銀行福州路支...
世界微動(dòng)態(tài)丨讓幼兒成長(zhǎng)環(huán)境更安全，他們走進(jìn)幼兒園
均價(jià)沒漲距離7號(hào)線僅500米！寶山大華“親兒子”又來(lái)了
prada全球代言人有哪些？十大高奢品牌一覽表
焦點(diǎn)消息！即將召開的全國(guó)人大常委會(huì)會(huì)議看點(diǎn)前瞻
快訊：志愿填報(bào)系統(tǒng)、志愿填報(bào)輔助系統(tǒng)和志愿填報(bào)智能參考系...
SHEIN推出“希有引力”百萬(wàn)賣家計(jì)劃今日精選
武漢集中供地第二日：聯(lián)發(fā)、中鐵、德信東西湖區(qū)各得一宗
天天速讀：無(wú)處方販賣管制精神藥品診所經(jīng)營(yíng)者被判有期徒刑八年
天天新消息丨未來(lái)兩天將有對(duì)流性降水，大部地區(qū)伴有雷暴、短...
【全球熱聞】楊浦區(qū)軍工路快速路高架橋梁主體結(jié)構(gòu)成型
海南碧城黎客國(guó)際酒店二手房子怎么樣？三亞二手房的利弊~|天...
世界快播：基金業(yè)績(jī)“中考”臨近 “含AI量”成決勝關(guān)鍵...
天天微速訊：2021奇妙陪伴季開啟萬(wàn)科上海區(qū)域60多萬(wàn)戶家庭...
2023對(duì)講機(jī)發(fā)展需求與未來(lái)行業(yè)趨向預(yù)測(cè)|世界速遞
太陽(yáng)兜售艾頓卻無(wú)人問津沃格爾能將他調(diào)教為新版希伯特嗎？

GPT-4 由 8 個(gè) MoE 模型組成，真的嗎？|環(huán)球快看點(diǎn)

您可能也感興趣:

今日熱點(diǎn)

今熱點(diǎn)：如何使用藍(lán)牙耳機(jī) 無(wú)線藍(lán)牙耳機(jī)用法詳解藍(lán)牙無(wú)線耳機(jī)如何使用?

環(huán)球熱點(diǎn)評(píng)！7月1日，北京市中關(guān)村外國(guó)語(yǔ)學(xué)校國(guó)際高中開放日預(yù)約中

全球快報(bào):圍觀廣美畢業(yè)展②｜直面時(shí)代，立足根本，展現(xiàn)自我

更多

更多

排行

最近更新

今日要聞

GPT-4 由 8 個(gè) MoE 模型組成，真的嗎？|環(huán)球快看點(diǎn)

您可能也感興趣:

今日熱點(diǎn)

今熱點(diǎn)：如何使用藍(lán)牙耳機(jī) 無(wú)線藍(lán)牙耳機(jī)用法詳解 藍(lán)牙無(wú)線耳機(jī)如何使用?

環(huán)球熱點(diǎn)評(píng)！7月1日，北京市中關(guān)村外國(guó)語(yǔ)學(xué)校國(guó)際高中開放日預(yù)約中

全球快報(bào):圍觀廣美畢業(yè)展②｜直面時(shí)代，立足根本，展現(xiàn)自我

為您推薦

“新三樣”乘風(fēng)破浪領(lǐng)跑出口

大量《王者榮耀》主播參與盲盒宣傳：現(xiàn)已道歉退款！_每日關(guān)注

街拍禁止，三里屯太古里潮牌變遷史

天天快消息！緋色是什么顏色 玄色（緋色是什么顏色）

更多

更多

排行

最近更新

今日要聞

GPT-4 由 8 個(gè) MoE 模型組成，真的嗎？|環(huán)球快看點(diǎn)

今熱點(diǎn)：如何使用藍(lán)牙耳機(jī) 無(wú)線藍(lán)牙耳機(jī)用法詳解藍(lán)牙無(wú)線耳機(jī)如何使用?

環(huán)球熱點(diǎn)評(píng)！7月1日，北京市中關(guān)村外國(guó)語(yǔ)學(xué)校國(guó)際高中開放日預(yù)約中

全球快報(bào):圍觀廣美畢業(yè)展②｜直面時(shí)代，立足根本，展現(xiàn)自我

街拍禁止，三里屯太古里潮牌變遷史

天天快消息！緋色是什么顏色玄色（緋色是什么顏色）