GPT-5要來(lái)了？驚現(xiàn)兩大變化參數(shù)或達(dá)10萬(wàn)億級(jí)別！

2023-08-16 21:34:10 來(lái)源: 每日經(jīng)濟(jì)新聞

近日，歐愛(ài)運(yùn)營(yíng)有限責(zé)任公司（OPENAI OPCO，LLC）在中國(guó)申請(qǐng)注冊(cè)2枚“GPT-5”商標(biāo)，引發(fā)廣泛關(guān)注。

在GPT-4爆火后，GPT-5成為了萬(wàn)眾期待的下一個(gè)版本。

當(dāng)?shù)貢r(shí)間8月8日，OpenAI在官網(wǎng)介紹了新產(chǎn)品GPTBot，這是一種網(wǎng)絡(luò)爬蟲(chóng)，可大規(guī)模爬取網(wǎng)絡(luò)數(shù)據(jù)用于訓(xùn)練AI模型，據(jù)稱可以用來(lái)改進(jìn)未來(lái)的聊天機(jī)器人大模型。

(資料圖)

OpenAI在其官網(wǎng)發(fā)布的一篇博客文章中表示：“使用GPTBot用戶代理抓取的網(wǎng)頁(yè)可能會(huì)被用來(lái)改進(jìn)未來(lái)的模型?！惫具€補(bǔ)充稱，GPTBot可以提高內(nèi)容準(zhǔn)確性，擴(kuò)展未來(lái)迭代的能力。此外，由于OpenAI近期剛向美國(guó)專利商標(biāo)局申請(qǐng)了GPT-5商標(biāo)，國(guó)外不少科技媒體認(rèn)為，OpenAI所指的這個(gè)“未來(lái)迭代”就是GPT-5。

據(jù)悉，它將具備眾多GPT-4所沒(méi)有的能力，而且?guī)缀趺恳豁?xiàng)都劍指通用人工智能。

另外，值得注意的是，截至上周五美股收盤(pán)，英偉達(dá)一周累跌8.56%，接近失守1萬(wàn)億美元市值關(guān)口。華爾街警告：AI概念股泡沫正在接近頂峰。

OpenAI提交GPT-5商標(biāo)申請(qǐng)

網(wǎng)絡(luò)爬蟲(chóng)是一種主要通過(guò)瀏覽網(wǎng)絡(luò)抓取數(shù)據(jù)的工具，方式包括數(shù)據(jù)挖掘，網(wǎng)頁(yè)數(shù)據(jù)復(fù)制/拍照、網(wǎng)站鏡像等方式。網(wǎng)絡(luò)爬蟲(chóng)是互聯(lián)網(wǎng)和大數(shù)據(jù)時(shí)代最重要工具之一，被譽(yù)為“黃金礦工”，應(yīng)用場(chǎng)景非常廣泛。例如，谷歌、必應(yīng)等搜索引擎通過(guò)網(wǎng)絡(luò)爬蟲(chóng)來(lái)收集和建立網(wǎng)頁(yè)索引，方便用戶通過(guò)關(guān)鍵字快速找到相關(guān)的網(wǎng)頁(yè)。

OpenAI表示，網(wǎng)絡(luò)爬蟲(chóng)將從互聯(lián)網(wǎng)上收集公開(kāi)可用的數(shù)據(jù)，但會(huì)過(guò)濾掉需要付費(fèi)的內(nèi)容來(lái)源或個(gè)人身份信息的消息來(lái)源，以及有違反其規(guī)定的文本來(lái)源。需要指出的是，網(wǎng)站的所有者可以通過(guò)在服務(wù)器上的標(biāo)準(zhǔn)文件中添加“disallow（禁止）”指令來(lái)拒絕網(wǎng)絡(luò)爬蟲(chóng)。

《每日經(jīng)濟(jì)新聞》記者注意到，在發(fā)布GPTBot前，OpenAI還在美國(guó)申請(qǐng)了GPT-5的商標(biāo)，這被認(rèn)為是當(dāng)前被廣泛使用的GPT-4的升級(jí)迭代版本。

該申請(qǐng)被OpenAI于當(dāng)?shù)貢r(shí)間7月18日提交給美國(guó)專利商標(biāo)局，涵蓋了“GPT-5”在基于人工智能的人類(lèi)語(yǔ)音和文本、音頻到文本轉(zhuǎn)換、語(yǔ)音識(shí)別和語(yǔ)音合成中的使用。在這份新商標(biāo)申請(qǐng)中，OpenAI 將“GPT-5”描述為一種“用于使用語(yǔ)言模型的可下載計(jì)算機(jī)軟件”。

在這次披露的申請(qǐng)書(shū)中，OpenAI提到，尚未發(fā)布的GPT-5將具備眾多GPT-4所沒(méi)有的能力，而且?guī)缀趺恳豁?xiàng)都劍指通用人工智能（AGI）。

OpenAI最先提到的一個(gè)變化，就是多模態(tài)功能的加強(qiáng)。具體來(lái)說(shuō)，GPT-5的功能包括把文本或語(yǔ)音從一種語(yǔ)言翻譯成另一種語(yǔ)言、語(yǔ)音識(shí)別、生成文本和語(yǔ)音等。有觀點(diǎn)認(rèn)為，文件中突出的語(yǔ)音識(shí)別功能，看似只是一個(gè)不起眼的改動(dòng)，但從某種程度上說(shuō)，這也是OpenAI對(duì)GPT-5在通往AGI的道路上鋪下的又一塊路磚。

除了上述特點(diǎn)外，OpenAI提交的文件中還提到：“GPT-5可能還具備學(xué)習(xí)、分析、分類(lèi)和回應(yīng)數(shù)據(jù)的能力”。從目前人工智能的發(fā)展趨勢(shì)來(lái)看，這很可能是指GPT-5具備了類(lèi)似智能體的主動(dòng)學(xué)習(xí)能力。而這樣的能力，將會(huì)使GPT-5與以往只能被動(dòng)地通過(guò)人類(lèi)投喂數(shù)據(jù)來(lái)學(xué)習(xí)新知識(shí)的模型相比，產(chǎn)生本質(zhì)的區(qū)別。

具體來(lái)說(shuō)，主動(dòng)學(xué)習(xí)的能力，是指模型可以根據(jù)自身的目標(biāo)和需求，自主地選擇、獲取和處理數(shù)據(jù)，而不是僅僅依賴于人類(lèi)提供的數(shù)據(jù)。

這樣可以讓模型更有效地利用數(shù)據(jù)中的信息和知識(shí)，更靈活地適應(yīng)不同的數(shù)據(jù)環(huán)境和任務(wù)場(chǎng)景，而不只是被動(dòng)地接收和輸出數(shù)據(jù)。而這樣的能力，在GPT-5面臨一些比較陌生、垂直的領(lǐng)域時(shí)，就顯得尤為重要。

如果GPT-5具備了主動(dòng)學(xué)習(xí)的能力，它可以自動(dòng)地從網(wǎng)絡(luò)上搜集和更新這些領(lǐng)域的相關(guān)數(shù)據(jù)，分析和分類(lèi)這些領(lǐng)域的基本概念、重要原理和最新動(dòng)態(tài)，以及回應(yīng)這些領(lǐng)域的常見(jiàn)問(wèn)題、典型案例和實(shí)際應(yīng)用。

《每日經(jīng)濟(jì)新聞》記者還注意到，GPT-3.5有1750億參數(shù)規(guī)模，OpenAI沒(méi)有公布過(guò)GPT-4的具體規(guī)格，但之后的分析認(rèn)為其擁有16個(gè)專家模型，每個(gè)NLP（Natural language processing，自然語(yǔ)言處理）專家大約有1110億個(gè)參數(shù)，總計(jì)1.8萬(wàn)億參數(shù)，是GPT-4的10倍。如果按照這個(gè)比例來(lái)提升，GPT-5將突破10萬(wàn)億參數(shù)，有望成為最大規(guī)模的大語(yǔ)言模型。

GPT-5仍可能在未來(lái)重新定義AI

雖然目前GPT-5仍然處于理論概念的階段，但它仍可能會(huì)在未來(lái)重新定義人工智能，并有可能達(dá)到通用人工智能的高度。

GPT是一種大型語(yǔ)言模型神經(jīng)網(wǎng)絡(luò)，可以執(zhí)行并回答問(wèn)題、生成代碼和總結(jié)文本等任務(wù)。通過(guò)掃描數(shù)以百萬(wàn)計(jì)的網(wǎng)絡(luò)文章和數(shù)據(jù)，GPT模型可以生成真實(shí)和非剽竊的內(nèi)容。目前，GPT-5已經(jīng)成為全球科技界廣泛期待和猜測(cè)的話題。盡管OpenAI沒(méi)有給出官方的GPT-5上線日期，但各路專家早已在各大論壇上分享見(jiàn)解。

據(jù)外媒報(bào)道，GPT-5有望顯著減少回答所包含的錯(cuò)誤內(nèi)容，OpenAI可能會(huì)通過(guò)先進(jìn)的訓(xùn)練方法來(lái)解決這個(gè)問(wèn)題。此外，GPT-5或?qū)⒕哂懈叩挠?jì)算效率，從而擁有更快的響應(yīng)時(shí)間。雖然具體的細(xì)節(jié)尚未透露，但人們相信GPT-5可能會(huì)通過(guò)突破自然語(yǔ)言理解、上下文推理和整體語(yǔ)言流暢性等領(lǐng)域的界限，為AGI做出貢獻(xiàn)。

一位名為 Siqi Chen 的開(kāi)發(fā)者在Twitter 上發(fā)文稱，GPT-5 預(yù)計(jì)將在今年年底完成訓(xùn)練，并有可能實(shí)現(xiàn)通用人工智能（AGI）。AGI旨在創(chuàng)建無(wú)需顯式編程即可執(zhí)行任何智力任務(wù)的智能系統(tǒng)。如果 GPT-5 實(shí)現(xiàn) AGI，它可以顯著提高生產(chǎn)力并自動(dòng)執(zhí)行復(fù)雜的認(rèn)知任務(wù)。

不幸的是，外界目前只能從OpenAI申請(qǐng)商標(biāo)的動(dòng)作來(lái)對(duì)其計(jì)劃進(jìn)行推測(cè)，這也并不一定表明OpenAI何時(shí)或是否計(jì)劃推出GPT-5。就在今年6月份，OpenAI創(chuàng)始人兼CEO山姆·阿特曼表示，公司距離開(kāi)始培訓(xùn)GPT-5“還差的很遠(yuǎn)”，他解釋稱，在開(kāi)始（訓(xùn)練GPT-5）之前還需要進(jìn)行廣泛的安全審核?！霸趩?dòng)GPT-5之前，我們還有很多工作要做。”阿特曼6月份在一次會(huì)議上說(shuō)道。

還有外媒分析認(rèn)為，更有可能的結(jié)果是，OpenAI將把精力集中在改進(jìn)GPT-4模型上，而不是把所有的資源都投入到下一個(gè)大語(yǔ)言模型的迭代中。

與此同時(shí)，OpenAI最近的數(shù)據(jù)收集策略還引起了外界的關(guān)注，尤其是圍繞版權(quán)和用于許可的問(wèn)題。例如，今年4月，意大利監(jiān)管機(jī)構(gòu)還指控ChatGPT違反了多項(xiàng)歐盟隱私法律，隨后將ChatGPT進(jìn)行了“封殺”；今年6月，日本隱私監(jiān)管機(jī)構(gòu)就未經(jīng)許可收集敏感數(shù)據(jù)向OpenAI發(fā)出了警告。6月下旬，16名原告對(duì)OpenAI提起集體訴訟，指控其從ChatGPT用戶交互中獲取私人信息。

此外，OpenAI還收到了GitHub Copilot的訴訟，原告稱代碼生成工具侵犯了開(kāi)發(fā)者的權(quán)利，因?yàn)樗跊](méi)有提供適當(dāng)歸屬的情況下抓取了他們的代碼。如果這些指控屬實(shí)，OpenAI以及同樣被列為被告的微軟，將違反《計(jì)算機(jī)欺詐和濫用法案》（Computer Fraud and Abuse Act），這部法律的應(yīng)用在網(wǎng)絡(luò)抓取案件方面有先例。

（文章來(lái)源：每日經(jīng)濟(jì)新聞）

關(guān)鍵詞：

GPT-5要來(lái)了？驚現(xiàn)兩大變化參數(shù)或達(dá)10萬(wàn)億級(jí)別！

您可能也感興趣:

今日熱點(diǎn)

我國(guó)首份生成式人工智能監(jiān)管性文件正式實(shí)施

石頭餅是哪里的特產(chǎn) 石頭餅

生態(tài)省如何推動(dòng)綠色經(jīng)濟(jì)發(fā)展？福建這些實(shí)踐創(chuàng)新成果復(fù)制推廣

更多

更多

排行

最近更新

今日要聞

GPT-5要來(lái)了？驚現(xiàn)兩大變化 參數(shù)或達(dá)10萬(wàn)億級(jí)別！

您可能也感興趣:

今日熱點(diǎn)

我國(guó)首份生成式人工智能監(jiān)管性文件正式實(shí)施

石頭餅是哪里的特產(chǎn) 石頭餅

生態(tài)省如何推動(dòng)綠色經(jīng)濟(jì)發(fā)展？福建這些實(shí)踐創(chuàng)新成果復(fù)制推廣

為您推薦

爾康制藥：公司正在核實(shí)相關(guān)情況。公司將按信息披露的相關(guān)規(guī)定及時(shí)履行披露義務(wù)

北京上線首個(gè)城市定制型家財(cái)險(xiǎn) 普惠型家財(cái)險(xiǎn)已在多地“安家”

昔日排巖場(chǎng) 今朝生態(tài)園

8月15日倫敦LME鋅錠庫(kù)存行情

更多

更多

排行

最近更新

今日要聞

GPT-5要來(lái)了？驚現(xiàn)兩大變化參數(shù)或達(dá)10萬(wàn)億級(jí)別！

爾康制藥：公司正在核實(shí)相關(guān)情況。公司將按信息披露的相關(guān)規(guī)定及時(shí)履行披露義務(wù)