刷新大模型世界觀

2023-08-31 17:55:04 來(lái)源: 砍柴網(wǎng)

近日，OpenAI宣布，安卓版ChatGPT已正式上線。在連續(xù)幾個(gè)月ChatGPT的網(wǎng)站與移動(dòng)客戶端的全球流量（PV）環(huán)比持續(xù)下降的情況下，安卓版ChatGPT的推出能否讓OpenAI再度引爆市場(chǎng)？

ChatGPT只是露出海平面的冰山一角，實(shí)際上由生成式AI、大模型等激發(fā)的新一輪AI應(yīng)用熱潮一直在持續(xù)升溫，且影響極其深遠(yuǎn)。從2022年底ChatGPT的爆火開(kāi)始，人們對(duì)大模型本身的關(guān)注度不斷高漲，國(guó)內(nèi)形形色色的大模型也不斷涌現(xiàn)。如今半年多過(guò)去了，人們對(duì)于大模型已經(jīng)見(jiàn)怪不怪，反而對(duì)大模型如何與行業(yè)場(chǎng)景相結(jié)合并加速落地傾注了極大的熱情。

(資料圖片僅供參考)

中國(guó)科學(xué)技術(shù)信息研究所發(fā)布的《中國(guó)人工智能大模型地圖研究報(bào)告》顯示，截至2023年5月28日，國(guó)內(nèi)10億級(jí)參數(shù)規(guī)模以上的基礎(chǔ)大模型至少已有79個(gè)。所謂的“百模大戰(zhàn)”已經(jīng)箭在弦上。迎接數(shù)智化時(shí)代的到來(lái)，通用模型與垂類模型會(huì)相互傾軋還是各領(lǐng)風(fēng)騷？算力、數(shù)據(jù)與基礎(chǔ)軟件三大要素的同頻共振，將是決定大模型落地的關(guān)鍵？回答這些問(wèn)題，從AI企業(yè)到行業(yè)用戶，將持刷新大模型世界觀。

“壟斷派”與“擴(kuò)散派”之間的博弈

大模型真的“大”到高不可攀嗎？實(shí)際上，業(yè)界關(guān)于大模型的研究早已有之，只不過(guò)ChatGPT是最先產(chǎn)品化并實(shí)現(xiàn)商業(yè)落地的?；仡櫄v史，在擁有絕對(duì)技術(shù)代差的情況下，Google搜索引擎確實(shí)具有一枝獨(dú)秀的資本。另一個(gè)例子，曾經(jīng)名噪一時(shí)的Netscape瀏覽器，在推出后差不多一年半的時(shí)間內(nèi)幾乎壟斷了整個(gè)市場(chǎng)，但最終還是不敵IE瀏覽器，黯然退出了歷史舞臺(tái)。由此可見(jiàn)，如果在技術(shù)上沒(méi)有絕對(duì)的代差，那么由產(chǎn)品飛輪帶來(lái)的紅利能夠維持多久，需要打上一個(gè)大大的問(wèn)號(hào)。說(shuō)回到ChatGPT，OpenAI利用產(chǎn)品飛輪拉開(kāi)的差距，或許還不足以成就其市場(chǎng)壟斷地位。換句話說(shuō)，在沒(méi)有絕對(duì)技術(shù)代差的情況下，僅依靠產(chǎn)品飛輪帶來(lái)的暫時(shí)領(lǐng)先，是有其脆弱性的。國(guó)內(nèi)大模型廠商的迅速崛起與產(chǎn)品上的持續(xù)迭代也證明了這一點(diǎn)，國(guó)內(nèi)外在大模型研發(fā)上的差距正逐漸縮小。

大模型市場(chǎng)上漸漸形成了兩大陣營(yíng)——一方是以O(shè)penAI為代表的“壟斷派”，它們擁有核心技術(shù)，以自有大模型為殺手锏；另一方可以稱作“技術(shù)擴(kuò)散派”，包括芯片廠商、云算力廠商和數(shù)據(jù)基礎(chǔ)軟件廠商等，它們是AI生態(tài)中的一份子，致力于為大模型的落地、AI應(yīng)用的普及提供必要的支撐。

大模型的出現(xiàn)是AI技術(shù)上的一次突破，是眾多技術(shù)中的一個(gè)里程碑中。以此為契機(jī)，每個(gè)企業(yè)都可以擁有或建立屬于自己的大模型，從而更好地達(dá)成自己的商業(yè)目標(biāo)。九章云極DataCanvas董事長(zhǎng)方磊指出，相比曾經(jīng)的搜索引擎市場(chǎng)的博弈，大模型的壟斷派和技術(shù)擴(kuò)散派之間的博弈很可能是一個(gè)更加長(zhǎng)期、復(fù)雜、激烈的過(guò)程，在此過(guò)程中，給每個(gè)企業(yè)和組織帶來(lái)的影響也會(huì)更加深遠(yuǎn)和深刻。有足夠技術(shù)能力的企業(yè)可以開(kāi)發(fā)自己的大模型，而不具備單打獨(dú)斗能力的，則可以借助開(kāi)源社區(qū)的力量達(dá)成目標(biāo)。從長(zhǎng)遠(yuǎn)來(lái)看，大模型終究會(huì)成為業(yè)務(wù)創(chuàng)新的剛需，但是獲取的途徑可以是多樣化的，同樣用戶的選擇也是多元化的。

ChatGPT、大模型積極的意義在于，它讓我們真實(shí)感受到，原來(lái)一些不敢想、不敢做的事情，現(xiàn)在已經(jīng)有技術(shù)可以勝任。特別值得一提的是，大模型對(duì)算力、云和基礎(chǔ)軟件帶來(lái)了顛覆性的影響。在云計(jì)算的上半場(chǎng)，主力是移動(dòng)互聯(lián)網(wǎng)，支持的主要是帶寬密集型應(yīng)用，比如網(wǎng)站、APP等，其最突出的需求是彈性擴(kuò)容能力。在這個(gè)階段，公有云是重帶寬而輕算力的。但是進(jìn)入云計(jì)算的下半場(chǎng)，隨著AI浪潮的又一次興起，整個(gè)市場(chǎng)的驅(qū)動(dòng)力變成了算力，人們追求的是更高的效率和更低的成本。比如，完成一次大模型的訓(xùn)練是400萬(wàn)元還是500萬(wàn)元，這才是人們關(guān)注的焦點(diǎn)?！霸朴?jì)算邁入‘深水區(qū)’，算力和PaaS的銷售比例將越來(lái)越高?！狈嚼诒硎?，“‘算力即是國(guó)力’。在‘東數(shù)西算’剛提出來(lái)時(shí)，有人可能會(huì)質(zhì)疑，真的需要這么多的算力嗎？但是在進(jìn)入以AI為驅(qū)動(dòng)的算力密集型應(yīng)用時(shí)代，人們不禁會(huì)感慨，‘東數(shù)西算’這一釋放算力需求的舉措真的是高瞻遠(yuǎn)矚。由AI驅(qū)動(dòng)的中國(guó)算力建設(shè)會(huì)掀起一次真正的‘狂飆’。”

對(duì)于大模型的落地而言，基礎(chǔ)軟件是重要的前提。這也是為什么越來(lái)越多的軟件廠商在大數(shù)據(jù)平臺(tái)、向量數(shù)據(jù)庫(kù)、湖倉(cāng)一體等方面加大投入力度的重要原因。以前，基礎(chǔ)軟件存在較大的性能與成本上的差異化。因此，軟件、模型與硬件的統(tǒng)一優(yōu)化空間巨大?！皬?qiáng)大而靈活的基礎(chǔ)軟件、開(kāi)放彈性的白盒模型，再加上精通業(yè)務(wù)的專業(yè)人才，將加速實(shí)現(xiàn)大模型落地‘最后一公里’的跨越?！狈嚼诒硎?，“為此，我們重磅推出了AIFS（AI Foundation Software）人工智能基礎(chǔ)軟件 & DataPilot數(shù)據(jù)領(lǐng)航員產(chǎn)品體系，為AI應(yīng)用的落地夯實(shí)基礎(chǔ)設(shè)施平臺(tái)?！?/p>

通用模型、垂類模型相輔相成

2023年3月，彭博社發(fā)布了專為金融領(lǐng)域打造的大型語(yǔ)言模型（LLM）BloombergGPT。它基于彭博社的金融數(shù)據(jù)源，以開(kāi)源的GPT-3框架為基礎(chǔ)，構(gòu)建了一個(gè)3630億個(gè)標(biāo)簽的數(shù)據(jù)集，能夠更好地處理金融領(lǐng)域的數(shù)據(jù)和任務(wù)。通用大模型與面向行業(yè)和企業(yè)的垂類大模型，誰(shuí)能在商業(yè)市場(chǎng)上最先叫響？

“有券商曾經(jīng)向我們咨詢，能否一起開(kāi)發(fā)一個(gè)類似BloombergGPT的證券行業(yè)大模型？”有一段時(shí)間，方磊一直被客戶類似的詢問(wèn)所包圍。從需求方來(lái)看，確實(shí)有一些大型央企以及金融行業(yè)頭部企業(yè)對(duì)大模型非常感興趣。一方面，出于業(yè)務(wù)創(chuàng)新的考慮；另一方面，也是因?yàn)椤皵?shù)據(jù)邊界”問(wèn)題，由于與業(yè)務(wù)密切相關(guān)的私域數(shù)據(jù)不能“走出”公司，因而無(wú)法直接采用通用大模型，所以希望構(gòu)建屬于自己的垂類大模型。

從供給方來(lái)看，比如云算力廠商，就非常希望與九章云極DataCanvas這樣的基礎(chǔ)軟件廠商合作，推出打包的整體解決方案，讓大模型的訓(xùn)練更具效率且成本更優(yōu)。而這也正好契合了九章云極DataCanvas自身的定位，即“云中云”，為云算力廠商帶來(lái)基礎(chǔ)軟件方面的增值，便于行業(yè)用戶訓(xùn)練自己的垂類模型。

Databricks于2023年4月12日發(fā)布了Dolly 2.0。據(jù)稱這是業(yè)內(nèi)第一個(gè)開(kāi)源的、遵循指令的LLM，用戶可在透明且免費(fèi)提供的數(shù)據(jù)集上進(jìn)行微調(diào)，從而構(gòu)建自己的商業(yè)應(yīng)用程序。這也給了同類AI基礎(chǔ)軟件廠商很大的啟示和信心，通過(guò)構(gòu)建和優(yōu)化AI基礎(chǔ)設(shè)施、數(shù)據(jù)平臺(tái)和提供參考大模型，就能讓行業(yè)客戶更簡(jiǎn)單、快捷地打造屬于自己的垂類大模型。

在大模型狂飆了半年多以后，人們對(duì)于通用大模型與垂類大模型的構(gòu)建、部署和應(yīng)用有了更深刻的認(rèn)知，慢慢形成了一種共識(shí)：通用大模型會(huì)漸漸收斂，就像公有云那樣大浪淘沙，最終市場(chǎng)上只剩下最強(qiáng)的幾個(gè)；而市場(chǎng)上更多的則是面向行業(yè)和企業(yè)的垂類大模型。從未來(lái)發(fā)展趨勢(shì)看，在開(kāi)源的以及通用可參考的大模型之上，融入更多行業(yè)知識(shí)和企業(yè)經(jīng)驗(yàn)的垂類大模型將層出不窮。行業(yè)龍頭企業(yè)研發(fā)大模型，而中小企業(yè)在其上直接開(kāi)發(fā)應(yīng)用，或許將成為一種定式。

一種更切合實(shí)際的作法是像九章云極DataCanvas那樣，“大小均涉及”。作為一款行業(yè)領(lǐng)先的人工智能應(yīng)用構(gòu)建基礎(chǔ)設(shè)施平臺(tái)， AIFS覆蓋了大模型的訓(xùn)練、精調(diào)、壓縮、部署、推理和監(jiān)控，以及小模型的全生命周期過(guò)程，為數(shù)據(jù)科學(xué)家、應(yīng)用程序開(kāi)發(fā)人員和業(yè)務(wù)專家提供了一套工具，使不同角色的人員能夠相互協(xié)作，輕松處理數(shù)據(jù)并使用這些數(shù)據(jù)來(lái)開(kāi)發(fā)、訓(xùn)練和部署任何規(guī)模的模型。一句話， AIFS旨在為用戶自主構(gòu)建全生命周期的“大+小”模型提供一站式支持。方磊表示：“我們致力于打造人工智能基礎(chǔ)設(shè)施，既要為企業(yè)構(gòu)建個(gè)性化、自主的大模型賦能，又可以將大模型與以往積淀的小模型相融合，應(yīng)用于業(yè)務(wù)。”

大模型確實(shí)威力巨大，但它是否可以放之四海皆準(zhǔn)，解決一切問(wèn)題呢？從目前來(lái)看，一些巨大的場(chǎng)景、尖端的應(yīng)用，還是要采用專用系統(tǒng)，而碎片化的場(chǎng)景或者解決一些長(zhǎng)尾的to C方面的問(wèn)題，則更適合采用通用大模型。說(shuō)到底，專與精是兩類不同的需求。一些行業(yè)的細(xì)分需求，寄希望于通過(guò)對(duì)通用大模型進(jìn)行微調(diào)就能解決問(wèn)題，實(shí)際上并不可行。一方面，通用大模型并一定具備特定行業(yè)所需的能力；另一方面，即使你想對(duì)大模型進(jìn)行微調(diào)，可能也會(huì)因?yàn)榇竽Ｐ捅旧磉^(guò)于‘沉重’，而力不從心。從這個(gè)角度說(shuō)，垂類大模型是有其存在和發(fā)展的必要性。

AI普惠化任重道遠(yuǎn)

眾所周知，微軟已經(jīng)在Azure、Microsoft 365以及多款開(kāi)發(fā)者工具中融入了人工智能功能。近日，微軟首席財(cái)務(wù)官Amy Hood在一次分析師電話會(huì)議上表示，公司未來(lái)還將進(jìn)一步增加數(shù)據(jù)中心建設(shè)成本，以便更好地支撐人工智能服務(wù)。不僅是微軟，也不僅僅是美國(guó)華爾街，而是全世界都在熱切期待，生成式AI能夠?yàn)槠髽I(yè)帶來(lái)真正的收益和增值。

今天，越來(lái)越多類ChatGPT的大模型正在不斷推出或在孕育之中，展現(xiàn)出巨大的技術(shù)和商業(yè)潛力，但欠缺的是足夠豐富的應(yīng)用場(chǎng)景，以及開(kāi)放的、安全可靠、高效的人工智能基礎(chǔ)設(shè)施?！艾F(xiàn)階段，大模型的應(yīng)用還是由創(chuàng)新驅(qū)動(dòng)的，并非完全由業(yè)務(wù)驅(qū)動(dòng)。”方磊表示，“大模型的普惠化是當(dāng)務(wù)之急?！?/p>

國(guó)內(nèi)外主流的云廠商不僅推出了自有的大模型，更為大模型的落地提供了完善的支撐，既有產(chǎn)品和服務(wù)層面的，也有生態(tài)、渠道方面的。比如，亞馬遜云科技在近日舉行的紐約峰會(huì)上宣布，推出7項(xiàng)生成式AI創(chuàng)新，包括Amazon Bedrock新增基礎(chǔ)模型供應(yīng)商Cohere和全新基礎(chǔ)模型，Amazon EC2 P5實(shí)例正式可用，Amazon OpenSearch Serverless支持全新向量引擎，編程助手Amazon CodeWhisperer與Amazon Glue實(shí)現(xiàn)集成等。

IDC發(fā)布的《IDC中國(guó)AI公有云服務(wù)市場(chǎng)份額，2022》報(bào)告顯示：2022年中國(guó)AI公有云服務(wù)市場(chǎng)呈現(xiàn)出80.6%的正增長(zhǎng)，整體市場(chǎng)規(guī)模達(dá)79.7億元。生成式AI、大模型等新的能力在公有云上將實(shí)現(xiàn)更快的更新迭代。

“大模型時(shí)代需要完整基礎(chǔ)設(shè)施升級(jí)，而不是依靠單個(gè)大模型解決所有問(wèn)題；大模型的落地將解決更困難的問(wèn)題，引起更深遠(yuǎn)的影響，而它并不比小模型更容易?！狈嚼谌缡钦f(shuō)。

大模型帶來(lái)的顛覆性并不只體現(xiàn)在大模型本身，而是將引發(fā)算力、數(shù)據(jù)、基礎(chǔ)軟件的一次最深刻的變革。未來(lái)，不管大模型如何演進(jìn)迭代，高性能的基礎(chǔ)軟件與數(shù)據(jù)架構(gòu)都是不可或缺的“底座”，在AI惠普化的進(jìn)程中發(fā)揮基礎(chǔ)與核心的作用。包括九章云極DataCanvas在內(nèi)的眾多致力于AI普惠化的廠商，將軟件工具和解決方案作為賦能廣大行業(yè)用戶的抓手，持續(xù)融入前沿AI創(chuàng)新技術(shù)，助力其在大模型時(shí)代加速實(shí)現(xiàn)自主的數(shù)智化升級(jí)和AI規(guī)?；瘧?yīng)用。

毋庸置疑，大模型應(yīng)用終將走向普惠化。但在獲得技術(shù)紅利的過(guò)程中，人們也不得不在安全、監(jiān)管、合規(guī)等方面投入更多精力。負(fù)責(zé)任地使用AI，將規(guī)范、引導(dǎo)大模型又快又好地落地。

關(guān)鍵詞：

刷新大模型世界觀

您可能也感興趣:

今日熱點(diǎn)

江化微8月31日快速反彈

諸城探索實(shí)施公積金“邀約服務(wù)”！

115人遇難　夏威夷野火失蹤人數(shù)仍難確定

更多

更多

排行

最近更新

今日要聞

刷新大模型世界觀

您可能也感興趣:

今日熱點(diǎn)

江化微8月31日快速反彈

諸城探索實(shí)施公積金“邀約服務(wù)”！

115人遇難 夏威夷野火失蹤人數(shù)仍難確定

為您推薦

北京天氣逐漸轉(zhuǎn)晴午后山區(qū)有雷陣雨 后天還將有雷雨天氣

小摩：收購(gòu)捷普工廠后 比亞迪電子(00285)進(jìn)一步深入“果鏈”

共話中國(guó)經(jīng)濟(jì)新機(jī)遇丨專訪：中國(guó)可持續(xù)城市發(fā)展值得外資企業(yè)長(zhǎng)期投入——訪瑞典恩華特集團(tuán)首席執(zhí)行官兼總裁卡爾松

國(guó)內(nèi)首款商用可重構(gòu)5G射頻收發(fā)芯片研制成功

更多

更多

排行

最近更新

今日要聞

諸城探索實(shí)施公積金“邀約服務(wù)”！

115人遇難　夏威夷野火失蹤人數(shù)仍難確定

北京天氣逐漸轉(zhuǎn)晴午后山區(qū)有雷陣雨后天還將有雷雨天氣

小摩：收購(gòu)捷普工廠后比亞迪電子(00285)進(jìn)一步深入“果鏈”