首頁(yè) 智能 > 正文

刷新大模型世界觀

近日,OpenAI宣布,安卓版ChatGPT已正式上線。在連續(xù)幾個(gè)月ChatGPT的網(wǎng)站與移動(dòng)客戶端的全球流量(PV)環(huán)比持續(xù)下降的情況下,安卓版ChatGPT的推出能否讓OpenAI再度引爆市場(chǎng)?

ChatGPT只是露出海平面的冰山一角,實(shí)際上由生成式AI、大模型等激發(fā)的新一輪AI應(yīng)用熱潮一直在持續(xù)升溫,且影響極其深遠(yuǎn)。從2022年底ChatGPT的爆火開(kāi)始,人們對(duì)大模型本身的關(guān)注度不斷高漲,國(guó)內(nèi)形形色色的大模型也不斷涌現(xiàn)。如今半年多過(guò)去了,人們對(duì)于大模型已經(jīng)見(jiàn)怪不怪,反而對(duì)大模型如何與行業(yè)場(chǎng)景相結(jié)合并加速落地傾注了極大的熱情。


(資料圖片僅供參考)

中國(guó)科學(xué)技術(shù)信息研究所發(fā)布的《中國(guó)人工智能大模型地圖研究報(bào)告》顯示,截至2023年5月28日,國(guó)內(nèi)10億級(jí)參數(shù)規(guī)模以上的基礎(chǔ)大模型至少已有79個(gè)。所謂的“百模大戰(zhàn)”已經(jīng)箭在弦上。迎接數(shù)智化時(shí)代的到來(lái),通用模型與垂類模型會(huì)相互傾軋還是各領(lǐng)風(fēng)騷?算力、數(shù)據(jù)與基礎(chǔ)軟件三大要素的同頻共振,將是決定大模型落地的關(guān)鍵?回答這些問(wèn)題,從AI企業(yè)到行業(yè)用戶,將持刷新大模型世界觀。

“壟斷派”與“擴(kuò)散派”之間的博弈

大模型真的“大”到高不可攀嗎?實(shí)際上,業(yè)界關(guān)于大模型的研究早已有之,只不過(guò)ChatGPT是最先產(chǎn)品化并實(shí)現(xiàn)商業(yè)落地的?;仡櫄v史,在擁有絕對(duì)技術(shù)代差的情況下,Google搜索引擎確實(shí)具有一枝獨(dú)秀的資本。另一個(gè)例子,曾經(jīng)名噪一時(shí)的Netscape瀏覽器,在推出后差不多一年半的時(shí)間內(nèi)幾乎壟斷了整個(gè)市場(chǎng),但最終還是不敵IE瀏覽器,黯然退出了歷史舞臺(tái)。由此可見(jiàn),如果在技術(shù)上沒(méi)有絕對(duì)的代差,那么由產(chǎn)品飛輪帶來(lái)的紅利能夠維持多久,需要打上一個(gè)大大的問(wèn)號(hào)。說(shuō)回到ChatGPT,OpenAI利用產(chǎn)品飛輪拉開(kāi)的差距,或許還不足以成就其市場(chǎng)壟斷地位。換句話說(shuō),在沒(méi)有絕對(duì)技術(shù)代差的情況下,僅依靠產(chǎn)品飛輪帶來(lái)的暫時(shí)領(lǐng)先,是有其脆弱性的。國(guó)內(nèi)大模型廠商的迅速崛起與產(chǎn)品上的持續(xù)迭代也證明了這一點(diǎn),國(guó)內(nèi)外在大模型研發(fā)上的差距正逐漸縮小。

大模型市場(chǎng)上漸漸形成了兩大陣營(yíng)——一方是以O(shè)penAI為代表的“壟斷派”,它們擁有核心技術(shù),以自有大模型為殺手锏;另一方可以稱作“技術(shù)擴(kuò)散派”,包括芯片廠商、云算力廠商和數(shù)據(jù)基礎(chǔ)軟件廠商等,它們是AI生態(tài)中的一份子,致力于為大模型的落地、AI應(yīng)用的普及提供必要的支撐。

大模型的出現(xiàn)是AI技術(shù)上的一次突破,是眾多技術(shù)中的一個(gè)里程碑中。以此為契機(jī),每個(gè)企業(yè)都可以擁有或建立屬于自己的大模型,從而更好地達(dá)成自己的商業(yè)目標(biāo)。九章云極DataCanvas董事長(zhǎng)方磊指出,相比曾經(jīng)的搜索引擎市場(chǎng)的博弈,大模型的壟斷派和技術(shù)擴(kuò)散派之間的博弈很可能是一個(gè)更加長(zhǎng)期、復(fù)雜、激烈的過(guò)程,在此過(guò)程中,給每個(gè)企業(yè)和組織帶來(lái)的影響也會(huì)更加深遠(yuǎn)和深刻。有足夠技術(shù)能力的企業(yè)可以開(kāi)發(fā)自己的大模型,而不具備單打獨(dú)斗能力的,則可以借助開(kāi)源社區(qū)的力量達(dá)成目標(biāo)。從長(zhǎng)遠(yuǎn)來(lái)看,大模型終究會(huì)成為業(yè)務(wù)創(chuàng)新的剛需,但是獲取的途徑可以是多樣化的,同樣用戶的選擇也是多元化的。

ChatGPT、大模型積極的意義在于,它讓我們真實(shí)感受到,原來(lái)一些不敢想、不敢做的事情,現(xiàn)在已經(jīng)有技術(shù)可以勝任。特別值得一提的是,大模型對(duì)算力、云和基礎(chǔ)軟件帶來(lái)了顛覆性的影響。在云計(jì)算的上半場(chǎng),主力是移動(dòng)互聯(lián)網(wǎng),支持的主要是帶寬密集型應(yīng)用,比如網(wǎng)站、APP等,其最突出的需求是彈性擴(kuò)容能力。在這個(gè)階段,公有云是重帶寬而輕算力的。但是進(jìn)入云計(jì)算的下半場(chǎng),隨著AI浪潮的又一次興起,整個(gè)市場(chǎng)的驅(qū)動(dòng)力變成了算力,人們追求的是更高的效率和更低的成本。比如,完成一次大模型的訓(xùn)練是400萬(wàn)元還是500萬(wàn)元,這才是人們關(guān)注的焦點(diǎn)?!霸朴?jì)算邁入‘深水區(qū)’,算力和PaaS的銷售比例將越來(lái)越高?!狈嚼诒硎?,“‘算力即是國(guó)力’。在‘東數(shù)西算’剛提出來(lái)時(shí),有人可能會(huì)質(zhì)疑,真的需要這么多的算力嗎?但是在進(jìn)入以AI為驅(qū)動(dòng)的算力密集型應(yīng)用時(shí)代,人們不禁會(huì)感慨,‘東數(shù)西算’這一釋放算力需求的舉措真的是高瞻遠(yuǎn)矚。由AI驅(qū)動(dòng)的中國(guó)算力建設(shè)會(huì)掀起一次真正的‘狂飆’。”

對(duì)于大模型的落地而言,基礎(chǔ)軟件是重要的前提。這也是為什么越來(lái)越多的軟件廠商在大數(shù)據(jù)平臺(tái)、向量數(shù)據(jù)庫(kù)、湖倉(cāng)一體等方面加大投入力度的重要原因。以前,基礎(chǔ)軟件存在較大的性能與成本上的差異化。因此,軟件、模型與硬件的統(tǒng)一優(yōu)化空間巨大?!皬?qiáng)大而靈活的基礎(chǔ)軟件、開(kāi)放彈性的白盒模型,再加上精通業(yè)務(wù)的專業(yè)人才,將加速實(shí)現(xiàn)大模型落地‘最后一公里’的跨越?!狈嚼诒硎?,“為此,我們重磅推出了AIFS(AI Foundation Software)人工智能基礎(chǔ)軟件 & DataPilot數(shù)據(jù)領(lǐng)航員產(chǎn)品體系,為AI應(yīng)用的落地夯實(shí)基礎(chǔ)設(shè)施平臺(tái)?!?/p>

通用模型、垂類模型相輔相成

2023年3月,彭博社發(fā)布了專為金融領(lǐng)域打造的大型語(yǔ)言模型(LLM)BloombergGPT。它基于彭博社的金融數(shù)據(jù)源,以開(kāi)源的GPT-3框架為基礎(chǔ),構(gòu)建了一個(gè)3630億個(gè)標(biāo)簽的數(shù)據(jù)集,能夠更好地處理金融領(lǐng)域的數(shù)據(jù)和任務(wù)。通用大模型與面向行業(yè)和企業(yè)的垂類大模型,誰(shuí)能在商業(yè)市場(chǎng)上最先叫響?

“有券商曾經(jīng)向我們咨詢,能否一起開(kāi)發(fā)一個(gè)類似BloombergGPT的證券行業(yè)大模型?”有一段時(shí)間,方磊一直被客戶類似的詢問(wèn)所包圍。從需求方來(lái)看,確實(shí)有一些大型央企以及金融行業(yè)頭部企業(yè)對(duì)大模型非常感興趣。一方面,出于業(yè)務(wù)創(chuàng)新的考慮;另一方面,也是因?yàn)椤皵?shù)據(jù)邊界”問(wèn)題,由于與業(yè)務(wù)密切相關(guān)的私域數(shù)據(jù)不能“走出”公司,因而無(wú)法直接采用通用大模型,所以希望構(gòu)建屬于自己的垂類大模型。

從供給方來(lái)看,比如云算力廠商,就非常希望與九章云極DataCanvas這樣的基礎(chǔ)軟件廠商合作,推出打包的整體解決方案,讓大模型的訓(xùn)練更具效率且成本更優(yōu)。而這也正好契合了九章云極DataCanvas自身的定位,即“云中云”,為云算力廠商帶來(lái)基礎(chǔ)軟件方面的增值,便于行業(yè)用戶訓(xùn)練自己的垂類模型。

Databricks于2023年4月12日發(fā)布了Dolly 2.0。據(jù)稱這是業(yè)內(nèi)第一個(gè)開(kāi)源的、遵循指令的LLM,用戶可在透明且免費(fèi)提供的數(shù)據(jù)集上進(jìn)行微調(diào),從而構(gòu)建自己的商業(yè)應(yīng)用程序。這也給了同類AI基礎(chǔ)軟件廠商很大的啟示和信心,通過(guò)構(gòu)建和優(yōu)化AI基礎(chǔ)設(shè)施、數(shù)據(jù)平臺(tái)和提供參考大模型,就能讓行業(yè)客戶更簡(jiǎn)單、快捷地打造屬于自己的垂類大模型。

在大模型狂飆了半年多以后,人們對(duì)于通用大模型與垂類大模型的構(gòu)建、部署和應(yīng)用有了更深刻的認(rèn)知,慢慢形成了一種共識(shí):通用大模型會(huì)漸漸收斂,就像公有云那樣大浪淘沙,最終市場(chǎng)上只剩下最強(qiáng)的幾個(gè);而市場(chǎng)上更多的則是面向行業(yè)和企業(yè)的垂類大模型。從未來(lái)發(fā)展趨勢(shì)看,在開(kāi)源的以及通用可參考的大模型之上,融入更多行業(yè)知識(shí)和企業(yè)經(jīng)驗(yàn)的垂類大模型將層出不窮。行業(yè)龍頭企業(yè)研發(fā)大模型,而中小企業(yè)在其上直接開(kāi)發(fā)應(yīng)用,或許將成為一種定式。

一種更切合實(shí)際的作法是像九章云極DataCanvas那樣,“大小均涉及”。作為一款行業(yè)領(lǐng)先的人工智能應(yīng)用構(gòu)建基礎(chǔ)設(shè)施平臺(tái), AIFS覆蓋了大模型的訓(xùn)練、精調(diào)、壓縮、部署、推理和監(jiān)控,以及小模型的全生命周期過(guò)程,為數(shù)據(jù)科學(xué)家、應(yīng)用程序開(kāi)發(fā)人員和業(yè)務(wù)專家提供了一套工具,使不同角色的人員能夠相互協(xié)作,輕松處理數(shù)據(jù)并使用這些數(shù)據(jù)來(lái)開(kāi)發(fā)、訓(xùn)練和部署任何規(guī)模的模型。一句話, AIFS旨在為用戶自主構(gòu)建全生命周期的“大+小”模型提供一站式支持。方磊表示:“我們致力于打造人工智能基礎(chǔ)設(shè)施,既要為企業(yè)構(gòu)建個(gè)性化、自主的大模型賦能,又可以將大模型與以往積淀的小模型相融合,應(yīng)用于業(yè)務(wù)。”

大模型確實(shí)威力巨大,但它是否可以放之四海皆準(zhǔn),解決一切問(wèn)題呢?從目前來(lái)看,一些巨大的場(chǎng)景、尖端的應(yīng)用,還是要采用專用系統(tǒng),而碎片化的場(chǎng)景或者解決一些長(zhǎng)尾的to C方面的問(wèn)題,則更適合采用通用大模型。說(shuō)到底,專與精是兩類不同的需求。一些行業(yè)的細(xì)分需求,寄希望于通過(guò)對(duì)通用大模型進(jìn)行微調(diào)就能解決問(wèn)題,實(shí)際上并不可行。一方面,通用大模型并一定具備特定行業(yè)所需的能力;另一方面,即使你想對(duì)大模型進(jìn)行微調(diào),可能也會(huì)因?yàn)榇竽P捅旧磉^(guò)于‘沉重’,而力不從心。從這個(gè)角度說(shuō),垂類大模型是有其存在和發(fā)展的必要性。

AI普惠化 任重道遠(yuǎn)

眾所周知,微軟已經(jīng)在Azure、Microsoft 365以及多款開(kāi)發(fā)者工具中融入了人工智能功能。近日,微軟首席財(cái)務(wù)官Amy Hood在一次分析師電話會(huì)議上表示,公司未來(lái)還將進(jìn)一步增加數(shù)據(jù)中心建設(shè)成本,以便更好地支撐人工智能服務(wù)。不僅是微軟,也不僅僅是美國(guó)華爾街,而是全世界都在熱切期待,生成式AI能夠?yàn)槠髽I(yè)帶來(lái)真正的收益和增值。

今天,越來(lái)越多類ChatGPT的大模型正在不斷推出或在孕育之中,展現(xiàn)出巨大的技術(shù)和商業(yè)潛力,但欠缺的是足夠豐富的應(yīng)用場(chǎng)景,以及開(kāi)放的、安全可靠、高效的人工智能基礎(chǔ)設(shè)施?!艾F(xiàn)階段,大模型的應(yīng)用還是由創(chuàng)新驅(qū)動(dòng)的,并非完全由業(yè)務(wù)驅(qū)動(dòng)。”方磊表示,“大模型的普惠化是當(dāng)務(wù)之急?!?/p>

國(guó)內(nèi)外主流的云廠商不僅推出了自有的大模型,更為大模型的落地提供了完善的支撐,既有產(chǎn)品和服務(wù)層面的,也有生態(tài)、渠道方面的。比如,亞馬遜云科技在近日舉行的紐約峰會(huì)上宣布,推出7項(xiàng)生成式AI創(chuàng)新,包括Amazon Bedrock新增基礎(chǔ)模型供應(yīng)商Cohere和全新基礎(chǔ)模型,Amazon EC2 P5實(shí)例正式可用,Amazon OpenSearch Serverless支持全新向量引擎,編程助手Amazon CodeWhisperer與Amazon Glue實(shí)現(xiàn)集成等。

IDC發(fā)布的《IDC中國(guó)AI公有云服務(wù)市場(chǎng)份額,2022》報(bào)告顯示:2022年中國(guó)AI公有云服務(wù)市場(chǎng)呈現(xiàn)出80.6%的正增長(zhǎng),整體市場(chǎng)規(guī)模達(dá)79.7億元。生成式AI、大模型等新的能力在公有云上將實(shí)現(xiàn)更快的更新迭代。

“大模型時(shí)代需要完整基礎(chǔ)設(shè)施升級(jí),而不是依靠單個(gè)大模型解決所有問(wèn)題;大模型的落地將解決更困難的問(wèn)題,引起更深遠(yuǎn)的影響,而它并不比小模型更容易?!狈嚼谌缡钦f(shuō)。

大模型帶來(lái)的顛覆性并不只體現(xiàn)在大模型本身,而是將引發(fā)算力、數(shù)據(jù)、基礎(chǔ)軟件的一次最深刻的變革。未來(lái),不管大模型如何演進(jìn)迭代,高性能的基礎(chǔ)軟件與數(shù)據(jù)架構(gòu)都是不可或缺的“底座”,在AI惠普化的進(jìn)程中發(fā)揮基礎(chǔ)與核心的作用。包括九章云極DataCanvas在內(nèi)的眾多致力于AI普惠化的廠商,將軟件工具和解決方案作為賦能廣大行業(yè)用戶的抓手,持續(xù)融入前沿AI創(chuàng)新技術(shù),助力其在大模型時(shí)代加速實(shí)現(xiàn)自主的數(shù)智化升級(jí)和AI規(guī)?;瘧?yīng)用。

毋庸置疑,大模型應(yīng)用終將走向普惠化。但在獲得技術(shù)紅利的過(guò)程中,人們也不得不在安全、監(jiān)管、合規(guī)等方面投入更多精力。負(fù)責(zé)任地使用AI,將規(guī)范、引導(dǎo)大模型又快又好地落地。

關(guān)鍵詞:

最近更新

關(guān)于本站 管理團(tuán)隊(duì) 版權(quán)申明 網(wǎng)站地圖 聯(lián)系合作 招聘信息

Copyright © 2005-2023 創(chuàng)投網(wǎng) - www.mallikadua.com All rights reserved
聯(lián)系我們:39 60 29 14 2@qq.com
皖I(lǐng)CP備2022009963號(hào)-3