首頁 商業(yè) > 正文

重塑未來!訊飛星火領(lǐng)跑國產(chǎn)大模型?

互聯(lián)網(wǎng)曾經(jīng)近乎重寫了所有行業(yè),通訊、購物、支付、打車、點(diǎn)餐等等,人們生活的方方面面幾乎被重塑。

如今大模型再次給予人們充分的想象空間。

第一財(cái)經(jīng)提到,從樂觀的角度來看,ChatGPT可以取代一些重復(fù)性較強(qiáng)、規(guī)律性較為單一的工作,但同時(shí)它也可以釋放出更多的生產(chǎn)力,讓人們關(guān)注更有想象力、情感、思辨性的部分,并催生出AI提示工程師、AI調(diào)教師、AI創(chuàng)意師等一批新興職業(yè)。


【資料圖】

簡單來說,大模型相當(dāng)于一個(gè)全新的系統(tǒng),這個(gè)全新的系統(tǒng)可以大幅降低很多行業(yè)的門檻,未來也會有很多產(chǎn)品構(gòu)建需要用到大模型,而人們的創(chuàng)造性勞動,將通過這個(gè)全新的系統(tǒng)得到大幅釋放。

根據(jù)中國科學(xué)技術(shù)信息研究所的不完全統(tǒng)計(jì),目前國內(nèi)已經(jīng)發(fā)布了70多個(gè)大模型,不少產(chǎn)品都展現(xiàn)出了驚人的爆發(fā)力。

拿科大訊飛來說,基于訊飛星火認(rèn)知大模型研發(fā)的功能落地學(xué)習(xí)機(jī)、辦公本等產(chǎn)品之后,科大訊飛今年再次突破高增速,618銷售額同比增長125%,并在多個(gè)品類中摘獲銷售額冠軍。

這一點(diǎn),同樣體現(xiàn)在資本市場。6月20日,AI概念股表現(xiàn)搶眼,科大訊飛漲近7%,復(fù)權(quán)股價(jià)同樣創(chuàng)歷史新高。科大訊飛成交102億元,在兩市居首。

剛好筆者可以使用訊飛星火大模型了,最近也看到了不少有趣的測試,我們就一起看看現(xiàn)在的AI大模型發(fā)展到什么程度了。

1、錯(cuò)別字識別哪家強(qiáng)

高考作文想必大家都看膩了,前陣子看到《智商稅研究中心》的這篇校對測評的設(shè)問還挺特別。

篇幅有限,拎出幾個(gè)比較能拉開差距的問題,來跟大家一起分享看看。

首先是字詞方面。

“洛陽親友如相問,就說我在岳陽樓?!睂ⅰ跋鄦枴卞e(cuò)拼成“翔問”,考驗(yàn)一下各家大模型的基本功。

訊飛星火:

文心一言:

通義千問:

360智腦:

GPT4:

訊飛星火、文心一言、通義千問、GPT4都順利完成基礎(chǔ)的校對,只有360智腦,追問之下仍表示無誤。

再來看語病方面。

校對語病的例子中整體表現(xiàn)不佳,不過讓AI直接識別判斷是否有歧義,還是能看出一點(diǎn)國產(chǎn)AI大模型之間的差距。

例如,“這句話有歧義嗎:在床上‘葛優(yōu)癱’了一天,他突然想起來了?!?/p>

訊飛星火:

文心一言:

通義千問:

360智腦:

GPT4:

這里雖然幾乎全軍覆沒,不過訊飛星火還是指出了“可能存在一些解讀上的歧義”,一直表現(xiàn)不錯(cuò)的GPT4沒能看出歧義還是有點(diǎn)意外。

最后看下指正校對錯(cuò)誤后,AI大模型能否承認(rèn)錯(cuò)誤接受指正。

訊飛星火:

文心一言:

通義千問:

360智腦:

GPT4:

這部分訊飛星火意外地跟GPT4表現(xiàn)得旗鼓相當(dāng),反應(yīng)迅速,簡潔明了,承認(rèn)錯(cuò)誤后直接給出了校對后的句子;文心一言還要再進(jìn)一步給出指令才會給出答案;而通義千問和360智腦則是“積極認(rèn)錯(cuò),堅(jiān)決不改”。

校對文本錯(cuò)誤在某種層面上,反映了大模型的基礎(chǔ)能力,地基打好了,才能有更多上探的空間。

總體來說,在基礎(chǔ)的校對能力上,訊飛星火算是國產(chǎn)大模型中最接近GPT4水平的;其他表現(xiàn)也中規(guī)中矩;至于360智腦,用360掌門人周鴻祎在360首發(fā)時(shí)的話來說,360智腦還只是個(gè)“孩子”,距離完善使用還有相當(dāng)?shù)囊欢温芬摺?/p>

2、“數(shù)學(xué)高手”

寒窗苦讀十余年,無論教育制度怎么改,除了語文,還有一個(gè)怎么也躲不掉的,就是數(shù)學(xué)。

數(shù)學(xué)的重要性不言而喻,它培養(yǎng)了我們的邏輯思維能力。但相對于大模型擅長的文本內(nèi)容,數(shù)學(xué)能力在一定程度上算是大模型的弱項(xiàng)

不過上個(gè)月才出的訊飛星火意外地表現(xiàn)有些驚喜。

訊飛星火首發(fā)后,知名科技行業(yè)觀察者《差評》,就曾對訊飛星火作出過全面測評,在數(shù)學(xué)測驗(yàn)部分,也展示了訊飛星火基礎(chǔ)的數(shù)學(xué)能力,全部答對毫無壓力。

經(jīng)典的雞兔同籠問題,即使變換參數(shù)和問法也能全部答對。

用《差評》文中的話來說,訊飛星火做數(shù)學(xué)題,有一種過于強(qiáng)大,可以和GPT4掰掰手腕的感覺。

這種感覺,將國產(chǎn)大模型的回答都放一起后則更加強(qiáng)烈。

《科創(chuàng)板日報(bào)》就曾在一篇文章中,對文心一言、科大訊飛、360智腦幾家比較有代表性的大模型進(jìn)行測評展示。

例如,“某次數(shù)學(xué)競賽共20道題,評分標(biāo)準(zhǔn)是:每做對一題得5分,每做錯(cuò)或不做一題扣1分。小華參加了這次競賽,得了64分。問:小華做對幾道題?”

正確答案應(yīng)該是14題,我們看一下各家大模型的作答。

文心一言:

360智腦:

訊飛星火:

可以看到只有訊飛星火答對了,文中展示的另一道小升初數(shù)學(xué)題,同樣也只有訊飛星火答對。

《科創(chuàng)板日版》在文章開頭也指出,科大訊飛星火認(rèn)知在數(shù)理能力表現(xiàn)尤為突出。

那到底能突出到什么程度呢?

我們繼續(xù)對訊飛星火加大難度看看。

大模型在數(shù)學(xué)領(lǐng)域的表現(xiàn)有著見微知著的效果,因?yàn)檫@需要結(jié)合大語言模型和計(jì)算引擎兩者的能力。在復(fù)雜邏輯條件下,學(xué)習(xí)多步驟推理,這對計(jì)算資源和數(shù)據(jù),有著海量需求,對算力也有著極高的要求。

訊飛星火在數(shù)學(xué)方面能力的展示,更是一家企業(yè)數(shù)據(jù)資源和算力水平的展示。對于國產(chǎn)大模型來說,數(shù)學(xué)能力是意義非常的。

不過,大模型不是一朝一夕就能訓(xùn)練完成的,如何落地?能不能落地?也是企業(yè)需要考慮的。

3、落地前景

大模型的出現(xiàn)注定是要破舊立新的,技術(shù)的發(fā)展回歸到現(xiàn)實(shí)生活中,還是要看它的實(shí)際應(yīng)用能力。

《娛樂資本論》做過一期市面上主流的5款大模型,一共90個(gè)回答的橫評,想必耗費(fèi)了不少時(shí)間精力,整體評價(jià)也是比較中肯的,頗具參考意義。

可以先看一下這張最終測試評分表。

大模型這種屬于比較底層的框架,我們勢必要做出自己的由中文語料訓(xùn)練而成的大模型。所以我們不可避免地會與ChatGPT相比較。

從上圖來看,目前在落地應(yīng)用方面,訊飛星火在主流國產(chǎn)大模型中,離ChatGPT是最近的。

具體到案例中,我們截取小紅書帶貨的商業(yè)文案來看一下。

文案較長,內(nèi)容有所折疊,不過總的來說,文中展示的兩個(gè)作答還是比較貼切的。

星火自設(shè)了一款手機(jī)型號進(jìn)行更準(zhǔn)確的數(shù)據(jù)呈現(xiàn),內(nèi)容和邏輯這種長處不作過多分析,主要拉開差距的地方還是要求中的emoji表情。

相較于文心一言和天工未能察覺出需要在文案和題中帶有emoji表情,星火的emoji甚至還有關(guān)聯(lián)性,直接拿去發(fā)小紅書基本也足夠了。

《TMT時(shí)報(bào)》的記者也對文心一言、通義千問、訊飛星火的商業(yè)文案能力做過測試。

文心一言:

通義千問:

訊飛星火:

文心一言雖然洋洋灑灑寫了不少,不過作為海報(bào)文案還需再精簡一番;通義千問整體表現(xiàn)不錯(cuò),不過相對更側(cè)重中秋,而失了商業(yè)主體的主導(dǎo)作用;訊飛星火完成度依舊出色,也更突出所設(shè)定的AI醫(yī)療公司的保護(hù)健康的作用,是可以直接拿來使用的程度。

其實(shí)訊飛星火在落地應(yīng)用方面,還做出了不小的嘗試。

訊飛星火升級到V1.5版本后,新增了星火助手功能,人手一個(gè)賈維斯不再是幻想。

目前經(jīng)審核上傳的星火助手多達(dá)500多個(gè),遍及各個(gè)行業(yè)和細(xì)分領(lǐng)域,還支持自己創(chuàng)建,并不斷調(diào)試出符合自己需求的專屬小助理。

除了我們比較能想象到的日常辦公,筆者對其中的腦暴部分更加感興趣,比如這個(gè)“小說靈感記錄員”。

從動物社會結(jié)構(gòu),到智慧與力量的平衡,再到文化傳承等等,這對創(chuàng)作類相關(guān)行業(yè)的增益可想而知。

星火助手發(fā)布時(shí)間還并不長,整體來看,仍有不少需要調(diào)試改進(jìn)的地方。

不過,隨著時(shí)間的推移,星火助手在落地能力以及前景等方面已經(jīng)展示出了相當(dāng)?shù)臐摿Α?/strong>

4、尾聲

中國科學(xué)技術(shù)信息研究所發(fā)布的一份報(bào)告顯示,從全球已經(jīng)發(fā)布的大模型分布來看,在大模型數(shù)量上,中國和美國超過全球總數(shù)的80%,中國從2020年進(jìn)入大模型快速發(fā)展期,目前與美國保持同步增長態(tài)勢。

除了大模型,應(yīng)用端也呈現(xiàn)出爆發(fā)式增長的態(tài)勢。

中國經(jīng)營報(bào)在3月的一篇文中提到,天眼查數(shù)據(jù)顯示,截至當(dāng)時(shí),人工智能相關(guān)企業(yè)258.8萬余家,其中,2022年新增注冊企業(yè)73.2萬余家,新增注冊企業(yè)增速41.5%;近三年(2020~2022年)人工智能相關(guān)企業(yè)新增注冊企業(yè)增速均超過40%。

大模型以及大模型相關(guān)的企業(yè),正在如雨后春筍般涌現(xiàn)。

時(shí)代的機(jī)遇下,作為國產(chǎn)大模型的重要代表之一,訊飛星火也已經(jīng)隱隱有了燎原之勢。

關(guān)鍵詞:

最近更新

關(guān)于本站 管理團(tuán)隊(duì) 版權(quán)申明 網(wǎng)站地圖 聯(lián)系合作 招聘信息

Copyright © 2005-2023 創(chuàng)投網(wǎng) - mallikadua.com All rights reserved
聯(lián)系我們:39 60 29 14 2@qq.com
皖I(lǐng)CP備2022009963號-3