文心一言向社會全面開放，到底是誰需要誰？

2023-09-01 09:52:43 來源: PConline太平洋科技

8月30日晚間，百度旗下AI大模型文心一言宣布向全社會全面開放，所有用戶都可以體驗這款A(yù)I大模型了。

8月31日的時候，百度方面又公開表示，開放下載12小時后，文心一言App登上了蘋果商店免費榜榜首，成為首個登頂?shù)闹形腁I原生應(yīng)用。

【資料圖】

與此同時有多家媒體報道稱，國內(nèi)將有11家大模型陸續(xù)通過審批備案，從8月31日起陸續(xù)向全社會公眾開放服務(wù)。顯然，文心一言是其中最早與用戶見面的那個。

相關(guān)的消息也受到了互聯(lián)網(wǎng)、科技圈的聚焦關(guān)注，各類觀點、分析、報道層出不窮。不過雖然互聯(lián)網(wǎng)、科技圈嗨了，但似乎普通用戶對文心一言乃至整個AI大模型的感知都并不高。

PConline隨機詢問了多位非互聯(lián)網(wǎng)、科技圈的用戶，普遍表示并不了解文心一言以及眾多AI大模型，即便對于此前爆火的AI大模型ChatGPT，也僅僅只是聽過名字而已，對于具體的功能內(nèi)容并不了解。

從數(shù)據(jù)來看也是如此，更多的人或許還并不了解和關(guān)注AI大模型。百度搜索指數(shù)顯示，文心一言、ChatGPT的相關(guān)搜索熱度始終保持著較為平緩的曲線，并未出現(xiàn)太大的波動，而從熱度數(shù)值的對比來說，則是遠遠低于抖音這樣的主流App應(yīng)用。

這其實與大模型尚處于發(fā)展早期，相關(guān)平臺還需要經(jīng)歷長期的迭代完善，缺乏現(xiàn)象級的應(yīng)用與用戶產(chǎn)生連接等方面有關(guān)。即使是如今面向社會開放的文心一言，也還有許多不盡如人意的地方。

按照百度方面的介紹，文心一言并非倉促上馬的項目，而是經(jīng)歷了數(shù)年的發(fā)展積淀。文心一言的基礎(chǔ)模型文心大模型發(fā)布于2019年，近期升級的文心大模型3.5也持續(xù)在十余個國內(nèi)外權(quán)威測評中位居第一。

例如今年7月?lián)嗉颐襟w報道，人民數(shù)據(jù)研究院選取文心一言、訊飛星火、通義千問、ChatGPT四個主流AI大模型進行評測，結(jié)果顯示文心一言排名第一。

從評測維度可以看到，在內(nèi)容生態(tài)、數(shù)據(jù)認知、邏輯推理等方面，文心一言均有著一定的優(yōu)勢能力。這其實不難理解，畢竟百度深耕AI領(lǐng)域多年，有著很強的AI技術(shù)積累，作為頭部搜索平臺，在大數(shù)據(jù)方面自然也是有著一定優(yōu)勢的。

不過雖然文心一言在各類測評中取得了好成績，但在實際的使用體驗上仍然有不少被用戶吐槽的地方，其AI智能程度也似乎并未達到部分用戶的預(yù)期。

例如在文心一言榜單登頂?shù)奶O果商店中，按照時間順序查看到的用戶評論幾乎都為負面，主要集中在答非所問、內(nèi)容錯誤等方面。PConline也發(fā)現(xiàn)，在華為應(yīng)用商店、vivo應(yīng)用商店的文心一言評論區(qū)，同樣出現(xiàn)了不少類似的吐槽評論。

PConline在實際體驗中也發(fā)現(xiàn)了一些事實錯誤的情況，同時也有一些表現(xiàn)得不夠智能，不夠出彩的地方。

例如PConline在百度搜索里找到了一張羅納爾多的照片，拿來問文心一言時得到的回復(fù)卻是貝利。

同樣的，PConline在百度搜索中獲取了一張姆巴佩的照片，文心一言通過一番推理，用一種不太確定的口吻回答說這人可能是姆巴佩。與此同時，法國隊并未獲得2022年世界杯冠軍，即便在2018年奪冠的那一屆，也不存在制勝一球的說法，法國隊4粒進球中也只有一球來自于姆巴佩，所以無論從哪個維度來說，文心一言給出的信息都算不上準確。

在文心一言宣傳中提到的寫文章功能上，PConline在簡單的測試中發(fā)現(xiàn)結(jié)果似乎并不太智能。

PConline用今年暑期曾備受關(guān)注的上海迪士尼門票爭議的新聞話題，讓文心一言寫一篇文章，得到的內(nèi)容只能說是一篇較為初級的分析文章，重點是全文完全沒有提到此前發(fā)生的一些新聞事件和輿論爭議內(nèi)容，而這些恰恰是百度搜索引擎中最容易獲取到的信息數(shù)據(jù)。

在體驗中PConline還遇到了一個有趣的小插曲，當(dāng)你問類似 “百度遇到過什么失敗” 等與百度公司相關(guān)的非正面話題時，文心一言要么拒絕回答，要么直接結(jié)束對話。但當(dāng)同樣的問題，主體換成其他企業(yè)時，文心一言會正常給出回答內(nèi)容。

當(dāng)然，作為百度開發(fā)的一款A(yù)I大模型，維護百度的形象、避開百度的一些負面內(nèi)容，這并沒有什么問題，但如果能在這方面也保持客觀公正的態(tài)度，像回答阿里失敗案例那樣坦然回答百度過往的一些不足的話，就可以視為“出彩”的表現(xiàn)了。

回到文心一言被吐槽的內(nèi)容錯誤問題上。 “AI大模型怎么總會給出錯誤答案？” 有意思的是，PConline也將這個問題拋給了文心一言，得到了一個頗為誠實的回答。

文心一言將原因分為了這幾點。首先是數(shù)據(jù)訓(xùn)練不足，AI大模型的準確性與其所依賴的數(shù)據(jù)訓(xùn)練密切相關(guān)，如果訓(xùn)練數(shù)據(jù)不足或不夠多樣化，AI大模型可能無法準確解析結(jié)果。

第二點是語義理解存在一定的挑戰(zhàn)。AI模型往往是通過深度學(xué)習(xí)算法來學(xué)習(xí)和理解文字、圖像等內(nèi)容形式的，這個過程存在著非常多的困難和挑戰(zhàn)。比如當(dāng)面對抽象畫或有著多重含義的內(nèi)容時，AI大模型可能無法進行準確的解析。

文心一言也表示，為了克服這些問題，研究人員可以通過增加訓(xùn)練數(shù)據(jù)、改進模型架構(gòu)和提高算法精度等方式來優(yōu)化AI大模型。同時對于含有特定語義信息的圖像，如抽象畫，可以通過額外的標(biāo)注或特定的訓(xùn)練來提高模型的解析能力。

簡單來說，AI大模型想要變得越來越完善，越來越好用，就需要更強的大數(shù)據(jù)庫，更精準的訓(xùn)練算法，更高強度的使用頻次。

那么該如何更好地解決這些問題呢？AI領(lǐng)域有一個十分直白的法則，“人多力量大”。不妨試想一下，面向大眾開放，讓海量的用戶參與到使用中來，是不是能滿足這幾大關(guān)鍵條件？

用一個故事可以很好地理解這一點。人工智能、計算機視覺科學(xué)家李飛飛曾在2009年就發(fā)表過一篇論文，講述了來自全球167個國家近5萬名工作者，以眾包的方式通過三年努力，人工標(biāo)注出了1500萬圖像。

正是這5萬人的努力，讓AI產(chǎn)業(yè)收獲了一個有標(biāo)志性意義的數(shù)據(jù)集，這龐大規(guī)模的標(biāo)注性數(shù)據(jù)，對AI領(lǐng)域中的計算機視覺技術(shù)的發(fā)展，起到了極為重要的推動作用。

無獨有偶，在游戲領(lǐng)域，一款網(wǎng)絡(luò)游戲在正式上線運行之前，必須要經(jīng)歷內(nèi)測和公測階段。顧名思義，公測就是公開測試的意思，主要就是為了邀請更多的用戶參與進來，側(cè)重于客戶端可能出現(xiàn)的問題，測試服務(wù)器的性能和查找程序的BUG等等，是產(chǎn)品正式上線運營以及不斷迭代優(yōu)化的必要環(huán)節(jié)。

所以簡單來說，大家可以把文心一言此次的“對全社會開放”理解為公測，只有越來越多的用戶參與進來，不斷使用文心一言，產(chǎn)生越來越多的使用體驗、反饋意見等數(shù)據(jù)，才能讓文心一言更好地完善功能、迭代發(fā)展。

實際上，從文心一言的功能設(shè)計也能看出用戶的真實體驗和反饋對其AI大模型發(fā)展的重要性。幾乎在每一次與用戶的交互后，文心一言都會出現(xiàn)一個比較醒目的按鈕圖標(biāo)，方便用戶對回答內(nèi)容和交互體驗的評價，用戶可以點擊贊或者踩，無論點擊哪一個按鈕，文心一言都會彈出新的窗口，希望用戶能更為詳細地記錄和反饋真實意見。

其實百度創(chuàng)始人李彥宏說的一段話也值得大家關(guān)注， “當(dāng)文心一言向數(shù)以億計互聯(lián)網(wǎng)用戶大規(guī)模開放服務(wù)后，能夠獲得大量真實世界中的人工反饋，這將進一步改進基礎(chǔ)模型，并以更快速度迭代文心一言，創(chuàng)造更好的用戶體驗?！?

這段話其實也意味著，所謂的百度文心一言向全社會全面開放，并不是百度單方面給予社會、用戶的一項利好，用戶的體驗和反饋，對于百度文心一言來說或許才有著更為重要的意義和價值。

但PConline需要指出一個十分重要的地方，文心一言在面向全社會開放的階段，是否更應(yīng)該先完善好信息錯誤這個最核心的問題，而不是指望在后續(xù)的用戶使用中，讓用戶來幫忙完成。

不妨想想，如果這是一款新上市的汽車，廠家跟消費者說，我們的車子可能會偶爾失靈、失控、開到錯誤的路上，我們的車子還存在很多安全漏洞，不完善的地方，希望各位消費者在后續(xù)的使用體驗中多多反饋這些問題......那么這家汽車廠商還有存在的必要嗎？

回看文心一言，用戶在使用過程中如果得到的信息和內(nèi)容本身就存在錯漏，會引發(fā)的負面后果是難以估量的，尤其在文心一言對全社會開放，大量的用戶涌入后，這樣的風(fēng)險和危害性或?qū)⒊杀对鲩L。

試想一下，如果每天有一定數(shù)量的虛假、錯誤內(nèi)容經(jīng)由AI大模型傳遞給了海量的用戶，會出現(xiàn)怎樣的后果？最直接的就是會出現(xiàn)無數(shù)個現(xiàn)代版的“三人成虎”案例，嚴重的話會導(dǎo)致整個互聯(lián)網(wǎng)空間充斥著謠言、虛假新聞、錯誤信息等不可信內(nèi)容。

量子位就曾在一篇相關(guān)報道中，將這樣的現(xiàn)象稱為 “AI正在污染中文互聯(lián)網(wǎng)”。

簡單來說，AI生成的內(nèi)容并不是憑空而來的，而是需要一定的信息素材作為基礎(chǔ)。當(dāng)AI因為各種原因生成了錯誤、虛假信息后，這些信息又可能成為另一個AI生成內(nèi)容時的素材。

當(dāng)互聯(lián)網(wǎng)空間充斥著AI制造的垃圾信息后，這種無限套娃式的AI信息傳遞，就會變成一個輸入和輸出都是垃圾信息的死循環(huán)，這是一個十分可怕的糟糕局面。

這不僅僅是文心一言，而是所有AI大模型都必須要重視的問題。

其實無論文心一言還是其他的AI大模型，都需要回答一個核心的問題，為什么用戶需要你，你憑什么能替代原有的工具平臺。

比如PConline在文心一言中提問李白是誰，文心一言給出的只有兩段十分簡要的介紹。但在百度等傳統(tǒng)的主流搜索引擎中搜索這個問題后，用戶可以得到十分豐富的內(nèi)容展現(xiàn)，無論圖片、視頻、文章等多元化的呈現(xiàn)形式，還是從李白到杜甫，再到盛唐歷史等更有創(chuàng)造性地內(nèi)容延伸，體驗感和需求滿足等維度，都是文心一言這樣的AI大模型所無法比擬的。

說到這里PConline必須指出文心一言一個必須引起重視的隱患問題。文心一言在App中還提供了一個“發(fā)現(xiàn)”專區(qū)，里面有著非常豐富的預(yù)設(shè)主題和場景，顯示為“靈感小工具”，觀察來看是幫助用戶更好地使用文心一言的功能，可以有效地提升用戶的使用場景和需求頻次。

但PConline也在其中發(fā)現(xiàn)了不少游走于違規(guī)邊緣的所謂AI大模型使用場景。比如AI生成淘寶評論、外賣評論、小紅書種草文案、小紅書探店文案、知乎回答等，而這些恰恰是各大平臺目前嚴打的虛假內(nèi)容。

比如點開“知乎回答生成”這個所謂的靈感小工具，就會進入到一個預(yù)設(shè)好的對話框，文心一言會提供一些預(yù)設(shè)的問題讓用戶選擇，然后自動模仿知乎平臺的回答內(nèi)容生成文案，用戶也可以自由發(fā)揮，提出指定的問題讓文心一言生成AI答案。

可以毫不夸張地說，理論上AI大模型在工具屬性和用戶體驗上能為用戶帶來巨大的效率提升和想象空間，但也存在著被刻意利用，造成網(wǎng)絡(luò)空間信息污染，不法商業(yè)牟利等惡果的風(fēng)險。

總而言之，要避免這個情況，還是得回到本文一再強調(diào)的問題上。用戶為什么需要AI大模型？讓這個世界變得更好，AI大模型能提供怎樣的可能性？如何鎖住AI大模型可能產(chǎn)生的“惡”？

需要思考的問題還有很多很多，期待未來文心一言以及更多的AI大模型們，能交出一個盡可能完美的答卷。

關(guān)鍵詞：

文心一言向社會全面開放，到底是誰需要誰？

您可能也感興趣:

今日熱點

分析機構(gòu)：2023 年全球移動端游戲收入將達 1080 億美元、PC 游...

建昌恒昌村鎮(zhèn)銀行董事長徐春雨任職資格獲準

中鋼天源(002057.SZ)：上半年凈利降13.93%至1.70億元

更多

更多

排行

最近更新

今日要聞

文心一言向社會全面開放，到底是誰需要誰？

您可能也感興趣:

今日熱點

分析機構(gòu)：2023 年全球移動端游戲收入將達 1080 億美元、PC 游...

建昌恒昌村鎮(zhèn)銀行董事長徐春雨任職資格獲準

中鋼天源(002057.SZ)：上半年凈利降13.93%至1.70億元

為您推薦

土耳其經(jīng)濟放緩幅度小于預(yù)期 央行有底氣繼續(xù)加息

用一生認識魯迅

年輕人變美有新選擇！這部權(quán)威報告將揭曉答案

揚州千億級汽車產(chǎn)業(yè)再添新引擎

更多

更多

排行

最近更新

今日要聞

文心一言向社會全面開放，到底是誰需要誰？

分析機構(gòu)：2023 年全球移動端游戲收入將達 1080 億美元、PC 游...

土耳其經(jīng)濟放緩幅度小于預(yù)期央行有底氣繼續(xù)加息