首頁 商業(yè) > 正文

快手自主研發(fā)的大語言模型KwaiYii開始內(nèi)測(cè),13B版本快意表現(xiàn)優(yōu)秀,平均分超過61分


(資料圖片)

近日,快手自主研發(fā)的大語言模型“快意”(KwaiYii)已經(jīng)開始內(nèi)測(cè),并為業(yè)務(wù)團(tuán)隊(duì)提供了標(biāo)準(zhǔn)API和定制化項(xiàng)目合作方案。在最新的CMMLU中文向排名中,快意的13B版本KwaiYii-13B在five-shot和zero-shot下的排名均為第一,特別在人文學(xué)科、中國(guó)特定主題等方面表現(xiàn)優(yōu)秀,平均分超過61分。根據(jù)官方介紹,快意大模型(KwaiYii)是由快手AI團(tuán)隊(duì)從零到一獨(dú)立自主研發(fā)的一系列大規(guī)模語言模型(Large Language Model,LLM),當(dāng)前包含了多種參數(shù)規(guī)模的模型,并覆蓋了預(yù)訓(xùn)練模型(KwaiYii-Base)、對(duì)話模型(KwaiYii-Chat)。KwaiYii-13B-Base預(yù)訓(xùn)練模型具備優(yōu)異的通用技術(shù)底座能力,在絕大部分權(quán)威的中/英文Benchmark上取得了同等模型尺寸下的State-Of-The-Art效果。例如,KwaiYii-13B-Base預(yù)訓(xùn)練模型在MMLU、CMMLU、C-Eval、HumanEval等Benchmark上目前處于同等模型規(guī)模的領(lǐng)先水平。KwaiYii-13B-Chat對(duì)話模型具備出色的語言理解和生成能力,支持內(nèi)容創(chuàng)作、信息咨詢、數(shù)學(xué)邏輯、代碼編寫、多輪對(duì)話等廣泛任務(wù),人工評(píng)估結(jié)果表明KwaiYii-13B-Chat超過主流的開源模型,并在內(nèi)容創(chuàng)作、信息咨詢和數(shù)學(xué)解題上接近ChatGPT(3.5)同等水平。據(jù)了解,快手AI團(tuán)隊(duì)將持續(xù)迭代“快意”大模型,一方面將繼續(xù)優(yōu)化模型性能并研發(fā)多模態(tài)能力,另一方面也在推進(jìn)更多C端與B端業(yè)務(wù)場(chǎng)景下的落地。

關(guān)鍵詞:

最近更新

關(guān)于本站 管理團(tuán)隊(duì) 版權(quán)申明 網(wǎng)站地圖 聯(lián)系合作 招聘信息

Copyright © 2005-2023 創(chuàng)投網(wǎng) - www.mallikadua.com All rights reserved
聯(lián)系我們:39 60 29 14 2@qq.com
皖I(lǐng)CP備2022009963號(hào)-3