首頁 資訊 > 研究 > 正文

當前快訊:全面開源??“悟道3.0”大模型系列發(fā)布

本報訊 (記者 張偉) 在6月9-10日舉行的2023北京智源大會上,北京智源研究院院長黃鐵軍發(fā)布《2023智源研究院進展報告》,并發(fā)布了全面開源的“悟道3.0”系列大模型及算法,報告了在高精度生命模擬和有機大分子建模方面的最新進展。

繼2021年悟道大模型項目連創(chuàng)“中國首個+世界最大”紀錄之后,智源 “悟道3.0 ”進入全面開源新階段,帶來一系列領先成果:“悟道·天鷹”(Aquila)語言大模型系列、天秤(FlagEval)開源大模型評測體系與開放平臺,“悟道 · 視界”視覺大模型系列,以及一系列多模態(tài)模型成果。

黃鐵軍介紹,在2021年3月的悟道1.0發(fā)布會上,智源研判人工智能已經從“大煉模型”轉變?yōu)椤盁挻竽P汀钡男码A段,從此,“大模型”這個概念進入公眾視野。


(資料圖片僅供參考)

至于何為大模型?他認為,需要具備3個條件:一是規(guī)模要大,參數達百億規(guī)模以上;二是涌現性,能夠產生預料之外的新能力;三是通用性,不限于專門問題或領域,能夠處理多種不同的任務。

據介紹,悟道系列模型已發(fā)展到“悟道3.0”版本,涵蓋語言、視覺、多模態(tài)等基礎大模型。其中,“悟道·視界”視覺大模型系列,實現6項國際領先技術突破,點亮了通用視覺曙光。“悟道·視界”系統(tǒng)化解決了當前計算機視覺領域的一系列瓶頸問題,包括任務統(tǒng)一、模型規(guī)模化以及數據效率等,包括在多模態(tài)序列中補全一切的多模態(tài)大模型 Emu,最強十億級視覺基礎模型 EVA,一通百通、分割一切的視界通用分割模型,首創(chuàng)上下文圖像學習技術路徑的通用視覺模型Painter,性能最強開源CLIP模型 EVA-CLIP,以及簡單prompt(提示)即可視頻編輯的 vid2vid-zero 零樣本視頻編輯技術。

悟道·天鷹(Aquila)語言大模型系列+天秤(FlagEval)評測體系,打造了大模型能力與評測標準雙標桿。為推動大模型在產業(yè)落地和技術創(chuàng)新,智源研究院發(fā)布了“開源商用許可語言大模型系列+開放評測平臺”兩大重磅成果,打造“大模型進化流水線”,持續(xù)迭代、持續(xù)開源開放。

悟道·天鷹Aquila 語言大模型是首個具備中英雙語知識、支持商用許可協議、國內數據合規(guī)需求的開源語言大模型。該模型在中英文高質量語料基礎上從 0 開始訓練,通過數據質量的控制、多種訓練的優(yōu)化方法,實現在更小的數據集、更短的訓練時間,獲得比其它開源模型更優(yōu)的性能。

天秤(FlagEval)大模型評測體系及開放平臺,旨在建立科學、公正、開放的評測基準、方法、工具集,協助研究人員全方位評估基礎模型及訓練算法的性能,同時探索利用AI方法實現對主觀評測的輔助,大幅提升評測的效率和客觀性。

據悉,天秤(FlagEval)評測體系是科技部2030旗艦項目重要課題,正與北京大學、北京航空航天大學、北京師范大學、北京郵電大學、閩江學院、南開大學、中國電子技術標準化研究院、中國科學院自動化研究所等合作單位共建(按首字母排序),定期發(fā)布權威評測榜單

與此同時,開源開放,FlagOpen 大模型開源技術體系升級,大規(guī)模、可商用中文指令數據集COIG二期也于會上發(fā)布。

“大模型不是任何一家機構或者一家公司壟斷的技術,大模型技術體系是大家共建共享。我們要共建一個智力社會所需要的一套基礎的算法體系”。黃鐵軍院長介紹,基于此,智源研究院在打造開源生態(tài)方面做了許多努力。今年年初發(fā)布的FlagOpen大模型技術開源體系,經過一段時間的發(fā)展,又有了一系列發(fā)展。這為大模型發(fā)展夯實底層技術棧,提供切實加速度。

如,FlagOpen平臺是智源建設的大模型技術開源體系。旨在打造全面支撐大模型技術發(fā)展的開源算法體系和一站式基礎軟件平臺,支持協同創(chuàng)新和開放競爭,共建共享大模型時代的“新Linux”開源開放生態(tài)。

數據集方面,智源已開源首個大規(guī)模、可商用的中文指令數據集COIG。COIG一期已開放總計19.1萬條指令數據,COIG二期正在建設最大規(guī)模、持續(xù)更新的中文多任務指令數據集,整合了1800多個海量開源數據集,人工改寫了3.9億條指令數據,并提供了完善的數據篩選、版本控制工具。

關鍵詞:

最近更新

關于本站 管理團隊 版權申明 網站地圖 聯系合作 招聘信息

Copyright © 2005-2023 創(chuàng)投網 - www.mallikadua.com All rights reserved
聯系我們:39 60 29 14 2@qq.com
皖ICP備2022009963號-3