每日訊息!英特爾以強大產(chǎn)品力，迎接生成式AI的廣闊機遇

2023-03-30 09:01:25 來源: 電子創(chuàng)新網(wǎng)

要點速覽：

【資料圖】

新聞：近日，頂級機器學習開源庫Hugging Face分享性能結果，展示了Habana^?Gaudi^?2 AI硬件加速器針對1760億參數(shù)大模型卓越的運行推理速度。同時，該結果亦展現(xiàn)了在Gaudi2服務器上運行主流計算機視覺工作負載時的能效優(yōu)勢。

重要意義：目前，ChatGPT等生成式AI工具正在為整個行業(yè)帶來全新的能力，而其模型所需的計算亦使性能、成本和能效成為眾多企業(yè)關注的焦點。

縱觀大局：隨著生成式AI模型變得越來越大，在數(shù)據(jù)預處理到訓練和推理等一系列復雜的AI負載功能上，能效成為推動生產(chǎn)力的關鍵因素。開發(fā)人員需要一種靈活、開放、高能效和更可持續(xù)的解決方案，即“一次構建、隨處部署”的方法，使各種形式的AI（包括生成式AI）都能充分發(fā)揮其潛力。

下一步：AI已經(jīng)走過很長的一段路，但仍有更多方面有待挖掘。英特爾致力于AI的真正民主化和可持續(xù)性，這將使人們能夠通過開放的生態(tài)系統(tǒng)更廣泛地從該技術，以及生成式AI技術中獲益。

總結：一個開放的生態(tài)系統(tǒng)讓開發(fā)人員能夠利用英特爾對流行開源框架、庫和工具的優(yōu)化，來構建和部署AI。英特爾AI智能硬件加速器以及第四代英特爾^?至強^?可擴展處理器的內置加速器提升了性能和每瓦性能，以滿足生成式AI對性能、價格和可持續(xù)性的需求。

生成式AI能夠模仿人類生成的內容，在改變我們工作和生活方式的諸多方面提供了一個令人興奮的機會。然而，這種快速演進的技術也揭示出，在數(shù)據(jù)中心成功利用AI需要極其復雜的計算。

英特爾面向未來進行了大量投資，希望每個人都能利用這項技術，并能輕松進行大規(guī)模部署。同時，英特爾正與產(chǎn)業(yè)伙伴接洽，以支持一個基于信任、透明和多種選擇的開放式AI生態(tài)系統(tǒng)。

擁抱具有卓越性能的開源生成式AI

生成式AI例如GPT-3和DALL-E等語言模型已經(jīng)存在一段時間了，但ChatGPT（一種可以進行類似人類對話的生成式AI聊天機器人）則引發(fā)巨大轟動，讓人們開始關注傳統(tǒng)數(shù)據(jù)中心架構的瓶頸。ChatGPT還加快了對硬件和軟件解決方案的需求，這些解決方案使AI能夠充分發(fā)揮其潛力?；陂_放方法和異構計算的生成式AI使其更容易獲得，并更經(jīng)濟地部署最優(yōu)的解決方案。開放生態(tài)系統(tǒng)允許開發(fā)人員在優(yōu)先考慮功耗、價格和性能的同時，隨時隨地構建和部署AI，從而釋放生成式AI的力量。

網(wǎng)絡研討會：英特爾將舉辦數(shù)據(jù)中心和人工智能事業(yè)部投資者網(wǎng)絡研討會

英特爾正在積極采取措施，并通過優(yōu)化主流的開源框架、庫和工具來實現(xiàn)出色的硬件性能，同時消除復雜性，來確保自身是實現(xiàn)生成式AI的明智選擇。近日，頂級機器學習開源庫Hugging Face發(fā)布的結果顯示了英特爾AI硬件加速器卓越的推理運行速度，該結果基于對包含1760億個參數(shù)的BLOOMZ模型（一種基于轉換器的多語言大型語言模型（LLM）和包含70億參數(shù)的較小BLOOMZ模型進行推理。其中，對于包含70億參數(shù)的較小BLOOMZ模型，Habana?第一代 Gaudi?具有明顯的性價比優(yōu)勢。此外，Hugging Face Optimum Habana庫簡化了大型LLM的部署，用戶僅需對代碼進行極小的修改。

英特爾研究院的研究人員還使用Habana Gaudi2在LMentry（一種最近提出的語言模型基準）零次學習設置下評估BLOOMZ。BLOOMZ的精度與GPT-3模型尺寸相似，如下圖所示，最大的176B BLOOMZ模型的性能優(yōu)于類似大小的GPT-3模型。

在100K LMentry提示上，BLOOMZ模型（最多1760億個參數(shù)）使用Habana Gaudi加速器對生成的語言輸出進行的自動評估。¹

此外，Hugging Face亦介紹了Stability AI的Stable Diffusion，這是另一個用于從文本生成圖像的最先進生成式AI模型之一，也是流行的?DALL-E圖像生成器的開放訪問替代方案，Stable Diffusion在內置英特爾^?高級矩陣擴展（英特爾^?AMX）的第四代英特爾至強可擴展處理器上運行的平均速度提高了3.8倍。這種加速是在不更改任何代碼的情況下實現(xiàn)的。此外，通過使用英特爾Extension for PyTorch?with Bfloat16（一種用于機器學習的自定義格式），自動混合精度可以再提速一倍，并將延遲減少到5秒——比初始基線32秒快了近6.5倍。用戶可在Hugging Face網(wǎng)站上一個基于英特爾CPU（第四代至強處理器）的實驗性Stable Diffusion演示中進行自行嘗試。

Stability AI創(chuàng)始人兼首席執(zhí)行官Emad Mostaque表示：“在Stability AI，我們希望讓每個人都能構建自己的AI技術。英特爾已經(jīng)使Stable Diffusion模型能夠高效運行在他們的異構產(chǎn)品上——從第四代Sapphire Rapids CPU一直到像Gaudi這樣的加速器，因此是實現(xiàn)AI民主化的一個絕佳合作伙伴。我們期待在下一代語言、視頻和代碼模型等方面與他們合作?！?/p>

OpenVINO進一步加速了Stable Diffusion推理。結合使用第四代至強CPU，它的速度幾乎比第三代英特爾^?至強^?可擴展CPU提高了2.7倍。Optimum Intel是OpenVINO支持的一個工具，用于加速英特爾架構上的端到端管道，它將平均延遲再降低3.5倍，總共降低近10倍。

解決價格、性能和效率問題

此外，為滿足減少用電量的關鍵需求及不斷增長的性能需求，還需要提供更加可持續(xù)的解決方案。一個開放的生態(tài)系統(tǒng)可以消除阻礙進步的障礙，使開發(fā)人員能夠在每一項工作中都能夠使用最好的硬件和軟件工具進行創(chuàng)新。

Gaudi2與第一代Gaudi構建在相同的高效架構上，可助力大規(guī)模工作負載的性能和效率達到全新高度，并在運行AI工作負載時展現(xiàn)出強大的能效優(yōu)勢。

大規(guī)模AI工作負載還需要達到“一次構建、隨處部署”方式，這種方式基于靈活、開放的解決方案，能夠實現(xiàn)更好的能效。第四代至強處理器是英特爾最具可持續(xù)性的數(shù)據(jù)中心處理器，有著更高的能效和節(jié)能效果。憑借英特爾AMX這樣的內置加速器，在廣泛的AI工作負載和使用案例中，推理和訓練性能可提高10倍²，同時其每瓦性能相較英特爾前代產(chǎn)品最多可提升14倍³。

¹2023年3月24日進行測量，使用部署于英特爾開發(fā)者云上的Habana Gaudi2深度學習服務器，該服務器采用8個Gaudi2 HL-225H夾層卡和第三代英特爾至強處理器，運行SynapseAI?軟件版本1.8.0，batch_size=1

²參見intel.com/performanceindex：第四代英特爾至強可擴展處理器部分的[A16]及[A17]

³參見intel.com/processorclaims：第四代英特爾至強可擴展處理器，E1

結果可能不同。

關于英特爾

英特爾（NASDAQ: INTC）作為行業(yè)引領者，創(chuàng)造改變世界的技術，推動全球進步并讓生活豐富多彩。在摩爾定律的啟迪下，我們不斷致力于推進半導體設計與制造，幫助我們的客戶應對最重大的挑戰(zhàn)。通過將智能融入云、網(wǎng)絡、邊緣和各種計算設備，我們釋放數(shù)據(jù)潛能，助力商業(yè)和社會變得更美好。如需了解英特爾創(chuàng)新的更多信息，請訪問英特爾中國新聞中心intel.cn/content/www/cn/zh/newsroom以及官方網(wǎng)站intel.cn。

關鍵詞：

每日訊息!英特爾以強大產(chǎn)品力，迎接生成式AI的廣闊機遇

您可能也感興趣:

今日熱點

抖音直播如何看回放？抖音怎么刪除直播記錄？

藍牙耳機如何和手機配對？藍牙耳機可以同時連接兩個手機嗎？

中國算力發(fā)展指數(shù)白皮書發(fā)布廣東算力創(chuàng)新水平和研發(fā)投入居首

更多

更多

排行

最近更新

今日要聞

每日訊息!英特爾以強大產(chǎn)品力，迎接生成式AI的廣闊機遇

您可能也感興趣:

今日熱點

抖音直播如何看回放？抖音怎么刪除直播記錄？

藍牙耳機如何和手機配對？藍牙耳機可以同時連接兩個手機嗎？

中國算力發(fā)展指數(shù)白皮書發(fā)布 廣東算力創(chuàng)新水平和研發(fā)投入居首

為您推薦

交強險未出險第二年為什么沒優(yōu)惠？第一年不出險第二年打幾折？

機票里面包含保險嗎？飛機保險有必要買嗎？

遼寧擴大緩繳社保費政策實施范圍 補繳期間免收滯納金

近十年財險業(yè)務快速發(fā)展 財產(chǎn)保險業(yè)風險保障水平不提升

更多

更多

排行

最近更新

今日要聞

每日訊息!英特爾以強大產(chǎn)品力，迎接生成式AI的廣闊機遇

抖音直播如何看回放？抖音怎么刪除直播記錄？

藍牙耳機如何和手機配對？藍牙耳機可以同時連接兩個手機嗎？

中國算力發(fā)展指數(shù)白皮書發(fā)布廣東算力創(chuàng)新水平和研發(fā)投入居首

交強險未出險第二年為什么沒優(yōu)惠？第一年不出險第二年打幾折？

機票里面包含保險嗎？飛機保險有必要買嗎？

遼寧擴大緩繳社保費政策實施范圍補繳期間免收滯納金

近十年財險業(yè)務快速發(fā)展財產(chǎn)保險業(yè)風險保障水平不提升