英特爾推出oneAPI 2023工具包，大幅提升即將推出的英特爾硬件的價(jià)值

2022-12-20 12:17:26 來(lái)源: 電子創(chuàng)新網(wǎng)

英特爾工具的新功能提升了跨平臺(tái)生產(chǎn)力

今天，英特爾宣布英特爾? oneAPI工具包的2023年版本已在英特爾?開(kāi)發(fā)者云平臺(tái)（Intel? Developer Cloud）上線，并正在通過(guò)現(xiàn)有的渠道推送。新的oneAPI 2023工具包支持即將推出的第四代英特爾?至強(qiáng)?可擴(kuò)展處理器、英特爾?至強(qiáng)? CPU Max 系列和英特爾?數(shù)據(jù)中心GPU，包括Flex系列和新的Max系列。這些工具可提升性能和生產(chǎn)力，并增加了對(duì)新的Codeplay1插件的支持，使開(kāi)發(fā)者能更容易地為那些非英特爾的GPU架構(gòu)編寫(xiě)SYCL代碼。這些基于標(biāo)準(zhǔn)的工具提供了硬件方面的選擇，也讓在跨架構(gòu)系統(tǒng)上運(yùn)行的高性能應(yīng)用的開(kāi)發(fā)變得更加輕松。

(資料圖)

英特爾oneAPI 2023工具包包括一套完整的最新編譯器、庫(kù)、分析和移植工具，以及優(yōu)化后的AI和機(jī)器學(xué)習(xí)框架，讓開(kāi)發(fā)者能為oneAPI支持的CPU、GPU和FPGA構(gòu)建高性能、跨架構(gòu)的應(yīng)用。開(kāi)發(fā)者可使用這些工具快速實(shí)現(xiàn)性能目標(biāo)，并通過(guò)單個(gè)代碼庫(kù)節(jié)省時(shí)間，從而將更多時(shí)間用于創(chuàng)新。

新版本的oneAPI工具包可幫助開(kāi)發(fā)者利用英特爾硬件的先進(jìn)功能：

第4代英特爾至強(qiáng)可擴(kuò)展處理器和至強(qiáng)CPU Max系列，內(nèi)置英特爾?高級(jí)矩陣擴(kuò)展（英特爾? AMX）、Quick Assist 技術(shù)（QAT）、英特爾?AVX-512、bfloat16 及更多。

英特爾?數(shù)據(jù)中心GPU，包括內(nèi)置基于硬件的AV1編碼器的Flex系列，以及Max系列。Max系列提供靈活數(shù)據(jù)類型的支持，內(nèi)置英特爾? X^e矩陣擴(kuò)展（英特爾?XMX）、矢量化引擎（vector engine）、英特爾?X^e-Link互聯(lián)擴(kuò)展和其它功能。

oneAPI 2023工具包具有先進(jìn)的軟件性能：

英特爾? Fortran編譯器（Intel? Fortran Compiler）提供了完整的 Fortran 語(yǔ)言直至 Fortran 2018標(biāo)準(zhǔn)的支持，并擴(kuò)展了對(duì) OpenMP GPU 分流的支持，加快了符合標(biāo)準(zhǔn)的應(yīng)用程序的開(kāi)發(fā)。

英特爾? oneAPI數(shù)學(xué)內(nèi)核庫(kù)（oneMKL）包含OpenMP 分流能力的擴(kuò)展，提高了可移植性。

英特爾? oneAPI 深度神經(jīng)網(wǎng)絡(luò)庫(kù)（oneDNN）支持第四代英特爾至強(qiáng)處理器和Max系列CPU處理器的高級(jí)深度學(xué)習(xí)功能，包括英特爾?AMX、英特爾?AVX-512、VNNI 和 bfloat16。

通過(guò)豐富的SYCL支持，以及代碼遷移和分析工具的強(qiáng)化，讓面向多架構(gòu)系統(tǒng)的代碼開(kāi)發(fā)變得更輕松，進(jìn)而提高開(kāi)發(fā)者的生產(chǎn)力。

英特爾?oneAPI DPC++/C++編譯器增加了Codeplay為英偉達(dá)和AMD GPU開(kāi)發(fā)的新插件的支持，以簡(jiǎn)化SYCL代碼的編寫(xiě)，并提高代碼面向這些處理器架構(gòu)的可移植性。這提供了一個(gè)統(tǒng)一的構(gòu)建環(huán)境，并整合了工具，以提高跨平臺(tái)生產(chǎn)力。作為該解決方案的一部分，英特爾和Codeplay將為英偉達(dá)GPU的oneAPI插件開(kāi)始提供商業(yè)化的優(yōu)先支持（priority support）。

基于開(kāi)源 SYCLomatic的英特爾? DPC++ 兼容性工具增加了100多個(gè)新的CUDA APIs支持，讓從CUDA到SYCL的代碼遷移變得更容易。

用戶可以使用英特爾?VTune? Profiler識(shí)別大規(guī)模MPI應(yīng)用中的不均衡問(wèn)題。

英特爾? Advisor為英特爾數(shù)據(jù)中心GPU Max系列添加了自動(dòng)化roofline分析，以識(shí)別內(nèi)存、緩存或計(jì)算瓶頸，確認(rèn)其原因并進(jìn)行優(yōu)先處理，同時(shí)提供可操作的建議，以優(yōu)化從CPU到GPU 的工作負(fù)載分流中的重復(fù)數(shù)據(jù)傳輸成本。

48%⁴的開(kāi)發(fā)者面向使用多種處理器的異構(gòu)系統(tǒng)進(jìn)行開(kāi)發(fā)，因此需要更高效的跨架構(gòu)編程來(lái)應(yīng)對(duì)現(xiàn)實(shí)工作負(fù)載日益擴(kuò)大的范圍和規(guī)模。結(jié)合使用oneAPI 的開(kāi)放、統(tǒng)一的編程模型與英特爾基于標(biāo)準(zhǔn)的多架構(gòu)工具，開(kāi)發(fā)者能夠在CPU和加速器的硬件、性能、生產(chǎn)力和代碼可移植性方面自由地進(jìn)行選擇。相反，為專有編程模型（如 CUDA）編寫(xiě)的代碼，缺乏面向其它硬件的可移植性，讓開(kāi)發(fā)實(shí)踐變得孤立，將企業(yè)困于一個(gè)封閉的生態(tài)系統(tǒng)中。

此外，開(kāi)放生態(tài)系統(tǒng)也在繼續(xù)擴(kuò)大對(duì)oneAPI的使用，新的oneAPI卓越中心正在陸續(xù)成立。劍橋大學(xué)Open Zettascale 實(shí)驗(yàn)室正致力于將重要的百萬(wàn)兆級(jí)的備選代碼（candidate codes）移植到oneAPI上，包括CASTEP、FEniCS和AREPO。該中心還提供課程和研討會(huì)，由專家講授oneAPI使用方法和工具，用于編譯和移植代碼以及優(yōu)化性能。目前，在全球總共已經(jīng)建立了30個(gè)oneAPI卓越中心。

*可前往英特爾新聞發(fā)布室了解更多產(chǎn)品性能具體細(xì)節(jié)：https://www.intel.com/content/www/us/en/newsroom/news/oneapi-2023-tools-...

了解更多信息，請(qǐng)?jiān)L問(wèn)：Codeplay宣布為英偉達(dá)和AMD硬件推出oneAPI插件 | 英特爾oneAPI 2023工具包的功能細(xì)節(jié)|介紹英特爾oneAPI 2023工具包（博客）| 英特爾oneAPI 工具包2023版預(yù)覽（網(wǎng)絡(luò)研討會(huì)錄像）| oneAPI和Codeplay

備注：

¹Codeplay是一家英特爾旗下的公司。

²MLPerf? DeepCAM:?

使用優(yōu)化后的Pytorch 1.11在MLPerf? HPC-AI v 0.7 DeepCAM訓(xùn)練基準(zhǔn)上獲得未經(jīng)認(rèn)證的性能提升。結(jié)果沒(méi)有經(jīng)過(guò)MLCommons協(xié)會(huì)的認(rèn)證。未經(jīng)認(rèn)證的結(jié)果沒(méi)有經(jīng)過(guò)MLPerf?審查，可能使用與經(jīng)MLPerf?規(guī)范認(rèn)證的結(jié)果不一致的測(cè)量方法和/或工作負(fù)載實(shí)現(xiàn)方式。MLPerf?名稱和標(biāo)識(shí)是MLCommons協(xié)會(huì)在美國(guó)和其他國(guó)家的商標(biāo)。保留所有權(quán)利。嚴(yán)禁未經(jīng)授權(quán)的使用。更多信息見(jiàn)www.mlcommons.org。

AMD EPYC 7763 ：英特爾截至2022年4月7日的測(cè)試。1-節(jié)點(diǎn)，2x?AMD EPYC 7763，啟用超線程，禁用 Turbo，總內(nèi)存 512 GB（16 個(gè)插槽/32 GB/3200 MHz, DDR4），BIOS版本AMI 1.1b，ucode版本0xa001144，操作系統(tǒng)Red Hat Enterprise Linux 8.5 (Ootpa)，內(nèi)核4.18.0-348.7.1.el8_5.x86_64，編譯器gcc（GCC）8.5.0 20210514 (Red Hat 8.5.0-4)，https://github.com/mlcommons/hpc/tree/main/deepcam, torch1.11.0a0+git13cdb98, torch-1.11.0a0+git13cdb98-cp38-cp38-linux_x86_64.whl, torch_ccl-1.2.0+44e473a-cp38-cp38-linux_x86_64.whl, intel_extension_for_pytorch-1.10.0+cpu-cp38-cp38-linux_x86_64.whl，Intel MPI 2021.5，Python3.8

英特爾? 至強(qiáng)? 8380可擴(kuò)展處理器：英特爾截至2022年4月7日的測(cè)試。1-節(jié)點(diǎn)，2x 英特爾? 至強(qiáng)? 8380處理器，啟用超線程，禁用 Turbo，總內(nèi)存 512 GB（16個(gè)插槽/32 GB/3200 MHz, DDR4），BIOS版本 SE5C6200.86B.0022.D64.2105220049，ucode版本0xd0002b1，操作系統(tǒng)Red Hat Enterprise Linux 8.5 (Ootpa)，內(nèi)核4.18.0-348.7.1.el8_5.x86_64，編譯器gcc (GCC) 8.5.0 20210514 (Red Hat 8.5.0-4)，https://github.com/mlcommons/hpc/tree/main/deepcam, torch1.11.0a0+git13cdb98, torch-1.11.0a0+git13cdb98-cp38-cp38-linux_x86_64.whl, torch_ccl-1.2.0+44e473a-cp38-cp38-linux_x86_64.whl, intel_extension_for_pytorch-1.10.0+cpu-cp38-cp38-linux_x86_64.whl (AVX-512), Intel MPI 2021.5，Python3.8

英特爾? 至強(qiáng)? CPU Max 系列（緩存模式）AVX-512：英特爾截至2022年5月25日的測(cè)試。1-節(jié)點(diǎn)，2x英特爾? 至強(qiáng)? CPU Max 系列，啟用超線程，禁用 Turbo，總內(nèi)存 128GB 高帶寬內(nèi)存（HBM）和1TB（16個(gè)插槽/ 64 GB/ 4800 MHz, DDR5），集群模式：SNC4，BIOS版本EGSDCRB1.86B.0080.D05.2205081330，ucode版本0x8f000320，操作系統(tǒng)CentOS Stream 8，內(nèi)核5.18.0-0523.intel_next.1.x86_64+server，編譯器gcc (GCC) 8.5.0 20210514 (Red Hat 8.5.0-10), https://github.com/mlcommons/hpc/tree/main/deepcam, torch1.11.0a0+git13cdb98, AVX-512, FP32, torch-1.11.0a0+git13cdb98-cp38-cp38-linux_x86_64.whl, torch_ccl-1.2.0+44e473a-cp38-cp38-linux_x86_64.whl, intel_extension_for_pytorch-1.10.0+cpu-cp38-cp38-linux_x86_64.whl (AVX-512)，Intel MPI 2021.5，Python3.8

NVIDIA A100 80GB：英特爾截至2022年4月13日的測(cè)試。1-節(jié)點(diǎn)，2x英特爾? 至強(qiáng)? 8360Y可擴(kuò)展處理器，啟用超線程，啟用Turbo，總內(nèi)存 256 GB（16個(gè)插槽/16 GB/3200 MHz），PCIe 版 NVIDIA A100，BIOS版本AMI 1.1b，ucode版本0xd000311，操作系統(tǒng)Red Hat Enterprise Linux 8.4 (Ootpa)，內(nèi)核4.18.0-305.el8.x86_64，編譯器gcc (GCC) 8.4.1 20200928 (Red Hat 8.4.1-1)，https://github.com/mlcommons/hpc/tree/main/deepcam, pytorch1.11.0 py3.7_cuda11.3_cudnn8.2.0_0, cudnn 8.2.1, cuda11.3_0, intel-openmp 2022.0.1 h06a4308_3633，python3.7

英特爾? 至強(qiáng)? CPU Max 系列（緩存模式）BF16/AMX：英特爾截至2022年5月25日的測(cè)試。 1-節(jié)點(diǎn)，2x英特爾? 至強(qiáng)? CPU Max 系列，啟用超線程，禁用 Turbo，總內(nèi)存128GB高帶寬內(nèi)存（HBM）和1TB（16個(gè)插槽/64 GB/4800 MHz，DDR5），集群模式：SNC4，BIOS版本EGSDCRB1.86B.0080.D05.2205081330，ucode版本0x8f000320，操作系統(tǒng)CentOS Stream 8，內(nèi)核5.18.0-0523.intel_next.1.x86_64+server，編譯器gcc (GCC) 8.5.0 20210514 (Red Hat 8.5.0-10)，https://github.com/mlcommons/hpc/tree/main/deepcam, torch1.11.0a0+git13cdb98, AVX-512 FP32, torch-1.11.0a0+git13cdb98-cp38-cp38-linux_x86_64.whl, torch_ccl-1.2.0+44e473a-cp38-cp38-linux_x86_64.whl, intel_extension_for_pytorch-1.10.0+cpu-cp38-cp38-linux_x86_64.whl (AVX-512，AMX，啟用BFloat16)，Intel MPI 2021.5，Python3.8

第四代英特爾? 至強(qiáng)? 可擴(kuò)展處理器多節(jié)點(diǎn)集群：英特爾截至2022年4月9日的測(cè)試。16-節(jié)點(diǎn)集群，1-節(jié)點(diǎn)，2x第四代英特爾? 至強(qiáng)? 可擴(kuò)展處理器，啟用超線程，啟用Turbo，總內(nèi)存 256 GB（16個(gè)插槽/16 GB/4800 MHz，DDR5），BIOS版本Intel SE5C6301.86B.6712.D23.2111241351，ucode版本0x8d000360，操作系統(tǒng)Red Hat Enterprise Linux 8.4 (Ootpa)，內(nèi)核4.18.0-305.el8.x86_64，編譯器gcc (GCC) 8.4.1 20200928 (Red Hat 8.4.1-1)，https://github.com/mlcommons/hpc/tree/main/deepcam, torch1.11.0a0+git13cdb98 AVX-512, FP32, torch-1.11.0a0+git13cdb98-cp38-cp38-linux_x86_64.whl, torch_ccl-1.2.0+44e473a-cp38-cp38-linux_x86_64.whl, intel_extension_for_pytorch-1.10.0+cpu-cp38-cp38-linux_x86_64.whl (AVX-512)，Intel MPI 2021.5，Python3.8

³LAMMPS

與AMD EPYC 7773X相比，英特爾? 至強(qiáng)? CPU Max系列運(yùn)行LAMMPS工作負(fù)載（原子流體的Geomean、銅、DPD、液晶、聚乙烯、蛋白質(zhì)、Stillinger-Weber勢(shì)、Tersoff勢(shì)、水）的性能要高1.9倍。

與英特爾? 至強(qiáng)? 8380處理器相比，英特爾? 至強(qiáng)? CPU Max系列處理器運(yùn)行LAMMPS工作負(fù)載（原子流體的Geomean、銅、DPD、液晶、聚乙烯、蛋白質(zhì)、Stillinger-Weber勢(shì)、Tersoff勢(shì)、水）的性能要高1.6倍。Intel? Xeon? 8380：基于英特爾截至2022年10月28日的測(cè)試。1-節(jié)點(diǎn)，2x英特爾? 至強(qiáng)? 8380處理器，啟用超線程，啟用Turbo，NUMA配置的SNC2，總內(nèi)存256GB（16x16GB 3200MT/s, Dual-Rank），BIOS版本SE5C620.86B.01.01.0006.2207150335，ucode版本0xd000375，操作系統(tǒng)Rocky Linux 8.6，Linux版本4.18.0-372.26.1.el8_6.crt1.x86_64，LAMMPS v2021-09-29 cmkl:2022.1.0, icc:2021.6.0, impi:2021.6.0, tbb:2021.6.0; 線程/核:; 啟用Turbo; BuildKnobs:-O3 -ip -xCORE-AVX512 -g -debug inline-debug-info -qopt-zmm-usage=high

AMD EPYC 7773X: 基于英特爾截至2022年10月6日的測(cè)試。1-節(jié)點(diǎn)，2x AMD EPYC, 啟用超線程，啟用Turbo，NUMA配置的NPS數(shù)：4，總內(nèi)存256GB（16x16GB 3200MT/s, Dual-Rank），BIOS版本M10, ucode版本0xa001224，操作系統(tǒng)Rocky Linux 8.6 (Green Obsidian)，Linux版本4.18.0-372.26.1.el8_6.crt1.x86_64, LAMMPS v2021-09-29 cmkl:2022.1.0, icc:2021.6.0, impi:2021.6.0, tbb:2021.6.0; 線程/核:; 啟用Turbo; BuildKnobs:-O3 -ip -g -debug inline-debug-info -axCORE-AVX2 -march=core-avx2;

英特爾? 至強(qiáng)? CPU Max系列：英特爾截至2022年8月31日的測(cè)試。1-節(jié)點(diǎn)，2x英特爾? 至強(qiáng)? CPU Max 系列，啟用超線程，啟用Turbo，NUMA配置的SNC4，總內(nèi)存128 GB（3200MHz的HBM2e高帶寬內(nèi)存），BIOS版本SE5C7411.86B.8424.D03.2208100444，ucode版本0x2c000020，操作系統(tǒng)CentOS Stream 8，Linux版本5.19.0-rc6.0712.intel_next.1.x86_64+server, LAMMPS v2021-09-29 cmkl:2022.1.0, icc:2021.6.0, impi:2021.6.0, tbb:2021.6.0; 線程/核:; 禁用Turbo; BuildKnobs:-O3 -ip -xCORE-AVX512 -g -debug inline-debug-info -qopt-zmm-usage=high

⁴Evans Data Global Development Survey Report 22.1, 2022年6月

性能因用途、配置和其他因素而異。欲了解更多信息，請(qǐng)?jiān)L問(wèn)www.Intel.com/PerformanceIndex。結(jié)果可能會(huì)有所不同。

性能結(jié)果基于截至配置中所示日期的測(cè)試，并且可能無(wú)法反映所有公開(kāi)可用的更新。

英特爾不負(fù)責(zé)控制或?qū)徲?jì)第三方數(shù)據(jù)。在評(píng)估數(shù)據(jù)準(zhǔn)確性時(shí)，請(qǐng)參考其他信息源。

關(guān)于英特爾

英特爾（NASDAQ: INTC）作為行業(yè)引領(lǐng)者，創(chuàng)造改變世界的科技，推動(dòng)全球進(jìn)步并讓生活豐富多彩。在摩爾定律的啟迪下，我們不斷致力于推進(jìn)半導(dǎo)體設(shè)計(jì)與制造，幫助我們的客戶應(yīng)對(duì)最重大的挑戰(zhàn)。通過(guò)將智能融入云、網(wǎng)絡(luò)、邊緣和各種計(jì)算設(shè)備，我們釋放數(shù)據(jù)潛能，助力商業(yè)和社會(huì)變得更美好。如需了解英特爾創(chuàng)新的更多信息，請(qǐng)?jiān)L問(wèn)英特爾中國(guó)新聞中心newsroom.intel.cn以及官方網(wǎng)站intel.cn。

關(guān)鍵詞：操作系統(tǒng) 工作負(fù)載可移植性數(shù)據(jù)中心

英特爾推出oneAPI 2023工具包，大幅提升即將推出的英特爾硬件的價(jià)值

您可能也感興趣:

今日熱點(diǎn)

中國(guó)算力發(fā)展指數(shù)白皮書(shū)發(fā)布廣東算力創(chuàng)新水平和研發(fā)投入居首

生命科技標(biāo)準(zhǔn)創(chuàng)新研討會(huì)舉行打通標(biāo)準(zhǔn)應(yīng)用“最后一公里”

“黑科技”廣泛應(yīng)用我國(guó)單位GDP二氧化碳排放持續(xù)下降

更多

更多

排行

最近更新

今日要聞

英特爾推出oneAPI 2023工具包，大幅提升即將推出的英特爾硬件的價(jià)值

您可能也感興趣:

今日熱點(diǎn)

中國(guó)算力發(fā)展指數(shù)白皮書(shū)發(fā)布 廣東算力創(chuàng)新水平和研發(fā)投入居首

生命科技標(biāo)準(zhǔn)創(chuàng)新研討會(huì)舉行 打通標(biāo)準(zhǔn)應(yīng)用“最后一公里”

“黑科技”廣泛應(yīng)用 我國(guó)單位GDP二氧化碳排放持續(xù)下降

為您推薦

近十年財(cái)險(xiǎn)業(yè)務(wù)快速發(fā)展 財(cái)產(chǎn)保險(xiǎn)業(yè)風(fēng)險(xiǎn)保障水平不提升

遼寧擴(kuò)大緩繳社保費(fèi)政策實(shí)施范圍 補(bǔ)繳期間免收滯納金

增額終身壽險(xiǎn)成銀保市場(chǎng)上的黑馬 中途退保恐會(huì)損失保費(fèi)

保險(xiǎn)公司紛紛探索轉(zhuǎn)型之路 聚焦細(xì)分業(yè)務(wù)、推出新產(chǎn)品

更多

更多

排行

最近更新

今日要聞

英特爾推出oneAPI 2023工具包，大幅提升即將推出的英特爾硬件的價(jià)值

中國(guó)算力發(fā)展指數(shù)白皮書(shū)發(fā)布廣東算力創(chuàng)新水平和研發(fā)投入居首

生命科技標(biāo)準(zhǔn)創(chuàng)新研討會(huì)舉行打通標(biāo)準(zhǔn)應(yīng)用“最后一公里”

“黑科技”廣泛應(yīng)用我國(guó)單位GDP二氧化碳排放持續(xù)下降

近十年財(cái)險(xiǎn)業(yè)務(wù)快速發(fā)展財(cái)產(chǎn)保險(xiǎn)業(yè)風(fēng)險(xiǎn)保障水平不提升

遼寧擴(kuò)大緩繳社保費(fèi)政策實(shí)施范圍補(bǔ)繳期間免收滯納金

增額終身壽險(xiǎn)成銀保市場(chǎng)上的黑馬中途退保恐會(huì)損失保費(fèi)

保險(xiǎn)公司紛紛探索轉(zhuǎn)型之路聚焦細(xì)分業(yè)務(wù)、推出新產(chǎn)品