久久久久久久久久久久中文字幕,久久久精品免费视频

高性能計(jì)算（HPC）已成為科學(xué)發(fā)現(xiàn)的基本工具。

無論是發(fā)現(xiàn)新的拯救生命的藥物，對(duì)抗氣候變化，還是創(chuàng)建精確的世界模擬，這些解決方案都需要巨大且快速增長的處理能力。它們?cè)絹碓匠鰝鹘y(tǒng)計(jì)算方法的范圍。

這就是為什么業(yè)界接受 NVIDIA GPU 加速計(jì)算的原因。與人工智能相結(jié)合，它為科學(xué)進(jìn)步帶來了性能上百萬倍的飛躍。如今，2700個(gè)應(yīng)用程序可以從 NVIDIA GPU 的加速中受益，而且這個(gè)數(shù)字在不斷增長的300萬開發(fā)者社區(qū)的支持下繼續(xù)上升。

HPC 應(yīng)用程序性能改進(jìn)

要在整個(gè) HPC 應(yīng)用程序范圍內(nèi)實(shí)現(xiàn)數(shù)倍的加速，需要在堆棧的各個(gè)級(jí)別進(jìn)行不懈的創(chuàng)新。這從芯片和系統(tǒng)開始，一直到應(yīng)用程序框架本身。

NVIDIA 平臺(tái)每年都在繼續(xù)提供顯著的性能改進(jìn)，在體系結(jié)構(gòu)和整個(gè) NVIDIA 軟件堆棧方面都取得了不懈的進(jìn)步。與六年前發(fā)布的 P100 相比， H100 Tensor Core GPU 預(yù)計(jì)性能將提高 26 倍，比摩爾定律快 3 倍多。

圖 1 NVIDIA HPC + AI 平臺(tái)性能從 P100 到 H100

圖 2 NVIDIA HPC SDK 為每個(gè)功能提供了開發(fā)人員資產(chǎn)。

NVIDIA 平臺(tái)的核心是功能豐富且高性能的軟件堆棧。為了促進(jìn) GPU 在最廣泛的 HPC 應(yīng)用中的加速，該平臺(tái)包括 NVIDIA HPC SDK 。 SDK 提供了無與倫比的開發(fā)人員靈活性，支持使用標(biāo)準(zhǔn)語言、指令和 CUDA 創(chuàng)建和移植 GPU 加速的應(yīng)用程序。

NVIDIA HPC SDK 的強(qiáng)大功能在于一整套高度優(yōu)化的 GPU 加速數(shù)學(xué)庫，使您能夠充分發(fā)揮 NVIDIA GPU 的性能潛力。為了獲得最佳的多 GPU 和多節(jié)點(diǎn)性能， NVIDIA HPC SDK 還提供了功能強(qiáng)大的通信庫：

NVSHMEM 為跨越多個(gè) GPU 內(nèi)存的數(shù)據(jù)創(chuàng)建全局地址空間。

NVIDIA 集體通信庫（ NCCL ）優(yōu)化了 GPU 之間的通信。

總之，該平臺(tái)提供了最高的性能和靈活性，以支持不斷增長的 GPU 加速 HPC 應(yīng)用程序。

HPC 性能和能效

為了展示 NVIDIA 全棧創(chuàng)新如何轉(zhuǎn)化為 accelerated HPC 的最高性能，我們比較了 HPE 服務(wù)器與四個(gè) NVIDIA GPU 服務(wù)器的性能，以及基于其他供應(yīng)商同等數(shù)量加速器模塊的類似配置服務(wù)器的性能。

我們使用各種數(shù)據(jù)集測(cè)試了一組五個(gè)廣泛使用的 HPC 應(yīng)用程序。雖然 NVIDIA 平臺(tái)可以加速 2700 個(gè)跨行業(yè)的應(yīng)用程序，但我們?cè)诒容^中可以使用的應(yīng)用程序受到其他供應(yīng)商加速器可用軟件和應(yīng)用程序版本選擇的限制。

對(duì)于除分子動(dòng)力學(xué)模擬軟件 NAMD 以外的所有工作負(fù)載，我們的結(jié)果是使用多個(gè)數(shù)據(jù)集的結(jié)果幾何平均值計(jì)算的，以最小化異常值的影響，并代表客戶體驗(yàn)。

我們還在多 GPU 和單 GPU 場景中測(cè)試了這些應(yīng)用程序。

在多 GPU 場景中，測(cè)試系統(tǒng)中的所有加速器都用于運(yùn)行單個(gè)模擬，基于 A100 Tensor Core GPU 的服務(wù)器提供的性能比備選方案高出 2.1 倍。

圖 3 NVIDIA A100 four- GPU 性能比較

在計(jì)算性能不斷進(jìn)步的推動(dòng)下，分子動(dòng)力學(xué)領(lǐng)域正朝著在更長的模擬時(shí)間內(nèi)模擬更大的原子系統(tǒng)的方向發(fā)展。這些進(jìn)展使研究人員能夠模擬越來越多的生化機(jī)制，如光合電子傳遞和視覺信號(hào)轉(zhuǎn)導(dǎo)。這些和其他過程長期以來一直是科學(xué)辯論的主題，因?yàn)樗鼈円呀?jīng)超出了模擬的范圍，模擬是驗(yàn)證的主要工具。這是由于完成模擬所需的時(shí)間過長。

然而，我們認(rèn)識(shí)到，并非所有這些應(yīng)用程序的用戶在每次模擬時(shí)都使用多個(gè) GPU 來運(yùn)行它們。為了獲得最佳吞吐量，最佳執(zhí)行方法通常是為每個(gè)模擬分配一個(gè) GPU 。

當(dāng)在 NVIDIA A100上的單個(gè)加速器模塊上運(yùn)行這些相同的應(yīng)用程序時(shí)，基于 NVIDIA A100的系統(tǒng)的性能提高了1.9倍。

圖 4 NVIDIA A100 單 – GPU 性能比較

能源成本占數(shù)據(jù)中心和超級(jí)計(jì)算中心總體擁有成本（ TCO ）的很大一部分，這突出了節(jié)能計(jì)算平臺(tái)的重要性。我們的測(cè)試表明， NVIDIA 平臺(tái)提供的每瓦吞吐量比其他產(chǎn)品高出 2.8 倍。

圖 5 NVIDIA A100 能效比較

顯示 A100 與 MI250 的效率比– NVIDIA 的效率越高越好。對(duì)每個(gè)應(yīng)用程序的多個(gè)數(shù)據(jù)集（不同）進(jìn)行 Geomean 。效率是指 GPU 使用 NVIDIA SMI 和 ROCm 中的等效功能測(cè)量的性能/功耗（瓦特）|

AMD MI250 在千兆字節(jié) M262-HD5-00 上測(cè)量，具有（ 2 ）個(gè) AMD EPYC 7763 和 4 個(gè) AMD Instinct ? MI250 OAM （ 128 GB HBM2e ） 500W GPU 帶 AMD Infinity 結(jié)構(gòu)? 技術(shù) NVIDIA 在 ProLiant XL645d Gen10 Plus 上運(yùn)行，使用雙 EPYC 7713 CPU 和 4x A100 （ 80 GB ） SXM4

LAMMPS develop \ u db00b49 （ AMD ） develop \ u 2a35ec2 （ NVIDIA ）數(shù)據(jù)集 ReaxFF / c 、 Tersoff 、 Leonard Jones 、 SNAP | NAMD 3.0alpha9 數(shù)據(jù)集 STMV \ u NVE | OpenMM 7.7.0 數(shù)據(jù)集的集成運(yùn)行： amber20 STMV 、 amber20 Cellular 、 apoa1pme 、 pme |

GROMACS 2021.1 （ AMD ） 2022 （ NVIDIA ）數(shù)據(jù)集 ADH-Dodec （氫鍵）， STMV （氫鍵）|琥珀色 20 。 xx \ U rocm \ U mr \ U 202108 （ AMD ）和 20.12-AT \ U 21.12 （ NVIDIA ）數(shù)據(jù)集 Cellular \ u NVE 、 STMV \ u NVE | 1x MI250 有 2x GCD

NVIDIA A100 GPU 卓越的性能和電源效率是多年不懈的軟硬件協(xié)同優(yōu)化的結(jié)果，以最大限度地提高應(yīng)用程序性能和效率。

A100 還以單處理器的形式出現(xiàn)在操作系統(tǒng)中，只需要啟動(dòng)一個(gè) MPI 列即可充分利用其性能。而且，由于節(jié)點(diǎn)中所有 GPU 之間的 600 GB / s NVLink 連接， A100 在規(guī)模上提供了優(yōu)異的性能。

AI 和 HPC 融合

正如加速計(jì)算為建模和仿真應(yīng)用帶來了數(shù)倍的加速一樣， AI 和 HPC 的結(jié)合將帶來性能的下一步功能提升，開啟下一波科學(xué)發(fā)現(xiàn)。

關(guān)于作者

Ashraf Eassa 是NVIDIA 加速計(jì)算集團(tuán)內(nèi)部的高級(jí)產(chǎn)品營銷經(jīng)理。

Chris 是 NVIDIA HPC 和 AI 的高級(jí)技術(shù)營銷經(jīng)理。此前，他在 IBM 擔(dān)任聚合 HPC 和 AI 的產(chǎn)品經(jīng)理，將 HPC 、 AI 和優(yōu)化產(chǎn)品推向市場，專注于電子設(shè)計(jì)、航空航天和汽車行業(yè)。 Chris 擁有航空工程碩士學(xué)位，專注于設(shè)計(jì)優(yōu)化。

審核編輯：郭婷

聲明：本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人，不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用，如有內(nèi)容侵權(quán)或者其他違規(guī)問題，請(qǐng)聯(lián)系本站處理。舉報(bào)投訴

電源

電源

+關(guān)注

關(guān)注
185

文章
18890

瀏覽量
263913
處理器

處理器

+關(guān)注

關(guān)注
68

文章
20282

瀏覽量
253151
NVIDIA

NVIDIA

+關(guān)注

關(guān)注
14

文章
5644

瀏覽量
109921

91欧美超碰AV自拍|国产成年人性爱视频免费看|亚洲日韩欧美一厂二区入|人人看人人爽人人操aV|丝袜美腿视频一区二区在线看|人人操人人爽人人爱|婷婷五月天超碰|97色色欧美亚州A√|另类A√无码精品一级av|欧美特级日韩特级

搜索歷史

通過全棧創(chuàng)新推動(dòng)高性能計(jì)算

評(píng)論