黄色电影免费在线观看无码,成人午夜免费大片

電子發(fā)燒友網(wǎng)報道（文/李彎彎）在近日的Hot Chips 2024大會上，英偉達公布了下一代GPU架構Blackwell的更多細節(jié)信息，以及未來的產品路線圖。

英偉達Blackwell是通用計算全棧矩陣的終極解決方案，由多個英偉達芯片組成，包括Blackwell GPU、Grace CPU、BlueField數(shù)據(jù)處理單元、ConnectX網(wǎng)絡接口卡、NVLink交換機、Spectrum以太網(wǎng)交換機和Quantum InfiniBand交換機。

英偉達稱，Blackwell擁有6項革命性技術，可支持多達10萬億參數(shù)的模型進行AI訓練和實時大語言模型(LLM)推理。

NVIDIA Blackwell 的技術特點

NVIDIA Blackwell 架構是NVIDIA于2024年3月在NVIDIA GTC大會上發(fā)布的全新架構，是NVIDIA繼Hopper架構之后推出的全新架構，旨在推動生成式AI和加速計算領域的發(fā)展。Blackwell架構擁有六項革命性技術，這些技術共同構成了其強大的計算能力和高效性。

一、它是全球最強大的芯片，擁有2080億個晶體管，這確保了芯片具有極高的計算能力和復雜性。它采用臺積電4納米工藝制造，提高了芯片的集成度，降低了功耗和發(fā)熱量。配備192GB的HBM3E顯存，極大提升了芯片的數(shù)據(jù)處理能力和效率。

第二代Transformer引擎，結合Blackwell Tensor Core技術和TensorRT-LLM及NeMo Megatron框架中的英偉達先進動態(tài)范圍管理算法，Blackwell通過新的4位浮點AI支持雙倍的計算和模型大小推理能力。

第五代NVLink，為每個GPU提供了突破性的1.8TB/s雙向吞吐量，確保最復雜LLM之間多達576個GPU之間的無縫高速通信。

四、RAS引擎，Blackwell支持的GPU包含一個專用引擎，實現(xiàn)可靠性、可用性和服務性。此外，Blackwell架構還增加了芯片級功能，利用基于AI的預防性維護進行診斷和預測可靠性問題，從而延長系統(tǒng)正常運行時間并提高大規(guī)模部署AI的彈性。

五、安全人工智能，先進的機密計算功能可在不影響性能的情況下保護AI模型和客戶數(shù)據(jù)，并支持新的本機接口加密協(xié)議，進一步增強了芯片的安全性。

六、解壓縮引擎，專用解壓縮引擎支持最新格式，加快數(shù)據(jù)庫查詢，提供數(shù)據(jù)分析和數(shù)據(jù)科學的最高性能。

生態(tài)系統(tǒng)方面，Blackwell不僅是系統(tǒng)的核心芯片，更是一個全新的平臺。它涵蓋了從CPU和GPU計算到用于互連的不同類型的網(wǎng)絡，是通用計算全棧矩陣的終極解決方案。

Blackwell架構將助推數(shù)據(jù)處理、工程模擬、電子設計自動化、計算機輔助藥物設計、量子計算和生成式AI等領域實現(xiàn)突破。

NVIDIA已經展示了基于Blackwell架構的GPU GB200 NVL72等產品，該產品專為萬億參數(shù)AI而設計，對大語言模型(LLM)推理性能提升高達30倍。隨著AI模型尺寸的增加，在多個GPU上拆分工作負載勢在必行。而Blackwell足夠強大，可以在一個GPU中處理專家模型。

相比Hopper架構的優(yōu)勢

NVIDIA Blackwell架構相比其上一個NVIDIA Hopper架構具有多方面的優(yōu)勢。NVIDIA Hopper架構是NVIDIA在2022年推出的GPU架構，該架構旨在取代之前的NVIDIA Ampere架構，并為新一代工作負載提供強大的加速計算平臺。

Hopper架構采用了先進的臺積電4N工藝制造，集成了超過800億個晶體管，這為高性能計算提供了堅實的基礎。

Hopper架構通過Transformer引擎推進了Tensor Core技術的發(fā)展，旨在加速AI模型訓練。Transformer引擎能夠應用混合的FP8和FP16精度，以大幅加速Transformer模型的AI計算。

與上一代相比，Hopper架構在TF32、FP64、FP16和INT8精度的每秒浮點運算（FLOPS）上提高了3倍。這種性能提升使得Hopper在處理大規(guī)模AI模型時更加高效。

Hopper架構引入了第四代NVLink技術，可通過NVIDIA DGX和HGX服務器擴展多GPU輸入和輸出（IO），每個GPU的雙向傳輸速率可達900GB/s，比PCIe 5.0的帶寬高7倍。

第三代NVIDIA NVSwitch支持SHARP網(wǎng)絡計算技術，打破了該技術只能通過InfiniBand提供的傳統(tǒng)限制。這使得Hopper架構在處理大規(guī)模HPC和AI工作負載時能夠實現(xiàn)更高的互連效率和通信帶寬。

相比較而言，晶體管數(shù)量與計算能力方面，Blackwell架構GPU擁有2080億個晶體管，比Hopper架構的GPU多出顯著數(shù)量，這直接提升了其計算能力。

Blackwell架構的單個芯片計算能力達到了20 petaFLOPS，這使其在處理大規(guī)模AI模型時具有更高的實時性能和效率。

內存與帶寬方面，Blackwell架構配備了更大的HBM3e內存（如192GB）和更高的顯存帶寬（如8TB/s），相比Hopper架構，這進一步增強了數(shù)據(jù)處理和傳輸?shù)乃俣取?br />
寫在最后

NVIDIA Blackwell架構相比其上一個架構在性能、計算能力、技術創(chuàng)新、特性增強以及生態(tài)系統(tǒng)與應用拓展等方面均具有顯著優(yōu)勢。應用方面，Blackwell架構將助推數(shù)據(jù)處理、工程模擬、電子設計自動化、計算機輔助藥物設計、量子計算和生成式AI等領域實現(xiàn)突破。

聲明：本文內容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權轉載。文章觀點僅代表作者本人，不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學習之用，如有內容侵權或者其他違規(guī)問題，請聯(lián)系本站處理。舉報投訴

gpu

gpu

+關注

關注
28

文章
5196

瀏覽量
135519
AI

AI

+關注

關注
91

文章
39866

瀏覽量
301524
英偉達

英偉達

+關注

關注
23

文章
4090

瀏覽量
99237

91欧美超碰AV自拍|国产成年人性爱视频免费看|亚洲日韩欧美一厂二区入|人人看人人爽人人操aV|丝袜美腿视频一区二区在线看|人人操人人爽人人爱|婷婷五月天超碰|97色色欧美亚州A√|另类A√无码精品一级av|欧美特级日韩特级

搜索歷史

英偉達Blackwell可支持10萬億參數(shù)模型AI訓練，實時大語言模型推理

評論

搜索歷史

英偉達Blackwell可支持10萬億參數(shù)模型AI訓練，實時大語言模型推理

評論

英偉達Blackwell可支持10萬億參數(shù)模型AI訓練，實時大語言模型推理