91欧美超碰AV自拍|国产成年人性爱视频免费看|亚洲 日韩 欧美一厂二区入|人人看人人爽人人操aV|丝袜美腿视频一区二区在线看|人人操人人爽人人爱|婷婷五月天超碰|97色色欧美亚州A√|另类A√无码精品一级av|欧美特级日韩特级

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內(nèi)不再提示

NVIDIA Blackwell白皮書:NVIDIA Blackwell Architecture Technical Brief

向上 ? 2025-03-20 18:35 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

NVIDIA Blackwell 架構為生成式 AI加速計算帶來的突破性進步。Blackwell 基于多代** NVIDIA 技術構建,以出眾的性能、效率和規(guī)模揭開了生成式 AI 領域的新篇章。

NVIDIA Blackwell Architecture Technical Brief免費下載
*附件:NVIDIA Blackwell Architecture Technical Brief.doc

新型 AI 超級芯片

Blackwell 架構 GPU 具有 2080 億個晶體管,采用專門定制的臺積電 4NP 工藝制造。所有 Blackwell 產(chǎn)品均采用雙倍光刻極限尺寸的裸片,通過 10 TB/s 的片間互聯(lián)技術連接成一塊統(tǒng)一的 GPU。

第二代 Transformer 引擎

第二代 Transformer 引擎將定制的 Blackwell Tensor Core技術與 NVIDIA? TensorRT? -LLM 和 NeMo? 框架創(chuàng)新相結合,加速大語言模型 (LLM) 和專家混合模型 (MoE) 的推理和訓練。

為了強效助力 MoE 模型的推理 Blackwell Tensor Core增加了新的精度 (包括新的社區(qū)定義的微縮放格式),可提供較高的準確性并輕松替換更大的精度。Blackwell Transformer 引擎利用稱為微張量縮放的細粒度縮放技術,優(yōu)化性能和準確性,支持 4 位浮點 (FP4) AI。這將內(nèi)存可以支持的新一代模型的性能和大小翻倍,同時保持高精度。

安全 AI

Blackwell 內(nèi)置 NVIDIA 機密計算技術,可通過基于硬件的強大安全性保護敏感數(shù)據(jù)和 AI 模型,使其免遭未經(jīng)授權的訪問。Blackwell 是業(yè)內(nèi)首款具備可信執(zhí)行環(huán)境 (TEE) I/O 功能的 GPU,它不僅能夠與具備 TEE-I/O 功能的主機一同提供性能卓越的機密計算解決方案,還能通過 NVIDIA? NVLink? 技術提供實時保護。與未加密模式相比, Blackwell 機密計算功能供了幾乎相同的吞吐量性能。現(xiàn)在,除了保護 AI 知識產(chǎn)權 (IP) 和安全地實現(xiàn)機密 AI 訓練、推理和聯(lián)邦學習,企業(yè)甚至還能以高性能的方式保護最大的模型。

NVLink、NVSwitch 和 NVLink Switch 系統(tǒng)

是否能釋放百億億級計算和萬億參數(shù) AI 模型的全部潛力取決于服務器集群中每個 GPU 之間能否快速、順暢的通信。第五代 NVIDIA? NVLink? 可擴展至 576 個 GPU,為萬億和數(shù)萬億參數(shù) AI 模型釋放加速性能。

NVIDIA NVLink 交換機芯片可在一個有 72 個 GPU 的 NVLink 域 (NVL72) 中實現(xiàn) 130TB/s 的 GPU 帶寬,并通過 NVIDIA SHARP? 技術對 FP8 的支持實現(xiàn) 4 倍于原來的帶寬效率。NVIDIA NVLink 交換機芯片能以驚人的 1.8TB/s 互連速度為多服務器集群提供支持。采用 NVLink 的多服務器集群可以在計算量增加的情況下同步擴展 GPU 通信,因此 NVL72 可支持的 GPU 吞吐量是單個 8 卡 GPU 系統(tǒng)的 9 倍。

解壓縮引擎

過去,數(shù)據(jù)分析和數(shù)據(jù)庫工作流依賴 CPU 進行計算。加速數(shù)據(jù)科學可以顯著提高端到端分析性能,加速價值創(chuàng)造,同時降低成本。Apache Spark 等數(shù)據(jù)庫在接手、處理和分析大量數(shù)據(jù)等數(shù)據(jù)分析工作上發(fā)揮著關鍵作用。

Blackwell 擁有的解壓縮引擎以及通過 900GB/s 雙向帶寬的高速鏈路訪問 NVIDIA Grace? CPU 中大量內(nèi)存的能力,可加速整個數(shù)據(jù)庫查詢工作流,從而在數(shù)據(jù)分析和數(shù)據(jù)科學方面實現(xiàn)更高性能。Blackwell 支持 LZ4、Snappy 和 Deflate 等最新壓縮格式。

可靠性、可用性和可服務性 (RAS) 引擎

Blackwell 通過專用的可靠性、可用性和可服務性 (RAS) 引擎增加了智能恢復能力,以識別早期可能發(fā)生的潛在故障,從而更大限度地減少停機時間。NVIDIA AI 驅動的預測管理功能持續(xù)監(jiān)控硬件和軟件中數(shù)千個數(shù)據(jù)點的整體運行狀況,以預測和攔截停機時間和低效的來源。這建立了智能可靠性技術,節(jié)省時間、能源和計算成本。

NVIDIA 的 RAS 引擎提供深入的診斷信息,可以識別關注領域并制定維護計劃。RAS 引擎通過快速定位問題來源縮短周轉時間,并通過促進有效的補救最大限度地減少停機時間。

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權轉載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學習之用,如有內(nèi)容侵權或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • NVIDIA
    +關注

    關注

    14

    文章

    5597

    瀏覽量

    109793
收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關推薦
    熱點推薦

    NVIDIA RTX PRO 2000 Blackwell GPU性能測試

    越來越多的應用正在使用 AI 加速,而無論工作站的大小或形態(tài)如何,都有越來越多的用戶需要 AI 性能。NVIDIA RTX PRO 2000 Blackwell 是全新 NVIDIA
    的頭像 發(fā)表于 11-28 09:39 ?6342次閱讀
    <b class='flag-5'>NVIDIA</b> RTX PRO 2000 <b class='flag-5'>Blackwell</b> GPU性能測試

    進一步解讀英偉達 Blackwell 架構、NVlink及GB200 超級芯片

    能比上一代NVIDIA Hopper?提高了15倍。采用第二代Transformer引擎、定制的Blackwell Tensor Core技術、TensorRT?-LLM和Nemo?框架的創(chuàng)新,顯著加速了
    發(fā)表于 05-13 17:16

    jAVA語言環(huán)境白皮書

    jAVA語言環(huán)境白皮書The Java Language Environment (A White Paper)1. Introduction to Java
    發(fā)表于 10-14 17:35

    ZigBee白皮書

    ZigBee白皮書
    發(fā)表于 08-20 09:50

    簡儀科技怒對LabVIEW的白皮書

    本帖最后由 niezidong 于 2017-8-23 20:43 編輯 簡儀科技最近搞的開源平臺跟NI是針鋒相對啊。近期的宣傳都帶火藥味,還出了一本白皮書。見附件。這白皮書就差直接說搞LabVIEW沒前途了。各位對此有何高見?
    發(fā)表于 08-11 15:55

    NVIDIA 推出 Blackwell 架構 DGX SuperPOD,適用于萬億參數(shù)級的生成式 AI 超級計算

    基于先進的 NVIDIA 網(wǎng)絡、NVIDIA 全棧 AI 軟件和存儲技術,可將集群中 Grace Blackwell 超級芯片的數(shù)量擴展至數(shù)萬個,通過 NVIDIA NVLink可將多
    發(fā)表于 03-19 10:56 ?1198次閱讀
    <b class='flag-5'>NVIDIA</b> 推出 <b class='flag-5'>Blackwell</b> 架構 DGX SuperPOD,適用于萬億參數(shù)級的生成式 AI 超級計算

    NVIDIA推出搭載GB200 Grace Blackwell超級芯片的NVIDIA DGX SuperPOD?

    NVIDIA 于太平洋時間 3 月 18 日發(fā)布新一代 AI 超級計算機 —— 搭載 NVIDIA GB200 Grace Blackwell 超級芯片的 NVIDIA DGX Sup
    的頭像 發(fā)表于 03-21 09:49 ?2078次閱讀

    NVIDIA未來1年的Blackwell訂單已全部售罄

    10月12日資訊顯示,Blackwell無疑已成為NVIDIA歷史上極為成功的產(chǎn)品典范,其市場需求量已攀升至前所未有的高峰。   憑借在全球AI算力領域的領先地位,Blackwell吸引了微軟、Meta、Oracle、Op
    的頭像 發(fā)表于 10-12 16:20 ?1589次閱讀

    NVIDIA向開放計算項目捐贈Blackwell平臺設計

    近日,在美國加利福尼亞州舉行的 OCP 全球峰會上,NVIDIA 宣布已把 NVIDIA Blackwell 加速計算平臺的一些基礎元素捐贈給開放計算項目(OCP),并擴大 NVIDIA
    的頭像 發(fā)表于 11-19 15:30 ?2116次閱讀

    英偉達GTC25亮點:NVIDIA Blackwell Ultra 開啟 AI 推理新時代

    英偉達GTC25亮點:NVIDIA Blackwell Ultra 開啟 AI 推理新時代
    的頭像 發(fā)表于 03-20 15:35 ?1570次閱讀

    NVIDIA Blackwell數(shù)據(jù)手冊與NVIDIA Blackwell架構技術解析

    NVIDIA Blackwell數(shù)據(jù)手冊與NVIDIA Blackwell 架構技術解析
    的頭像 發(fā)表于 03-20 17:19 ?2484次閱讀

    NVIDIA RTX PRO 4500 Blackwell GPU測試分析

    今天我們帶來全新 NVIDIA Blackwell 架構 GPU —— NVIDIA RTX PRO 4500 Blackwell 的測試,對比上一代產(chǎn)品
    的頭像 發(fā)表于 08-28 11:02 ?4016次閱讀
    <b class='flag-5'>NVIDIA</b> RTX PRO 4500 <b class='flag-5'>Blackwell</b> GPU測試分析

    NVIDIA RTX PRO 5000 72GB Blackwell GPU現(xiàn)已全面上市

    NVIDIA RTX PRO 5000 72GB Blackwell GPU 現(xiàn)已全面上市,將基于 NVIDIA Blackwell 架構的強大代理式與生成式 AI 能力帶到更多桌面和
    的頭像 發(fā)表于 12-24 10:32 ?843次閱讀
    <b class='flag-5'>NVIDIA</b> RTX PRO 5000 72GB <b class='flag-5'>Blackwell</b> GPU現(xiàn)已全面上市

    NVIDIA RTX PRO 4000 Blackwell GPU性能測試

    作為 NVIDIA 專業(yè)顯卡產(chǎn)品線中單槽性能的巔峰之作,NVIDIA RTX PRO 4000 Blackwell 在各項核心指標上均實現(xiàn)對前代 NVIDIA RTX 4000 Ada
    的頭像 發(fā)表于 12-29 15:30 ?1396次閱讀
    <b class='flag-5'>NVIDIA</b> RTX PRO 4000 <b class='flag-5'>Blackwell</b> GPU性能測試

    NVIDIA RTX PRO 5000 Blackwell GPU的深度評測

    NVIDIA RTX PRO 5000 BlackwellNVIDIA RTX 5000 Ada Generation 的升級迭代產(chǎn)品,其各項核心指標均針對 GPU 加速工作流的高性能
    的頭像 發(fā)表于 01-06 09:51 ?2404次閱讀
    <b class='flag-5'>NVIDIA</b> RTX PRO 5000 <b class='flag-5'>Blackwell</b> GPU的深度評測