91欧美超碰AV自拍|国产成年人性爱视频免费看|亚洲 日韩 欧美一厂二区入|人人看人人爽人人操aV|丝袜美腿视频一区二区在线看|人人操人人爽人人爱|婷婷五月天超碰|97色色欧美亚州A√|另类A√无码精品一级av|欧美特级日韩特级

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

計算高速鏈路互連內存和GPU以實現高性能

星星科技指導員 ? 來源:嵌入式計算設計 ? 作者:Saumitra Jagdale ? 2022-10-24 16:29 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

隨著云計算技術的進步,數據中心的架構內存安排發(fā)生了重大變化。為了增強計算能力和廣泛的數據處理,需要集成擅長處理特定工作負載的加速器。雖然這些設備已經通過PCI Express連接,但計算快速鏈路可以進一步改善優(yōu)化,因為它允許對各種系統(tǒng)組件進行異構處理。

PCI Express是用于將主機處理器連接到加速器設備的最常見技術。它是一種高性能、行業(yè)標準的串行 I/O 接口,專為在企業(yè)、桌面和嵌入式應用中使用而開發(fā)。

同時,PCIe在具有大型共享內存池和大量需要高帶寬的設備的系統(tǒng)中存在局限性。由于每個 PCIe 層次結構都使用單個 64 位地址空間,因此 PCIe 未提供支持一致性的技術,并且無法充分維護單獨的內存池。此外,PCIe 鏈路具有太多的延遲,無法有效地管理系統(tǒng)中多個設備之間的共享內存。

因此,計算密集型工作負載需要與更快的數據流連接,以有效地擴展數據中心中的異構計算。計算高速鏈路 (CXL) 通過利用 PCI 高速 5.0 的物理和電氣接口來挑戰(zhàn)一些限制。這項新技術提高了內存容量和帶寬,并降低了延遲。它是高速通信的接口,因為加速器越來越多地用于補充CPU以支持新興應用。

什么是斷續(xù)器?

計算高速鏈路 (CXL) 是一種開放的行業(yè)標準內存互連。它旨在為當今數據中心中使用的許多類型的內存提供高性能連接,例如CPU,TPU,GPU和其他處理器類型。

CXL 利用 PCIe 5.0 的物理層基礎架構在主機和所有設備之間創(chuàng)建公共內存空間。緩存一致性標準可確保主機處理器和 CXL 設備在訪問數據時看到相同的數據。CPU 主機主要負責一致性管理,允許 CPU 和設備共享資源以獲得更高的性能并降低軟件堆棧的復雜性,從而降低設備總成本。

除了原始性能外,CXL還有其他優(yōu)勢。該技術是開源的,不像美光的3D Xpoint,這是迄今為止最接近高性能內存互連的方法。美光和英特爾現在正在對沖他們對CXL的賭注,而不是專有技術。NVIDIA 和 AMD 的硬件系統(tǒng)還使用 CXL 來互連內存和外部處理單元,以優(yōu)化性能。NVIDIA的GPU與CXL設計相結合,進行了如此廣泛的計算,并在內存設計中進行了一些更改。

這種轉變的最重要結果將是CXL消除專有內存互連。它是必不可少的,因為有幾種類型的企業(yè)存儲,每個處理器都通過專有連接訪問它們。這可能會使企業(yè)存儲基礎架構變得復雜,并且無法預測其性能。

現在,由于CXL,每個處理器都將能夠訪問所有類型的內存。這將允許單獨的處理器共享相同的內存池。它不僅對于數據中心至關重要,而且對于開發(fā)通常使用CPU,GPU和TPU的AI神經網絡和深度機器學習系統(tǒng)等技術也至關重要。

CXL 事務層協(xié)議

憑借與 PCIe 5.0 相似的帶寬,CXL 使用三種動態(tài)多路復用的事務層協(xié)議:CXL.io、CXL.緩存和 CXL.內存,以在 PCIe 上獲得優(yōu)勢。

CXL.io 協(xié)議幾乎與 PCIe 5.0 相同。它用于設備發(fā)現、配置、寄存器訪問、中斷、虛擬化和批量 DMA。

CXL.cache 是一種可選協(xié)議,用于定義主機和設備之間的交互。這允許連接的 CXL 設備使用請求和響應方法以極低的延遲高效緩存主機內存。

CXL.memory 是一種可選協(xié)議,它使用加載和存儲命令為主機處理器提供對加速器連接的內存的直接訪問。加速器連接的內存被 CPU、GPU 或 TPU 視為額外的地址空間,從而提高效率并降低延遲。

CXL 對存儲的影響

CXL依賴于存儲,并將對其產生影響。它將允許存儲系統(tǒng)使用更大的內存池進行緩存。該技術有利于使用內存作為緩存的存儲應用程序或系統(tǒng)。這一點至關重要,因為雖然許多ISP定期限制帶寬,但臨時數據存儲正在成為數據中心性能的關鍵方面。

商用存儲系統(tǒng)中目前可用的最大 DRAM 緩存為 3 TB。盡管使用 MemVerge 或福爾穆盧斯黑色,但特定的軟件定義存儲可以使用英特爾傲騰 PMem 將該緩存擴展到 4.5 TB。但是,這對除最富有的組織之外的所有組織的緩存內存施加了硬性限制。幸運的是,CXL 通過允許存儲軟件跨多個存儲介質緩存數據來解決此問題。

審核編輯:郭婷

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規(guī)問題,請聯系本站處理。 舉報投訴
  • 處理器
    +關注

    關注

    68

    文章

    20256

    瀏覽量

    252511
  • 云計算
    +關注

    關注

    39

    文章

    8022

    瀏覽量

    144470
  • 數據中心
    +關注

    關注

    18

    文章

    5654

    瀏覽量

    75041
收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關推薦
    熱點推薦

    如何正確選用Finisar AOC/DAC提升光互連性能

    在現代數據中心、高性能計算(HPC)以及企業(yè)網絡中,高速互連
    的頭像 發(fā)表于 03-02 09:53 ?137次閱讀
    如何正確選用Finisar AOC/DAC提升光<b class='flag-5'>互連</b><b class='flag-5'>性能</b>

    MAX4427:高性能高速MOSFET驅動器解析

    MAX4426/MAX4427/MAX4428:高性能高速MOSFET驅動器解析 一、引言 在電子設計領域,MOSFET驅動器扮演著至關重要的角色,它能夠將TTL/CMOS輸入信號轉換為高壓
    的頭像 發(fā)表于 02-05 14:10 ?636次閱讀

    LT1208高速運算放大器:高性能與多應用的完美結合

    LT1208/LT1209高速運算放大器:高性能與多應用的完美結合 在電子工程領域,高速運算放大器是實現許多高性能電路的關鍵組件。今天我們要
    的頭像 發(fā)表于 01-29 14:55 ?140次閱讀

    內存接口到PCIe/CXL、以太網及光互連,高速互連芯片市場分析

    黃晶晶 綜合整理 ? 高速互連芯片定義及分類高速互連芯片是支撐數據中心、服務器及計算實現
    的頭像 發(fā)表于 01-20 13:37 ?820次閱讀
    從<b class='flag-5'>內存</b>接口到PCIe/CXL、以太網及光<b class='flag-5'>互連</b>,<b class='flag-5'>高速</b><b class='flag-5'>互連</b>芯片市場分析

    國產高性能ONFI IP解決方案全解析

    1. 什么是ONFI IP?其在AI時代的作用是什么?ONFI (Open NAND Flash Interface) 是連接閃存控制器與NAND顆粒的關鍵高速接口協(xié)議。在AI和高性能計算(HPC
    發(fā)表于 01-13 16:15

    探索DS90CR486:高性能48位通道解串器的技術剖析與應用指南

    探索DS90CR486:高性能48位通道解串器的技術剖析與應用指南 在高速數據傳輸的領域中,DS90CR486作為一款133MHz、48位通道
    的頭像 發(fā)表于 12-30 11:05 ?424次閱讀

    SN65LVCP15:高速串行的理想選擇

    的SN65LVCP15,這是一款高性能的串行復用器,適用于光纖通道、千兆以太網和高清電視(HDTV)等高速接口應用。 文件下載: sn65lvcp15.pdf 特性亮點 多
    的頭像 發(fā)表于 12-25 14:30 ?290次閱讀

    Amphenol HD Express?:滿足PCIe? Gen 6需求的高性能互連系統(tǒng)

    Amphenol HD Express?:滿足PCIe? Gen 6需求的高性能互連系統(tǒng) 在當今高速發(fā)展的電子科技領域,對于高性能、高密度互連
    的頭像 發(fā)表于 12-11 14:10 ?383次閱讀

    為什么高速信號 = 芯片 + PCB + 極細同軸線束三者匹配?

    高速信號性能,不取決于單一環(huán)節(jié),而是“芯片 + PCB + 極細同軸線束”三者的整體匹配;芯片是信號的源,PCB 是高速通道,線束是關
    的頭像 發(fā)表于 11-03 18:48 ?1680次閱讀
    為什么<b class='flag-5'>高速</b>信號<b class='flag-5'>鏈</b><b class='flag-5'>路</b> = 芯片 + PCB + 極細同軸線束三者匹配?

    NVIDIA推出NVQLink高速互連架構

    NVIDIA 推出 NVIDIA NVQLink,這是一種開放式系統(tǒng)架構,可將 GPU 計算的極致性能與量子處理器緊密結合,構建加速的量子超級計算
    的頭像 發(fā)表于 11-03 14:53 ?738次閱讀

    TE品牌的高速可插拔I O互連產品性能如何?-赫聯電子

    ,從而實現長期成本降低,而無需完全重新設計便可提高性能。   TE的zSFP+互連產品符合SFF-8402的規(guī)定,已為光纖通道32G(28.05 Gbps線路速率)采用。整個產品系列
    發(fā)表于 10-16 11:22

    立訊技術高速裸線技術如何搶占高速互連賽道

    在AI算力爆發(fā)式增長的浪潮下,高速裸線正成為數據中心與服務器內部傳輸的命脈。當英偉達GB200超級芯片內置5000根NVLink銅纜,銅代光實現GPU
    的頭像 發(fā)表于 08-07 10:29 ?1428次閱讀
    立訊技術<b class='flag-5'>高速</b>裸線技術如何搶占<b class='flag-5'>高速</b><b class='flag-5'>互連</b>賽道

    PCIe協(xié)議分析儀能測試哪些設備?

    PCIe協(xié)議分析儀能測試多種依賴PCIe總線進行高速數據傳輸的設備,其測試范圍覆蓋計算、存儲、網絡及異構計算等多個領域,具體設備類型及測試場景如下:一、核心計算設備
    發(fā)表于 07-25 14:09

    【「算力芯片 | 高性能 CPU/GPU/NPU 微架構分析」閱讀體驗】+NVlink技術從應用到原理

    帶來了總雙向帶寬160GB/s的通訊速率,遠高于當時的PCIe接口(實際比現在的PCIe5.0也還要快)。首代的NVlink主要是增強了GPUGPU的通信性能GPU對系統(tǒng)
    發(fā)表于 06-18 19:31

    使用樹莓派構建 Slurm 高性能計算集群:分步指南!

    在這篇文章中,我將分享我嘗試使用樹莓派構建Slurm高性能計算集群的經歷。一段時間前,我開始使用這個集群作為測試平臺,來創(chuàng)建一個更大的、支持GPU計算
    的頭像 發(fā)表于 06-17 16:27 ?1753次閱讀
    使用樹莓派構建 Slurm <b class='flag-5'>高性能</b><b class='flag-5'>計算</b>集群:分步指南!