91欧美超碰AV自拍|国产成年人性爱视频免费看|亚洲 日韩 欧美一厂二区入|人人看人人爽人人操aV|丝袜美腿视频一区二区在线看|人人操人人爽人人爱|婷婷五月天超碰|97色色欧美亚州A√|另类A√无码精品一级av|欧美特级日韩特级

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線(xiàn)課程
  • 觀看技術(shù)視頻
  • 寫(xiě)文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

探究GDDR6給FPGA帶來(lái)的大帶寬存儲(chǔ)優(yōu)勢(shì)以及性能測(cè)試(上)

Achronix ? 來(lái)源:Achronix ? 作者:黃侖 ? 2021-12-03 11:31 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

1.概述

隨著互聯(lián)網(wǎng)時(shí)代的到來(lái),人類(lèi)所產(chǎn)生的數(shù)據(jù)發(fā)生了前所未有的、爆炸性的增長(zhǎng)。IDC預(yù)測(cè),全球數(shù)據(jù)總量將從2019年的45ZB增長(zhǎng)到2025年的175ZB[1]。同時(shí),全球數(shù)據(jù)中近30%將需要實(shí)時(shí)處理,因而帶來(lái)了對(duì)FPGA等硬件數(shù)據(jù)處理加速器的需求。如圖1所示。

在這樣的數(shù)據(jù)高速增長(zhǎng)的情況下,用于傳輸數(shù)據(jù)的網(wǎng)絡(luò)帶寬和處理數(shù)據(jù)所需要的算力也必須急速增長(zhǎng)。傳統(tǒng)的CPU已經(jīng)越來(lái)越不堪重負(fù),所以用硬件加速來(lái)減輕CPU的負(fù)擔(dān)是滿(mǎn)足未來(lái)性能需求的重要發(fā)展方向。未來(lái)的硬件發(fā)展需求對(duì)于用于加速的硬件平臺(tái)提出了越來(lái)越高的要求,可以概括為三個(gè)方面:算力、數(shù)據(jù)傳輸帶寬和存儲(chǔ)器帶寬。Achronix的新一代采用臺(tái)積電7nm工藝的Speedster 7t FPGA芯片根據(jù)未來(lái)硬件加速和網(wǎng)絡(luò)加速的需求,在這三個(gè)方面都做了優(yōu)化,消除了傳統(tǒng)FPGA的瓶頸。下面我們重點(diǎn)說(shuō)一說(shuō)為了提高存儲(chǔ)器帶寬,Achronix通過(guò)采用硬核GDDR6控制器所帶來(lái)的優(yōu)勢(shì)。2.

GDDR6的發(fā)展

在GDDR的設(shè)計(jì)之初,其定位是針對(duì)圖形顯示卡所特別優(yōu)化的一種DDR內(nèi)存。因?yàn)?000年后電腦游戲特別是3D游戲的發(fā)展和火爆,使運(yùn)行電腦游戲的顯卡需要有大量的高速圖像數(shù)據(jù)交互需求,GDDR在這種情況下應(yīng)運(yùn)而生。第一個(gè)GDDR標(biāo)準(zhǔn)是基于DDR的GDDR2,隨后發(fā)展到了基于DDR3的GDDR5,在一段時(shí)間中非常流行。

2016年,GDDR5X正式發(fā)布,它引入了具有16n預(yù)取的四倍數(shù)據(jù)速率模式,但代價(jià)是訪(fǎng)問(wèn)粒度從GDDR5的32Byte提高到了64Byte。2018年,GDDR6發(fā)布,數(shù)據(jù)速率達(dá)到了16Gbps,帶寬幾乎是GDDR5X的兩倍,同時(shí)采用了雙通道設(shè)計(jì),訪(fǎng)問(wèn)粒度和GDDR5一樣是32Byte。

3.GDDR6和DDR4/5的比較

GDDR一直以來(lái)是針對(duì)圖形顯示卡所優(yōu)化的一種DDR內(nèi)存。因?yàn)轱@卡處理圖像數(shù)據(jù),特別是3D圖像數(shù)據(jù)對(duì)顯存帶寬的要求更高,GPU和GDDR之間的數(shù)據(jù)交換非常頻繁。而DDR內(nèi)存專(zhuān)注于與CPU進(jìn)行數(shù)據(jù)交換的效率,因此對(duì)于整體存取性能、低延遲更為看重,所以在CPU和傳統(tǒng)的FPGA中基本都是用DDR4。

隨著硬件加速需求對(duì)于存儲(chǔ)器的帶寬提出了越來(lái)越高的要求,傳統(tǒng)的DDR4帶寬顯然已經(jīng)無(wú)法滿(mǎn)足要求,Achronix看重了GDDR6在數(shù)據(jù)存儲(chǔ)中的帶寬優(yōu)勢(shì),創(chuàng)新地將GDDR6引入到了FPGA,徹底解決了傳統(tǒng)FPGA存儲(chǔ)帶寬不夠的瓶頸。2020年7月15日,JEDEC存儲(chǔ)協(xié)會(huì)正式發(fā)布了DDR5 SDRAM的標(biāo)準(zhǔn)(JESD79-5),內(nèi)存的頻率相對(duì)DDR4的標(biāo)準(zhǔn)頻率有了大幅的提升,總傳輸帶寬也提升了38%,但是還是和GDDR6的帶寬有一定的差距。GDDR6和DDR4/5的帶寬對(duì)比。

473c6de8-52b8-11ec-b2e9-dac502259ad0.png

圖2 GDDR與DDR帶寬發(fā)展對(duì)比

如果實(shí)現(xiàn)同一個(gè)大帶寬存儲(chǔ)的應(yīng)用,在提供相同的存儲(chǔ)器帶寬的情況下,無(wú)論在設(shè)計(jì)復(fù)雜度,PCB占用面積,還是在功耗方面,與DDR4相比,GDDR6的性能都有很大的提高,如圖3所示[2]。

476b1eae-52b8-11ec-b2e9-dac502259ad0.png

圖3 GDDR6和DDR4性能對(duì)比4.

GDDR6和HBM2的比較

HBM全稱(chēng)High Bandwidth Memory,最初的標(biāo)準(zhǔn)是由JEDEC在2013年發(fā)布。2016年1月,HBM的第二代HBM2正式成為工業(yè)標(biāo)準(zhǔn)。HBM的出現(xiàn)也是為了解決存儲(chǔ)器帶寬問(wèn)題。與GDDR6不同的是,HBM內(nèi)存一般是由4個(gè)或者8個(gè)HBM的Die堆疊形成,我們稱(chēng)之為一個(gè)Stack。如圖4所示[4]。

4793243a-52b8-11ec-b2e9-dac502259ad0.png

圖4 HBM Die的堆疊

我們以市面上帶有HBM2的高端 FPGA為例,這個(gè)系列的FPGA集成了1~2個(gè)這樣的HBM2 Stack。兩個(gè)Stack之間是相互獨(dú)立的,各自有自己的地址空間。

每個(gè)Die都有獨(dú)立的兩個(gè)128bit的Channel,所以4個(gè)Die 8個(gè)通道就是1024bit的位寬,HBM2的頻率是900MHz,按DDR的方式訪(fǎng)問(wèn),一個(gè)Stack總共帶寬是 900(MHz)x 2(DDR)x 1024(位寬)/8 = 230GB/s,兩個(gè)Stack最高可以到460GB/s的帶寬。

Achronix的Speedster 7t FPGA集成了8個(gè)GDDR6的硬核,每個(gè)GDDR6的硬核支持雙通道??偟膸捠?16Gbps x 16(位寬)x 2(通道)x 8(控制器)/8 = 512 GB/s,略高于帶HBM2的FPGA存儲(chǔ)器帶寬。

從成本上來(lái)看,目前GDDR6與HBM2相比有著很大的優(yōu)勢(shì),HBM2技術(shù)工藝要求高,目前芯片的良率和產(chǎn)量都會(huì)受到很大的影響。同時(shí)GDDR6使用起來(lái)更靈活,使用片外的DRAM,可以根據(jù)應(yīng)用要求,選擇不同速率,不同容量的GDDR6顆粒。HBM2的優(yōu)勢(shì)在于集成度高,不占用PCB板的面積。圖5是DDR4、GDDR6和HBM2在成本上的一個(gè)綜合比較。

編輯:jq

聲明:本文內(nèi)容及配圖由入駐作者撰寫(xiě)或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問(wèn)題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • FPGA
    +關(guān)注

    關(guān)注

    1660

    文章

    22411

    瀏覽量

    636273
  • 存儲(chǔ)器
    +關(guān)注

    關(guān)注

    39

    文章

    7738

    瀏覽量

    171660
  • 帶寬
    +關(guān)注

    關(guān)注

    3

    文章

    1040

    瀏覽量

    43359
  • HBM
    HBM
    +關(guān)注

    關(guān)注

    2

    文章

    431

    瀏覽量

    15831

原文標(biāo)題:GDDR6給FPGA帶來(lái)的大帶寬存儲(chǔ)優(yōu)勢(shì)以及性能測(cè)試(上)

文章出處:【微信號(hào):Achronix,微信公眾號(hào):Achronix】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評(píng)論

    相關(guān)推薦
    熱點(diǎn)推薦

    AMD 推出第二代 Kintex UltraScale+ 中端FPGA,助力智能高性能系統(tǒng)

    · 新款FPGA 可為下一代醫(yī)療、工業(yè)、測(cè)試與測(cè)量以及廣播系統(tǒng)提供高帶寬、實(shí)時(shí)性能與廣泛連接。 · 借助成熟的工具、先進(jìn)的安全特性
    的頭像 發(fā)表于 02-04 16:11 ?5w次閱讀
    AMD 推出第二代 Kintex UltraScale+ 中端<b class='flag-5'>FPGA</b>,助力智能高<b class='flag-5'>性能</b>系統(tǒng)

    性能測(cè)試調(diào)優(yōu)實(shí)戰(zhàn)與探索(存儲(chǔ)模型優(yōu)化+調(diào)用鏈路分析)

    分析、流量分析、壓測(cè)實(shí)施和剖解調(diào)優(yōu)等主要環(huán)節(jié)中,引發(fā)對(duì)于系統(tǒng)能力底盤(pán)夯實(shí)和測(cè)試策略改進(jìn)的諸多思考。 在性能測(cè)試階段,剖析系統(tǒng)能力實(shí)現(xiàn)及調(diào)優(yōu)方案,探索更優(yōu)解及性能
    的頭像 發(fā)表于 01-12 14:46 ?1443次閱讀
    <b class='flag-5'>性能</b><b class='flag-5'>測(cè)試</b>調(diào)優(yōu)實(shí)戰(zhàn)與探索(<b class='flag-5'>存儲(chǔ)</b>模型優(yōu)化+調(diào)用鏈路分析)

    性能網(wǎng)絡(luò)存儲(chǔ)設(shè)計(jì):NVMe-oF IP的實(shí)現(xiàn)探討

    ,給出如何測(cè)試,以及結(jié)果。 https://www.bilibili.com/video/BV1f6mbBeEiH/?spm_id_from=333.337.search-card.all.click&vd_source
    發(fā)表于 12-19 18:45

    昆侖芯R200 AI加速卡技術(shù)規(guī)格解析

    昆侖芯R200加速卡基于7nm XPU-R架構(gòu),在150W功耗下提供256 TOPS INT8算力,側(cè)重高性能推理。配備最高32GB GDDR6內(nèi)存(512GB/s帶寬)及108路視頻解碼能力,支持
    的頭像 發(fā)表于 12-14 13:12 ?1591次閱讀
    昆侖芯R200 AI加速卡技術(shù)規(guī)格解析

    CW32L010F8P600的優(yōu)勢(shì)

    48MHz的ARM?Cortex?-M0+內(nèi)核。 集成高精度模擬數(shù)字轉(zhuǎn)換器(ADC):支持最多16+1路I/O接口。 ,CW32L010F8P600在存儲(chǔ)容量、安全性、功耗控制、定時(shí)器設(shè)計(jì)、LatchUp測(cè)試成績(jī)、ESD防護(hù)、性能
    發(fā)表于 11-13 07:07

    如何利用Verilog HDL在FPGA實(shí)現(xiàn)SRAM的讀寫(xiě)測(cè)試

    本篇將詳細(xì)介紹如何利用Verilog HDL在FPGA實(shí)現(xiàn)SRAM的讀寫(xiě)測(cè)試。SRAM是一種非易失性存儲(chǔ)器,具有高速讀取和寫(xiě)入的特點(diǎn)。在FPGA
    的頭像 發(fā)表于 10-22 17:21 ?4345次閱讀
    如何利用Verilog HDL在<b class='flag-5'>FPGA</b><b class='flag-5'>上</b>實(shí)現(xiàn)SRAM的讀寫(xiě)<b class='flag-5'>測(cè)試</b>

    FPGA測(cè)試DDR帶寬跑不滿(mǎn)的常見(jiàn)原因及分析方法

    FPGA測(cè)試 DDR 帶寬時(shí),帶寬無(wú)法跑滿(mǎn)是常見(jiàn)問(wèn)題。下面我將從架構(gòu)、時(shí)序、訪(fǎng)問(wèn)模式、工具限制等多個(gè)維度,系統(tǒng)梳理導(dǎo)致 DDR 帶寬
    的頭像 發(fā)表于 10-15 10:17 ?1031次閱讀

    【上海晶珩睿莓1開(kāi)發(fā)板試用體驗(yàn)】5、網(wǎng)絡(luò)性能測(cè)試

    定的結(jié)果、JSON 輸出(便于腳本化)以及更好的單次測(cè)試控制。 主要用途: 測(cè)量點(diǎn)對(duì)點(diǎn)帶寬(客戶(hù)端 ? 服務(wù)端) 測(cè)試不同協(xié)議(TCP/UDP)的吞吐量與丟包情況 驗(yàn)證鏈路質(zhì)量、MTU
    發(fā)表于 08-19 10:25

    電極阻抗測(cè)試儀精度0.1%怎么選?行業(yè)工程師避坑指南

    :Bamtone班通的TDR阻抗測(cè)試儀基于時(shí)域反射原理設(shè)計(jì),具有高帶寬特性,適用于PCB硬板、FPC軟板阻抗條快速測(cè)試,以及高頻電纜、雙絞線(xiàn)、電線(xiàn)電纜的阻抗
    發(fā)表于 07-28 10:13

    PCIe協(xié)議分析儀能測(cè)試哪些設(shè)備?

    場(chǎng)景:監(jiān)測(cè)GPU與主機(jī)之間的PCIe通信,分析數(shù)據(jù)傳輸效率、延遲和帶寬利用率。 應(yīng)用價(jià)值:優(yōu)化大規(guī)模AI訓(xùn)練任務(wù)的數(shù)據(jù)加載和模型參數(shù)同步,例如在多GPU系統(tǒng)中測(cè)試PCIe交換機(jī)的性能和穩(wěn)定性。
    發(fā)表于 07-25 14:09

    簡(jiǎn)單認(rèn)識(shí)高帶寬存儲(chǔ)

    HBM(High Bandwidth Memory)即高帶寬存儲(chǔ)器,是一種基于 3D 堆疊技術(shù)的高性能 DRAM(動(dòng)態(tài)隨機(jī)存取存儲(chǔ)器)。其核心設(shè)計(jì)是通過(guò)硅通孔(TSV)和微凸塊(Mic
    的頭像 發(fā)表于 07-18 14:30 ?4308次閱讀

    性能低功耗雙核Wi-Fi6+BLE5.3二合一

    功耗無(wú)線(xiàn)專(zhuān)業(yè)知識(shí),最大限度地發(fā)揮Wi-Fi和BLE在各種應(yīng)用中的超低功耗優(yōu)勢(shì)。作為一款支持BLE模式和Wi-Fi 6雙頻連接的模塊,它采用獨(dú)立天線(xiàn)設(shè)計(jì),互不干擾,為用戶(hù)提供了更加穩(wěn)定和可靠的無(wú)線(xiàn)連接性能
    發(fā)表于 06-28 21:42

    RDMA簡(jiǎn)介1之RDMA開(kāi)發(fā)必要性

    靈活性、高并行能力及可高度定制化的特點(diǎn),能夠在各種應(yīng)用場(chǎng)景下實(shí)現(xiàn)高帶寬的數(shù)據(jù)采集、存儲(chǔ)及傳輸。然而FPGA并不擅長(zhǎng)進(jìn)行數(shù)據(jù)存儲(chǔ)工作,僅在內(nèi)部集成少量片
    發(fā)表于 06-03 14:38

    Altera Agilex 7 M系列FPGA正式量產(chǎn)出貨

    近日,全球 FPGA 創(chuàng)新技術(shù)領(lǐng)導(dǎo)者 Altera 宣布, Agilex 7 M 系列 FPGA 正式量產(chǎn)出貨,這是現(xiàn)階段業(yè)界領(lǐng)先的集成高帶寬存儲(chǔ)器,并支持 DDR5 和 LPDDR5
    的頭像 發(fā)表于 04-10 11:00 ?1433次閱讀

    HBM新技術(shù),橫空出世:引領(lǐng)內(nèi)存芯片創(chuàng)新的新篇章

    隨著人工智能、高性能計(jì)算(HPC)以及數(shù)據(jù)中心等領(lǐng)域的快速發(fā)展,對(duì)內(nèi)存帶寬和容量的需求日益增長(zhǎng)。傳統(tǒng)的內(nèi)存技術(shù),如DDR和GDDR,已逐漸難以滿(mǎn)足這些新興應(yīng)用對(duì)高
    的頭像 發(fā)表于 03-22 10:14 ?4889次閱讀
    HBM新技術(shù),橫空出世:引領(lǐng)內(nèi)存芯片創(chuàng)新的新篇章