91欧美超碰AV自拍|国产成年人性爱视频免费看|亚洲 日韩 欧美一厂二区入|人人看人人爽人人操aV|丝袜美腿视频一区二区在线看|人人操人人爽人人爱|婷婷五月天超碰|97色色欧美亚州A√|另类A√无码精品一级av|欧美特级日韩特级

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

AMD全新GPU架構(gòu)解析 性能提升14%功耗降低23%

旺材芯片 ? 來源:yxw ? 2019-06-12 14:23 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

E3 2019游戲大會期間,AMD正式發(fā)布了基于7nm新工藝、Navi新核心、RDNA新架構(gòu)的新一代顯卡Radeon RX 5700系列,包括RX 5700 XT、RX 5700兩款型號,均面向規(guī)模最為龐大的甜點(diǎn)級市場和主流游戲玩家。

AMD發(fā)布的新一代RX 5700系列顯卡基于7nm新工藝和Navi新核心,而在底層是全新的RDNA架構(gòu),已經(jīng)走過七年半的GCN架構(gòu)就此揮手作別。

這些年來,很多用戶玩家尤其是A飯一直期待一個(gè)全新的GPU架構(gòu),但這種事兒的難度遠(yuǎn)超一般人想象,某種程度上設(shè)計(jì)一個(gè)新的GPU架構(gòu)甚至要比設(shè)計(jì)一個(gè)新的CPU架構(gòu)還要難。RDNA架構(gòu)就花費(fèi)了AMD研發(fā)團(tuán)隊(duì)長達(dá)四年的時(shí)間,凝聚了無數(shù)人的心血,也開啟了AMD顯卡歷史上第五代重大架構(gòu)的新時(shí)代。

2000年前,R100核心是A卡的第一代架構(gòu),用的還是固定單元設(shè)計(jì),3D幾何轉(zhuǎn)換和光照效果如今看起來都極為原始。

2001-2007年的R200-R500是第二代架構(gòu),簡單的VS紋理著色器、PS像素著色器分離式設(shè)計(jì),不同的只是比例不同,整個(gè)渲染流水線就像一個(gè)單通道的單行道。

2008-2011年的第三代TeraScale架構(gòu)(代表核心R600)實(shí)現(xiàn)了一個(gè)飛躍,VS、PS融合為統(tǒng)一著色器,也就是我們常說的流處理器,支持VLIW(超長指令字),然后就是2011-2019年的GCN架構(gòu)(代表核心Southern Islands),統(tǒng)一著色器加獨(dú)立的標(biāo)量、矢量單元,二者比例為1:4。

如今,迎來了全新的RDNA(Radeon DNA),還是統(tǒng)一著色器,但標(biāo)量和矢量單元走向融合,支持SIMT(單指令多線程) ILP(指令集并行),類似CPU處理器的SIMD(單指令多數(shù)據(jù)流),單線程性能和指令集執(zhí)行效率大大提升。

需要強(qiáng)調(diào)的是,RDNA是一個(gè)全方位重新設(shè)計(jì)的架構(gòu),并不是GCN的又一個(gè)升級版,也不是與GCN的混合體,只是集成了GCN架構(gòu)的指令以保持向下兼容,現(xiàn)有技術(shù)仍然可以在RDNA架構(gòu)上得到支持。

RDNA架構(gòu)將是AMD GPU顯卡未來多年的基石,接下來我們將看到采用7nm+工藝的第二代版本RDNA 2,看路線圖有望明年初和我們見面。

除了RDNA新架構(gòu),Navi核心還有7nm工藝、GDDR6顯存、PCIe 4.0總線、Radeon媒體引擎、Radeon顯示引擎等諸多全新特性。

Navi 10核心集成了103億個(gè)晶體管,相比Vega 64 125億個(gè)少了大約18%,而核心面積只有251平方毫米,相比Vega 64 495平方毫米更是小了足足一半,因此單位面積性能提升了足足1.3倍。

盡管晶體管更少、面積更小,Navi 10核心的性能相比于Vega 64卻提升了14%,同時(shí)功耗降低了23%,能效比因此大漲50%。

純架構(gòu)性能上,Navi相比于Vega在同等功耗、同等配置下提升多達(dá)50%,反應(yīng)到實(shí)際產(chǎn)品上,這貢獻(xiàn)了產(chǎn)品性能提升的60%左右,另外有大約25%來自7nm新工藝的加持,還有約15%來自頻率以及功耗的改進(jìn)。

AMD表示,RDNA架構(gòu)的設(shè)計(jì)理念主要有四個(gè)方面,性能上要滿足在現(xiàn)代游戲負(fù)載需求,能效上要充分優(yōu)化功耗和帶寬利用率,功能上要壯大生態(tài),擴(kuò)展性上要從移動到桌面到云端通吃。

為實(shí)現(xiàn)上述目標(biāo),RDNA架構(gòu)主要從三大方面進(jìn)行了變革,包括CU計(jì)算單元、緩存、流水線,接下來我們逐一和大家分享,但鑒于GPU架構(gòu)的技術(shù)性太強(qiáng),我們只是蜻蜓點(diǎn)水地大致看一下,最后還有AMD關(guān)于光線追蹤的規(guī)劃。

新的計(jì)算單元設(shè)計(jì)一共分為40組,每組2個(gè)標(biāo)量處理器、64個(gè)流處理器、4個(gè)64位雙線性過濾單元,總計(jì)80個(gè)、2560個(gè)、160個(gè),執(zhí)行延遲更低,單線程性能更強(qiáng),緩存效率更高,整體計(jì)算能效比GCN架構(gòu)有著巨大的提升,而且可適應(yīng)從游戲到計(jì)算各種負(fù)載。

多級緩存一致性可以帶來更低的延遲、更高的帶寬、更低的功耗,包括各處零級緩存、512KB一級緩存、4MB二級緩存。

整個(gè)圖形引擎也做了重新調(diào)整,更加順暢高效,包括幾何引擎、64個(gè)紋理單元、4個(gè)異步計(jì)算引擎(ACE),負(fù)載分配更加均衡,可以在更低的功耗下達(dá)成更高的頻率,能效更高。

CU計(jì)算單元方面,雖然看起來每一組還是64個(gè)流處理器,數(shù)量沒變,但這個(gè)數(shù)字是AMD反復(fù)設(shè)計(jì)后與處理資源最為平衡的的組合,同時(shí)整個(gè)計(jì)算單元的結(jié)構(gòu)進(jìn)行了徹底重組,和GCN時(shí)代完全不一樣了。

RDNA架構(gòu)下,每個(gè)CU計(jì)算單元的標(biāo)量解碼和發(fā)射單元、矢量解碼和發(fā)射單元、調(diào)度器的數(shù)量都增加了一倍來到兩個(gè),指令處理率因此也提升一倍。

同時(shí),四個(gè)SIM16矢量單元、四個(gè)SIMD4特殊功能單元變?yōu)閮蓚€(gè)SIMD32、兩個(gè)SIMD8,比如64個(gè)線程可組合為兩個(gè)Wave32,然后由兩個(gè)SIMD32執(zhí)行兩個(gè)Wave32,實(shí)現(xiàn)單時(shí)鐘周期指令發(fā)射(之前需要四個(gè)),SIMD ALU單元的利用率也從25%來到了100%,而且支持Wave32、Wave64兩種執(zhí)行模式,以應(yīng)對不同負(fù)載需求。

此外,為了強(qiáng)化資源調(diào)度和利用的效率,RDNA架構(gòu)還將每兩個(gè)CU計(jì)算單元緊密地捆綁在了一起,組成一個(gè)工作組處理器(Work Group Processor),使得可用ALU單元、寄存器數(shù)量翻番,緩存帶寬更是之前的四倍。

緩存方面,RDNA架構(gòu)設(shè)計(jì)了一套多級一致性結(jié)構(gòu),每個(gè)雙CU組合內(nèi)都有自己的零級緩存,與ALU單元的載入帶寬翻番,增加了四組新的一級緩存(都是16-way 128KB),降低了二級緩存(16-way 4MB)的擁堵,整體延遲和功耗大大減低。

按照AMD的說法,零級緩存的延遲降低了21%,一二級緩存降低24%,內(nèi)存延遲也低了7%。

另外在一致性多級緩存下,到處都支持Delta數(shù)據(jù)壓縮(DCC/圖中箭頭黃色部分),提高傳輸率,同時(shí)還改進(jìn)了色彩壓縮算法,可供顯示引擎讀取,著色器也能同時(shí)讀寫壓縮的色彩數(shù)據(jù)。

圖形引擎流水線方面進(jìn)行了大刀闊斧的重組,包括四個(gè)增強(qiáng)的ACE異步計(jì)算引擎,地位更加中心化的結(jié)合處理器(包含四個(gè)原語單元),64個(gè)像素單元。

異步計(jì)算一直是A卡的獨(dú)門絕技,也是起在DX12、Vulkan API下表現(xiàn)更好的關(guān)鍵,如今得到增強(qiáng)后,可以更精準(zhǔn)地實(shí)時(shí)控制其他模塊。

有趣的是,RDNA GPU架構(gòu)設(shè)計(jì)也借鑒了Zen CPU架構(gòu)設(shè)計(jì)的一些先進(jìn)理念,尤其是在時(shí)鐘門控方面,效率和能效極高,同時(shí)還減少了達(dá)到更高頻率所需要的邏輯層級。

Radeon顯示引擎也大幅躍進(jìn),支持FreeSync 2 HDR、HDMI 2.0/DisplayPort 1.4 HDR,針對高分辨率HR顯示器優(yōu)化,可輸出4K/240Hz、8K/60Hz,而且都只需一根數(shù)據(jù)線即可達(dá)成,同時(shí)還優(yōu)化了VR頭顯顯示。

Radeon多媒體引擎則大大改進(jìn)了視頻編解碼,增加了新的H.265 HDR/WCG編碼器,全面支持H.264 1080p600、4K150、8K30解碼和1080p360、4K90編碼,H.265 1080p360、4K90、8K24解碼和1080p360、4K60編碼,VP9 4K90、8K24解碼,整體編碼速度加快40%。

對于大家非常關(guān)注的光線追蹤支持,GCN、RDNA架構(gòu)都沒有專門的硬件單元加速,不過事實(shí)上,AMD ProRender、Radeon Rays都早就支持了光線追蹤,分別面向內(nèi)容創(chuàng)作渲染和游戲開發(fā)。

在下一代RDNA架構(gòu)上,AMD會通過硬件單元,支持特定的光線追蹤效果在游戲中實(shí)時(shí)渲染,而即便到了更遙遠(yuǎn)的未來,AMD也不會將光線追蹤全部一股腦扔給硬件來本地處理,否則效率會非常低下,而是將借助云計(jì)算,實(shí)現(xiàn)全場景的光線追蹤,保證畫面效果的同時(shí),不會給本地硬件太大的壓力。

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報(bào)投訴
  • 處理器
    +關(guān)注

    關(guān)注

    68

    文章

    20259

    瀏覽量

    252560
  • amd
    amd
    +關(guān)注

    關(guān)注

    25

    文章

    5690

    瀏覽量

    140028
  • 顯卡
    +關(guān)注

    關(guān)注

    16

    文章

    2521

    瀏覽量

    71526
  • GPU架構(gòu)
    +關(guān)注

    關(guān)注

    0

    文章

    15

    瀏覽量

    8654

原文標(biāo)題:四年研發(fā),終成正果!AMD 全新GPU架構(gòu)解析:相比 Vega 64 面積更小,性能提升14%,功耗降低23%

文章出處:【微信號:wc_ysj,微信公眾號:旺材芯片】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關(guān)推薦
    熱點(diǎn)推薦

    如何確保CAT.1模組的高性能與低功耗?

    確保CAT.1模組實(shí)現(xiàn)高性能與低功耗的完美平衡,是物聯(lián)網(wǎng)設(shè)備長期穩(wěn)定運(yùn)行和降低運(yùn)維成本的關(guān)鍵?;谖覀儾捎玫娜A為海思最新Hi2131芯片方案,我們通過以下四大核心技術(shù)維度實(shí)現(xiàn)了這一目標(biāo): 1. 先進(jìn)
    發(fā)表于 03-05 11:41

    解析ISL62776:AMD CPU/GPU核心電源的理想之選

    解析ISL62776:AMD CPU/GPU核心電源的理想之選 在如今的電子設(shè)備中,CPU和GPU性能不斷
    的頭像 發(fā)表于 02-04 16:30 ?199次閱讀

    AMC23C14:高性能雙路隔離窗口比較器的卓越之選

    AMC23C14:高性能雙路隔離窗口比較器的卓越之選 在電子工程師的日常設(shè)計(jì)工作中,對于高精度、高可靠性的隔離窗口比較器的需求始終存在。今天,我們就來深入探討一款備受關(guān)注的產(chǎn)品——AMC23C14
    的頭像 發(fā)表于 01-21 10:05 ?233次閱讀

    降低LDO功耗延長運(yùn)行時(shí)間

    能有效幫助LDO提升散熱能力。降低功耗是現(xiàn)在各種電源芯片都重點(diǎn)設(shè)計(jì)的一個(gè)環(huán)節(jié),降低靜態(tài)電流是行之有效的一個(gè)辦法,但前提是靜態(tài)電流的降低不會降低
    發(fā)表于 01-08 07:13

    AMD 推出銳龍 AI 嵌入式處理器產(chǎn)品組合,為汽車、工業(yè)和物理 AI 領(lǐng)域提供 AI 驅(qū)動的沉浸式體驗(yàn)

    新聞亮點(diǎn) ·?全新 AMD 銳龍 AI 嵌入式 P100 和 X100 系列處理器融入了高性能“Zen 5”CPU 核心、AMD RDNA 3.5
    的頭像 發(fā)表于 01-07 14:30 ?523次閱讀
    <b class='flag-5'>AMD</b> 推出銳龍 AI 嵌入式處理器產(chǎn)品組合,為汽車、工業(yè)和物理 AI 領(lǐng)域提供 AI 驅(qū)動的沉浸式體驗(yàn)

    AMD UltraScale架構(gòu):高性能FPGA與SoC的技術(shù)剖析

    ? FPGA.pdf 架構(gòu)概述 UltraScale架構(gòu)涵蓋了高性能FPGA、MPSoC和RFSoC等多個(gè)產(chǎn)品系列,旨在通過創(chuàng)新技術(shù)滿足廣泛的系統(tǒng)需求,同時(shí)降低
    的頭像 發(fā)表于 12-15 14:35 ?579次閱讀

    NVIDIA RTX PRO 2000 Blackwell GPU性能測試

    Blackwell 架構(gòu) GPU 中的中端專業(yè)圖形卡,高度僅為全高 GPU 的二分之一。如果您需要的是一塊半高顯卡,能適配小機(jī)箱,功耗不高,還要具備 AI 及光線追蹤
    的頭像 發(fā)表于 11-28 09:39 ?6365次閱讀
    NVIDIA RTX PRO 2000 Blackwell <b class='flag-5'>GPU</b><b class='flag-5'>性能</b>測試

    適應(yīng)邊緣AI全新時(shí)代的GPU架構(gòu)

    電子發(fā)燒友網(wǎng)站提供《適應(yīng)邊緣AI全新時(shí)代的GPU架構(gòu).pdf》資料免費(fèi)下載
    發(fā)表于 09-15 16:42 ?47次下載

    NVIDIA RTX PRO 4500 Blackwell GPU測試分析

    今天我們帶來全新 NVIDIA Blackwell 架構(gòu) GPU —— NVIDIA RTX PRO 4500 Blackwell 的測試,對比上一代產(chǎn)品 NVIDIA RTX 4500 Ada Generation 具體有哪些
    的頭像 發(fā)表于 08-28 11:02 ?4024次閱讀
    NVIDIA RTX PRO 4500 Blackwell <b class='flag-5'>GPU</b>測試分析

    aicube的n卡gpu索引該如何添加?

    請問有人知道aicube怎樣才能讀取n卡的gpu索引呢,我已經(jīng)安裝了cuda和cudnn,在全局的py里添加了torch,能夠調(diào)用gpu,當(dāng)還是只能看到默認(rèn)的gpu0,顯示不了gpu1
    發(fā)表于 07-25 08:18

    【「算力芯片 | 高性能 CPU/GPU/NPU 微架構(gòu)分析」閱讀體驗(yàn)】+NVlink技術(shù)從應(yīng)用到原理

    前言 【「算力芯片 | 高性能 CPU/GPU/NPU 微架構(gòu)分析」書中的芯片知識是比較接近當(dāng)前的頂尖芯片水平的,同時(shí)包含了芯片架構(gòu)的基礎(chǔ)知識,但該部分知識比較晦澀難懂,或許是由于我一
    發(fā)表于 06-18 19:31

    GPU架構(gòu)深度解析

    GPU架構(gòu)深度解析從圖形處理到通用計(jì)算的進(jìn)化之路圖形處理單元(GPU),作為現(xiàn)代計(jì)算機(jī)中不可或缺的一部分,已經(jīng)從最初的圖形渲染專用處理器,發(fā)展成為強(qiáng)大的并行計(jì)算引擎,廣泛應(yīng)用于人工智能
    的頭像 發(fā)表于 05-30 10:36 ?1885次閱讀
    <b class='flag-5'>GPU</b><b class='flag-5'>架構(gòu)</b>深度<b class='flag-5'>解析</b>

    iTOP-3588S開發(fā)板四核心架構(gòu)GPU內(nèi)置GPU可以完全兼容0penGLES1.1、2.0和3.2。

    性能強(qiáng) iTOP-3588S開發(fā)板采用瑞芯微RK3588S處理器,是全新一代AloT高端應(yīng)用芯片,搭載八核64位CPU,四核Cortex-A76和四核Cortex-A55架構(gòu)主頻高達(dá)2.4GHZ
    發(fā)表于 05-15 10:36

    Nordic新一代旗艦芯片nRF54H20深度解析

    異構(gòu)架構(gòu)??的芯片集成了: ??雙Cortex-M33內(nèi)核??(主頻320MHz,性能達(dá)nRF5340的2倍) ??RISC-V協(xié)處理器集群??(專為實(shí)時(shí)任務(wù)優(yōu)化) ??超大存儲配置??:2MB
    發(fā)表于 04-26 23:25

    在英特爾酷睿Ultra AI PC上部署多種圖像生成模型

    全新英特爾酷睿Ultra 200V系列處理器對比上代Meteor Lake,升級了模塊化結(jié)構(gòu)、封裝工藝,采用全新性能核與能效核、英特爾硬件線程調(diào)度器、Xe2微架構(gòu)銳炫
    的頭像 發(fā)表于 04-02 15:47 ?1523次閱讀
    在英特爾酷睿Ultra AI PC上部署多種圖像生成模型