91欧美超碰AV自拍|国产成年人性爱视频免费看|亚洲 日韩 欧美一厂二区入|人人看人人爽人人操aV|丝袜美腿视频一区二区在线看|人人操人人爽人人爱|婷婷五月天超碰|97色色欧美亚州A√|另类A√无码精品一级av|欧美特级日韩特级

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

強(qiáng)悍的AWS Graviton4處理器及其背后的Arm Neoverse

Felix分析 ? 來源:電子發(fā)燒友 ? 作者:吳子鵬 ? 2024-12-19 00:04 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

電子發(fā)燒友網(wǎng)報(bào)道(文/吳子鵬)在今年的亞馬遜re:Invent 2024大會(huì)上,該公司正式對(duì)外發(fā)布了旗下第四代自研Arm芯片——Graviton4。作為目前最強(qiáng)大的Graviton處理器,Graviton4相較于上一代產(chǎn)品帶來了巨大的性能提升。同時(shí),為Graviton4賦能的Arm Neoverse也跟著受到了更多的關(guān)注。

強(qiáng)悍的Graviton4處理器

據(jù)介紹,Graviton4處理器每個(gè)核心都能提供比上代強(qiáng)30%的性能,vGPU數(shù)量和內(nèi)存容量也是上一代的3倍,能將處理大型Java應(yīng)用的速度提升45%,可以為企業(yè)提供更低成本和高效的高性能計(jì)算解決方案。

除了內(nèi)核性能的提升,亞馬遜還著重提升了Graviton4處理器的存儲(chǔ)性能,首次創(chuàng)建了雙插槽NUMA內(nèi)存集群。Graviton4處理器配備了高達(dá)1.5 TB的DDR5主內(nèi)存,運(yùn)行頻率為5.6 GHz,提供12個(gè)內(nèi)存通道。與之相比,上一代Graviton 3處理器使用了4.8 GHz主頻的DDR5內(nèi)存,只有8個(gè)內(nèi)存通道。并且,單個(gè)Graviton4處理器的內(nèi)存插槽就可以提供537.6 GB/秒的帶寬,能夠輕松應(yīng)對(duì)HPC負(fù)載。

此前,亞馬遜針對(duì)Graviton4處理器發(fā)布過一些測(cè)試實(shí)例,通過這些實(shí)例體現(xiàn)了這顆處理器強(qiáng)大的性能。比如,基于Graviton4處理器構(gòu)建UE5 Dedicated Server,據(jù)亞馬遜的說法,最新的Graviton 4實(shí)例是迄今為止亞馬遜為各種workload設(shè)計(jì)的最強(qiáng)大并且最高效節(jié)能的CPU。Graviton 4的實(shí)例R8g相較于Graviton 3的實(shí)例R7g有大約30%的性能提升。實(shí)例R8g壓測(cè)使用Lyra Starter Game項(xiàng)目,通過增加AI Bot和GameClient的方式來增加Dedicated Server(簡(jiǎn)稱DS)的負(fù)載,通過對(duì)比不同機(jī)型以及不同參數(shù)編譯出的DS在server full的情況下的CPU使用率和幀率(FPS)來對(duì)比性能。

結(jié)果顯示,Graviton 4的實(shí)例在UE Dedicated Server應(yīng)用場(chǎng)景下:
·相較于Graviton 3有約 25+%的性價(jià)比提升(均使用優(yōu)化參數(shù)編譯);
·相較于Intel Sapphire Rapids和AMD Genoa有30%~35%的性價(jià)比提升;
·使用Graviton針對(duì)C/C++的優(yōu)化參數(shù)來編譯Dedicated Server對(duì)性能提升約10%~25%。

根據(jù)外媒的測(cè)試,在相同的vCPU數(shù)量下,新的Graviton4處理器內(nèi)核大致與Intel Sapphire Rapids性能相當(dāng),同時(shí)能夠與AMD EPYC“Genoa”相媲美,并始終表現(xiàn)出極佳的代際提升。這都離不開Arm Neoverse的賦能。

Graviton4 處理器背后的Arm Neoverse

Graviton4 處理器基于Arm?Neoverse?V2平臺(tái),這顆核心發(fā)布于2022年9月。Neoverse V2和Neoverse E2都是Arm公司內(nèi)部代號(hào)“Demeter”項(xiàng)目下的產(chǎn)品,Arm?Neoverse?V2平臺(tái)涵蓋Armv9架構(gòu)的新特性,包括高性能浮點(diǎn)和向量指令支持,以及SVE/SVE2、Bfloat16和INT8?MatMul等特性。這些特性為AI/機(jī)器學(xué)習(xí)?(ML)?以及高性能計(jì)算?(HPC)?工作負(fù)載提供了卓越性能。

根據(jù)Arm官方的介紹信息,得益于全面增強(qiáng)的核心性能、內(nèi)存帶寬和高達(dá)兩倍的L2緩存大?。亢?MB),Neoverse V2可以在云和ML應(yīng)用程序上提供兩倍于Neoverse V1的性能。根據(jù)Arm工程團(tuán)隊(duì)實(shí)際運(yùn)行EDA工作負(fù)載所得出的結(jié)果,Graviton4?提供的RTL仿真工作負(fù)載性能比Graviton3高出?37%。同時(shí),Neoverse V2具有出色的平臺(tái)擴(kuò)展性,當(dāng)與新的CMN-700核心網(wǎng)狀網(wǎng)絡(luò)配對(duì)時(shí),Neoverse V2 CPU可以配置多達(dá)256個(gè)內(nèi)核和512MB的系統(tǒng)級(jí)緩存(SLC)。AMBA CHI C2C使用UCIe、CXL、PCIe或自定義PHY來連接計(jì)算、內(nèi)存和加速器,實(shí)現(xiàn)高效、高速的芯片連接。

看過Graviton4處理器的性能之后,人們對(duì)下一代Arm服務(wù)器會(huì)更加期待,這些產(chǎn)品將搭載最新的Neoverse V3。2024年2月,Arm宣布推出新一代 Arm Neoverse技術(shù),Neoverse CSS V3則是V系列芯片IP的首款Neoverse CSS產(chǎn)品,單芯片性能可提高50%。官方的資料顯示,全新的Neoverse CCS V3 核心基于64核的Neoverse V3 核心,擁有6個(gè)DDR5 內(nèi)存控制器、4個(gè) I/O 控制器和兩個(gè)芯片間互連,并支持PCIe Gen5和CXL3.0。通過芯片間互聯(lián),可以升級(jí)至128核。相對(duì)于此前的 Neoverse CSS N2,其單芯片性能可提高50%。

除了核心的提升,Arm將繼續(xù)投入并進(jìn)一步強(qiáng)化軟件生態(tài)系統(tǒng),從而使開發(fā)者能夠更加輕松地在?Arm平臺(tái)上構(gòu)建其應(yīng)用,并充分利用?Arm計(jì)算平臺(tái)所提供的卓越性能和效率優(yōu)勢(shì)。

結(jié)語

亞馬遜Graviton4處理器是Arm處理器歷史上的一次巨大成功,性能全面對(duì)標(biāo)x86處理器當(dāng)前的旗艦產(chǎn)品。在Graviton4處理器背后,Neoverse V2內(nèi)核起到了巨大的賦能作用,這讓產(chǎn)業(yè)界對(duì)于下一代基于Neoverse CCS V3 核心的Arm處理器更加期待。

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • 處理器
    +關(guān)注

    關(guān)注

    68

    文章

    20261

    瀏覽量

    252624
收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評(píng)論

    相關(guān)推薦
    熱點(diǎn)推薦

    海光3350處理器能被廣泛應(yīng)用的原因

    集特海光3350工控主板GM7-5601配置了1顆海光3350處理器、8核16線程設(shè)計(jì),2根DDR4內(nèi)存插槽,最大支持64GB、4個(gè)千兆網(wǎng)口、板載網(wǎng)絡(luò)控制、10個(gè)USB接口、10個(gè)C
    的頭像 發(fā)表于 01-09 16:22 ?766次閱讀
    海光3350<b class='flag-5'>處理器</b>能被廣泛應(yīng)用的原因

    NVIDIA和AWS擴(kuò)展全棧合作伙伴關(guān)系

    亞馬遜云科技(AWS)將 NVIDIA NVLink Fusion 集成到其定制芯片中,包括新一代 Tranium4 芯片、GravitonAWS Nitro System。
    的頭像 發(fā)表于 12-13 09:20 ?975次閱讀

    TDA4VL-Q1處理器技術(shù)文檔總結(jié)

    TDA4VE TDA4AL TDA4VL 處理器系列基于進(jìn)化的 Jacinto? 7 架構(gòu),面向智能視覺相機(jī)應(yīng)用,并建立在 TI 十多年來在視覺處理
    的頭像 發(fā)表于 10-10 09:47 ?2034次閱讀
    TDA<b class='flag-5'>4</b>VL-Q1<b class='flag-5'>處理器</b>技術(shù)文檔總結(jié)

    TDA4AL-Q1處理器的技術(shù)文檔摘要

    TDA4VE TDA4AL TDA4VL 處理器系列基于進(jìn)化的 Jacinto? 7 架構(gòu),面向智能視覺相機(jī)應(yīng)用,并建立在 TI 十多年來在視覺處理
    的頭像 發(fā)表于 10-10 09:40 ?1767次閱讀
    TDA<b class='flag-5'>4</b>AL-Q1<b class='flag-5'>處理器</b>的技術(shù)文檔摘要

    TDA4VH-Q1處理器技術(shù)文檔總結(jié)

    TDA4VH-Q1 TDA4AH-Q1 TDA4VP-Q1 TDA4AP-Q1 處理器系列基于進(jìn)化的 Jacinto? 7 架構(gòu),面向 AD
    的頭像 發(fā)表于 10-08 10:32 ?4237次閱讀
    TDA<b class='flag-5'>4</b>VH-Q1<b class='flag-5'>處理器</b>技術(shù)文檔總結(jié)

    TDA4VP-Q1處理器技術(shù)文檔總結(jié)

    TDA4VH-Q1 TDA4AH-Q1 TDA4VP-Q1 TDA4AP-Q1 處理器系列基于進(jìn)化的 Jacinto? 7 架構(gòu),面向 AD
    的頭像 發(fā)表于 09-29 14:56 ?4928次閱讀
    TDA<b class='flag-5'>4</b>VP-Q1<b class='flag-5'>處理器</b>技術(shù)文檔總結(jié)

    亞馬遜云科技在中國(guó)區(qū)域推出Amazon Graviton4實(shí)例 以自研芯片驅(qū)動(dòng)企業(yè)算力升級(jí)

    Graviton4處理器的Amazon Elastic Compute Cloud(Amazon EC2)C8g、M8g和R8g實(shí)例,針對(duì)客戶不同類型的工作負(fù)載進(jìn)行優(yōu)化。與Amazon Graviton3
    的頭像 發(fā)表于 09-10 20:51 ?803次閱讀

    Texas Instruments DRA821x Jacinto? 64位處理器技術(shù)解析

    Texas Instruments DRA821x Jacinto? 64位處理器基于ARM?v8架構(gòu),并為帶有云連接性的網(wǎng)關(guān)系統(tǒng)進(jìn)行了優(yōu)化。片上系統(tǒng) (SoC) 設(shè)計(jì)通過集成降低了系統(tǒng)級(jí)成本
    的頭像 發(fā)表于 08-28 11:33 ?1117次閱讀
    Texas Instruments DRA821x Jacinto? 64位<b class='flag-5'>處理器</b>技術(shù)解析

    MT6765_MTK6765安卓核心板_Helio P35處理器簡(jiǎn)介/芯片功能資料

    MT6765是一款兼具高效能與多功能的智能芯片,采用主頻高達(dá)2.3GHz的八核ARM Cortex-A53處理器,結(jié)合臺(tái)積電12納米FinFET制程工藝,提供出色的性能和低能耗表現(xiàn)。芯片內(nèi)置頻率達(dá)
    的頭像 發(fā)表于 07-01 20:17 ?2650次閱讀
    MT6765_MTK6765安卓核心板_Helio P35<b class='flag-5'>處理器</b>簡(jiǎn)介/芯片功能資料

    基于RK3576處理器,EASY EAI Orin Nano開發(fā)板免費(fèi)試用

    EASY EAI Orin Nano是廣州靈眸科技有限公司的旗艦級(jí)硬件產(chǎn)品?;谌鹦疚⒌腞K3576處理器設(shè)計(jì),集成了4個(gè)Cortex-A72和4個(gè)Cortex-A53及支持NEON指令集,支持
    的頭像 發(fā)表于 06-09 15:01 ?1443次閱讀
    基于RK3576<b class='flag-5'>處理器</b>,EASY EAI Orin Nano開發(fā)板免費(fèi)試用

    國(guó)民技術(shù)能否開展一個(gè)M7處理器的試用活動(dòng)。

    國(guó)民技術(shù)最近推出了M7處理器,看起來能力很強(qiáng),電子發(fā)燒友能不能聯(lián)合國(guó)民技術(shù)開展一個(gè)M7使用的活動(dòng),讓大家了解下M7核的國(guó)民技術(shù)。
    發(fā)表于 05-20 22:04

    MAX32662 Arm Cortex-M4處理器,集成帶256KB閃存和80KB SRAM的FPU微控制(MCU)技術(shù)手冊(cè)

    -M4處理器相結(jié)合,采用小尺寸封裝。 MAX32662支持基于邊緣的復(fù)雜設(shè)計(jì),且不影響電池壽命,它還為傳統(tǒng)設(shè)計(jì)提供簡(jiǎn)單的低成本升級(jí)(從8位或16位微控制進(jìn)行升級(jí))。
    的頭像 發(fā)表于 05-08 10:09 ?1193次閱讀
    MAX32662 <b class='flag-5'>Arm</b> Cortex-M<b class='flag-5'>4</b><b class='flag-5'>處理器</b>,集成帶256KB閃存和80KB SRAM的FPU微控制<b class='flag-5'>器</b>(MCU)技術(shù)手冊(cè)

    N150處理器對(duì)比N100有什么升級(jí)?這款一體機(jī)主板告訴你答案

    搭載英特爾N150處理器的一體機(jī)主板CB4-209-V0已正式上市,它采用E核配置,可以為低功耗設(shè)備提供更高效的計(jì)算能力,兼顧性能及擴(kuò)展性,是提升生產(chǎn)力的核心硬件。
    的頭像 發(fā)表于 04-28 14:38 ?5451次閱讀
    N150<b class='flag-5'>處理器</b>對(duì)比N100有什么升級(jí)?這款一體機(jī)主板告訴你答案

    解讀基于Arm Neoverse V2平臺(tái)的Google Axion處理器

    云計(jì)算需求在人工智能 (AI) 時(shí)代的爆發(fā)式增長(zhǎng),推動(dòng)了開發(fā)者尋求性能優(yōu)化且高能效的解決方案,以降低總體擁有成本 (TCO)。Arm 致力于通過 Arm Neoverse 平臺(tái)滿足不斷變化的需求,
    的頭像 發(fā)表于 04-21 13:47 ?1082次閱讀

    如何使用MKL26Z256VLL4處理器配置這些組件?

    如何使用 MKL26Z256VLL4 處理器配置這些組件? 圖像上的組件 servomotor motor driver camera bluetoth module debugger power module ...
    發(fā)表于 03-17 07:31