91欧美超碰AV自拍|国产成年人性爱视频免费看|亚洲 日韩 欧美一厂二区入|人人看人人爽人人操aV|丝袜美腿视频一区二区在线看|人人操人人爽人人爱|婷婷五月天超碰|97色色欧美亚州A√|另类A√无码精品一级av|欧美特级日韩特级

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內(nèi)不再提示

Arm Neoverse與AWS Graviton4加速云計算創(chuàng)新

Arm社區(qū) ? 來源:Arm社區(qū) ? 2024-12-17 10:16 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

作者:Arm 基礎設施事業(yè)部服務器生態(tài)系統(tǒng)開發(fā)總監(jiān)

Bhumik Patel

隨著人工智能 (AI) 技術的迅猛發(fā)展,云計算領域正在經(jīng)歷顯著變革。愈發(fā)復雜的 AI 應用對計算解決方案的性能、效率和成本效益提出了更高要求。在云端部署工作負載的客戶正在重新評估其所需的基礎設施,以滿足現(xiàn)代工作負載需求,其中不僅包括提高性能和降低成本,還涵蓋了需符合監(jiān)管要求或可持續(xù)發(fā)展目標的新能效基準。

Arm 與亞馬遜云科技 (AWS) 長期合作,為實現(xiàn)性能更強勁、更高效和可持續(xù)的云計算提供專用芯片和計算技術。在近期舉行的 AWS re:Invent 2024 大會上,AWS 進一步展示了 AWS Graviton4 所取得的顯著進展,使開發(fā)者和企業(yè)能夠充分發(fā)揮其云工作負載的性能潛力。

卓越的性能表現(xiàn)

相較于上一代 Graviton3 處理器,基于 Arm Neoverse V2 平臺的 AWS Graviton4 處理器在計算性能上提升了 30%,核心數(shù)增加了 50%,內(nèi)存帶寬提高了 75%。憑借這些技術優(yōu)勢,AWS Graviton 處理器在生態(tài)系統(tǒng)和客戶群體中得到了廣泛應用。

Arm Neoverse V2 平臺涵蓋 Armv9 架構的新特性,包括高性能浮點和向量指令支持,以及 SVE/SVE2、Bfloat16 和 INT8 MatMul 等特性。這些特性為 AI/機器學習 (ML) 以及高性能計算 (HPC) 工作負載提供了卓越性能。

AI/ML 工作負載

今年早些時候,Arm 與主流的 AI 框架和軟件生態(tài)系統(tǒng)合作,推出了 Arm Kleidi 軟件,以確保 Arm 平臺上開機即用的推理性能優(yōu)化能惠及整個 ML 棧,開發(fā)者無需掌握額外的 Arm 專業(yè)知識即可構建其工作負載,從而進一步推動 AI 工作負載的廣泛應用。此前,我們已展示了 PyTorch 中的這些優(yōu)化如何賦能 AWS Graviton4 上運行大語言模型 (LLM),如 Llama 3 70B 和 Llama 3.1 8B,并顯著改善了每秒生成詞元 (token) 數(shù)和詞元首次響應時間的表現(xiàn)指標。

歡迎閱讀《Arm KleidiAI 助力提升 PyTorch 上 LLM 推理性能》一文,詳細了解性能指標的提升細節(jié)。

HPC 和 EDA 工作負載

對于 HPC 工作負載,Graviton4 相較于 Graviton3E 在功能上實現(xiàn)了顯著提升。每個核心的主內(nèi)存帶寬增加了16%,每個 vCPU 的 L2 緩存容量翻倍。這些改進對于 HPC 應用的性能至關重要,因為 HPC 應用通常受限于內(nèi)存帶寬。AWS 已經(jīng)在這些領域取得了顯著優(yōu)勢,如下所示。

根據(jù) Arm 工程團隊實際運行 EDA 工作負載所得出的結(jié)果,Graviton4 提供的 RTL 仿真工作負載性能比 Graviton3 高出 37%。

生態(tài)系統(tǒng)廣泛采用

近年來,隨著云計算用戶將各種云工作負載部署在 AWS Graviton 處理器上,其軟件生態(tài)系統(tǒng)持續(xù)擴展。如此一來,客戶不僅節(jié)省了費用,收獲了性能的提升,還能優(yōu)化其碳足跡和可持續(xù)發(fā)展足跡。以下是部分示例:

著手利用 Graviton 的強大性能

我們堅信 Arm 將在云計算的未來中發(fā)揮關鍵作用,同時我們也非常自豪能夠支持 AWS Graviton 立于技術創(chuàng)新的前沿。Arm 將繼續(xù)投入,進一步強化我們的軟件生態(tài)系統(tǒng),從而使開發(fā)者能夠更加輕松地在 Arm 平臺上構建其應用,并充分利用 Arm 計算平臺所提供的卓越性能和效率優(yōu)勢。

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學習之用,如有內(nèi)容侵權或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • 處理器
    +關注

    關注

    68

    文章

    20261

    瀏覽量

    252630
  • ARM
    ARM
    +關注

    關注

    135

    文章

    9561

    瀏覽量

    392217
  • 云計算
    +關注

    關注

    39

    文章

    8025

    瀏覽量

    144489
  • AI
    AI
    +關注

    關注

    91

    文章

    39944

    瀏覽量

    301587

原文標題:Arm Neoverse 賦能 AWS Graviton4 處理器,加速云計算創(chuàng)新

文章出處:【微信號:Arm社區(qū),微信公眾號:Arm社區(qū)】歡迎添加關注!文章轉(zhuǎn)載請注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關推薦
    熱點推薦

    如何在Arm Neoverse N2平臺上提升llama.cpp擴展性能

    跨 NUMA 內(nèi)存訪問可能會限制 llama.cpp 在 Arm Neoverse 平臺上的擴展能力。本文將為你詳細分析這一問題,并通過引入原型驗證補丁來加以解決。測試結(jié)果表明,在基于 Neoverse N2 平臺的系統(tǒng)上運行
    的頭像 發(fā)表于 02-11 10:06 ?182次閱讀

    AWS安全入門:數(shù)據(jù)上前必知的基礎防線

    前言智能廢料分揀系統(tǒng)在工廠邊緣運行,通過AWS服務將分揀準確率從70%提升至97%,背后是一套完整的云安全體系在默默守護。亞馬遜科技作為全球領先的
    的頭像 發(fā)表于 01-07 13:43 ?1271次閱讀
    <b class='flag-5'>AWS</b>安全入門:數(shù)據(jù)上<b class='flag-5'>云</b>前必知的基礎防線

    融合創(chuàng)新計算架構的全面解析與應用

    在當今數(shù)字化的時代,計算已經(jīng)成為推動企業(yè)創(chuàng)新和發(fā)展的關鍵技術。隨著企業(yè)需求的多樣化和技術環(huán)境的不斷變化,單一的計算模式已無法滿足企業(yè)對靈
    的頭像 發(fā)表于 12-23 14:17 ?352次閱讀

    西門子EDA與Arm攜手合作加速系統(tǒng)設計驗證進程與軟件啟動

    對芯片設計而言,加速產(chǎn)品的上市流程至關重要。為此,西門子EDA與Arm攜手合作,為Arm的合作伙伴提供了一系列基于Arm Neoverse
    的頭像 發(fā)表于 12-19 09:06 ?702次閱讀
    西門子EDA與<b class='flag-5'>Arm</b>攜手合作<b class='flag-5'>加速</b>系統(tǒng)設計驗證進程與軟件啟動

    NVIDIA和AWS擴展全棧合作伙伴關系

    亞馬遜科技(AWS)將 NVIDIA NVLink Fusion 集成到其定制芯片中,包括新一代 Tranium4 芯片、GravitonA
    的頭像 發(fā)表于 12-13 09:20 ?975次閱讀

    Arm Neoverse平臺集成NVIDIA NVLink Fusion

    生態(tài)系統(tǒng),實現(xiàn)全緩存一致性與高帶寬互連。 隨著 AI 數(shù)據(jù)中心對 Arm Neoverse 的需求持續(xù)增長,客戶在將工作負載加速器連接至 Arm 平臺時擁有更多選擇。 人工智能 (A
    的頭像 發(fā)表于 11-26 11:08 ?491次閱讀

    如何使用 ARM FPU 加速浮點計算?

    文件名): -none-objdump -d build-fpu.elf/usart1-test 同樣,在反匯編文件中即可找到浮點計算代碼: 三、使用 ARM FPU 加速浮點計算
    發(fā)表于 11-19 06:51

    亞馬遜科技在中國區(qū)域推出Amazon Graviton4實例 以自研芯片驅(qū)動企業(yè)算力升級

    Graviton4處理器的Amazon Elastic Compute Cloud(Amazon EC2)C8g、M8g和R8g實例,針對客戶不同類型的工作負載進行優(yōu)化。與Amazon Graviton3處理器
    的頭像 發(fā)表于 09-10 20:51 ?804次閱讀

    西門子 Veloce CS 助力 Arm Neoverse 計算子系統(tǒng)驗證與確認

    西門子數(shù)字化工業(yè)軟件近日宣布,Veloce Strato CS 與Veloce proFPGA CS 已被 Veloce 的長期合作伙伴 Arm 部署應用,作為Arm Neoverse 計算
    的頭像 發(fā)表于 08-06 09:26 ?2929次閱讀

    Arm Neoverse N2平臺實現(xiàn)DeepSeek-R1滿血版部署

    頗具優(yōu)勢。Arm 攜手合作伙伴,在 Arm Neoverse N2 平臺上使用開源推理框架 llama.cpp 實現(xiàn) DeepSeek-R1 滿血版的部署,目前已可提供線上服務。
    的頭像 發(fā)表于 07-03 14:37 ?1261次閱讀
    <b class='flag-5'>Arm</b> <b class='flag-5'>Neoverse</b> N2平臺實現(xiàn)DeepSeek-R1滿血版部署

    Arm攜手微軟共筑計算和PC未來

    計算平臺并從中受益。無論是在 Microsoft Azure 的云端還是在 Windows on Arm PC 的邊緣側(cè),開發(fā)者可以在任何地方加速其應用和工作負載。
    的頭像 發(fā)表于 05-28 14:08 ?958次閱讀

    解讀基于Arm Neoverse V2平臺的Google Axion處理器

    計算需求在人工智能 (AI) 時代的爆發(fā)式增長,推動了開發(fā)者尋求性能優(yōu)化且高能效的解決方案,以降低總體擁有成本 (TCO)。Arm 致力于通過 Arm
    的頭像 發(fā)表于 04-21 13:47 ?1082次閱讀

    Arm助力開發(fā)者加速遷移至Arm架構平臺 Arm遷移資源分享

    隨著基于 Arm 架構的實例日益擴展,越來越多的用戶正從傳統(tǒng)平臺遷移至 Arm 平臺上。
    的頭像 發(fā)表于 04-09 18:23 ?1257次閱讀

    Arm Neoverse CMN S3 推動Compute Express Link (CXL) 存儲創(chuàng)新

    作者:Arm 物聯(lián)網(wǎng)事業(yè)部產(chǎn)品經(jīng)理?John Xavier Lionel 一致性網(wǎng)狀網(wǎng)絡 (Coherent Mesh Network, CMN) 互連是一種前沿技術,旨在為現(xiàn)代計算和存儲架構提供
    發(fā)表于 04-09 18:19 ?1288次閱讀
    <b class='flag-5'>Arm</b> <b class='flag-5'>Neoverse</b> CMN S3 推動Compute Express Link (CXL) 存儲<b class='flag-5'>創(chuàng)新</b>

    如何在基于Arm Neoverse平臺的CPU上構建分布式Kubernetes集群

    在本文中,我們將以 X(原 Twitter)為例,演示如何在基于 Arm Neoverse 平臺的 CPU 上構建分布式 Kubernetes 集群,以根據(jù)推文實時監(jiān)控情緒變化。如此一來,你可以充分利用 Arm
    的頭像 發(fā)表于 03-25 15:58 ?848次閱讀
    如何在基于<b class='flag-5'>Arm</b> <b class='flag-5'>Neoverse</b>平臺的CPU上構建分布式Kubernetes集群