91欧美超碰AV自拍|国产成年人性爱视频免费看|亚洲 日韩 欧美一厂二区入|人人看人人爽人人操aV|丝袜美腿视频一区二区在线看|人人操人人爽人人爱|婷婷五月天超碰|97色色欧美亚州A√|另类A√无码精品一级av|欧美特级日韩特级

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

AMD處理器和加速器全面助力人工智能 (AI) 訓(xùn)練與高性能計算

AMD中國 ? 來源:AMD中國 ? 作者:AMD中國 ? 2022-07-03 15:46 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

根據(jù)世界經(jīng)濟論壇2022年《全球風(fēng)險報告》顯示,“氣候行動失敗”是未來5-10年內(nèi)全球最主要的長期風(fēng)險之一。這不僅是未來的挑戰(zhàn),而且相關(guān)問題已經(jīng)顯現(xiàn)。作為微處理器設(shè)計廠商,在技術(shù)飛速發(fā)展的今天,我們有責任保護地球,也有機會幫助大家節(jié)約能源和減少溫室氣體排放。

AMD面向未來繪制了更加宏偉的藍圖,在25x20能效計劃實施的基礎(chǔ)上,制定了一項新的能效目標——30x25目標。從2020年到2025年,將AMD 處理器和加速器的能效提高 30 倍,全面助力人工智能 (AI) 訓(xùn)練與高性能計算。我們的目標相當于到 2025 年將計算的能耗減少97%。如果全球所有的人工智能和高性能計算服務(wù)器節(jié)點都能實現(xiàn)相似的提升,相對于行業(yè)基準趨勢,從2021年到2025 年,最多可節(jié)省510億千瓦時的電力,相當于62 億美元的節(jié)電量和 6 億棵生長 10 年的樹木的碳減排量。

f12ccb34-ee2d-11ec-ba43-dac502259ad0.png

AMD EPYC(霄龍)處理器和AMD Instinct 加速器

AMD EPYC(霄龍) 7003系列產(chǎn)品是性能出類拔萃的x86服務(wù)器處理器,其不僅能帶來出色的性能,而且能夠充分降低數(shù)據(jù)中心運營對環(huán)境的影響,進一步降低能源成本,同時推動實現(xiàn)公司的可持續(xù)發(fā)展目標。

經(jīng)過全新設(shè)計的AMD Instinct 加速器,可以輕松應(yīng)對高性能計算和人工智能工作負載,無論是單服務(wù)器解決方案,還是世界先進的超級計算機,AMD Instinct 系列加速器可為各種規(guī)模的數(shù)據(jù)中心帶來卓越性能。全新的AMD Instinct 加速器采用創(chuàng)新性 AMD CDNA 2 架構(gòu)、AMD Infinity Fabric 技術(shù)以及先進的封裝技術(shù),助力百億億級計算系統(tǒng)加速探索發(fā)現(xiàn),讓科學(xué)家能夠輕松應(yīng)對各種緊迫的挑戰(zhàn)。

基于AMD EPYC(霄龍)CPU和AMD Instinct加速器,AMD可以為AI訓(xùn)練和HPC應(yīng)用程序中那些世界上增長最快的計算需求而服務(wù)。這些應(yīng)用程序可用于:

-氣候預(yù)測、基因組學(xué)和藥物發(fā)現(xiàn)等方面的科學(xué)研究

-語音識別、語言翻譯和AI神經(jīng)網(wǎng)絡(luò)訓(xùn)練等

我們相信通過架構(gòu)創(chuàng)新,可以為這些及其他加速計算節(jié)點的應(yīng)用程序優(yōu)化能源。

接近2022年中期,AMD正朝著實現(xiàn)30x25的目標前進,僅通過使用基于一顆第三代AMD EPYC CPU和四個AMD Instinct MI250x GPU的加速節(jié)點,便可以在2020年的基準水平之上提高6.79倍能效。我們的進度報告采用的測量方法2經(jīng)過著名的計算能效研究專家Jonathan Koomey博士的驗證。

f1caeb2a-ee2d-11ec-ba43-dac502259ad0.png

保護地球人人有責,AMD將持續(xù)通過提高產(chǎn)品能效,助力可持續(xù)發(fā)展的低碳經(jīng)濟加速轉(zhuǎn)型,實現(xiàn)節(jié)約能源和減少溫室氣體排放的目標,對全社會產(chǎn)生積極的作用。

1、該情景基于全球所有人工智能和高性能計算服務(wù)器節(jié)點實現(xiàn) AMD 30 倍目標的提升,相對于 2020 年的基線趨勢,從 2021 年到 2025 年,累計節(jié)省高達 514 億千瓦時的電力。假設(shè)每千瓦時 0.12 美分 x 514 億千瓦時 = 620 萬美元。CO2e 排放量(公噸)以及植樹當量的估算值來自 2021 年 12 月 1 日將節(jié)電量輸入美國 EPA 溫室氣體計算器后得出的結(jié)果。https://www.epa.gov/energy/greenhouse-gas-equivalencies-calculator

2、 AMD 在四加速器 CPU 主機配置中對用于人工智能訓(xùn)練和高性能計算的高性能 AMD CPU 和 GPU 加速器進行計算節(jié)點效能功耗比測量。

- 高性能計算工作負載的性能基于具有 4k 矩陣大小的 Linpack DGEMM kernel FLOPS。人工智能訓(xùn)練的性能基于在 4k 矩陣上運行的低精度訓(xùn)練浮點數(shù)學(xué) GEMM kernel,例如 FP16 或 BF16 FLOPS。

-功耗基于一個典型的加速計算節(jié)點(包括 CPU 主機 + 內(nèi)存以及 4 個 GPU 加速器)的熱設(shè)計功耗 (TDP)。

為了使該目標與全球能源使用量密切相關(guān),AMD 與 Koomey Analytics 合作評估可用的研究和數(shù)據(jù),其中包括 GPU 高性能計算 (HPC) 和機器學(xué)習(xí) (ML) 等特定領(lǐng)域數(shù)據(jù)中心能源使用效率 (PUE)。AMD CPU 和 GPU 節(jié)點功耗包含特定領(lǐng)域使用(活動與空閑)百分比,并乘以 PUE 來確定實際總能耗,從而能夠計算出效能功耗比。

能耗基準采用 2015-2020 年數(shù)據(jù)中觀察到的行業(yè)單位作業(yè)能耗提升率,并根據(jù)這一變化率推測至 2025 年。AMD 目標趨勢線(表 1)顯示到 2025 年實現(xiàn)能效提升 30 倍目標所需的指數(shù)級提升。AMD 實際發(fā)布產(chǎn)品(表 2)是表 1 AMD 目標能效提升的來源。

2020 年到 2025 年各領(lǐng)域單位作業(yè)能耗提升值是由全球預(yù)計銷量加權(quán)得出(根據(jù) IDC - Q1 2021 TrackerHyperion- Q4 2020 Tracker,Hyperion 高性能計算市場分析,2021 年 4 月)。將這些銷量換算到機器學(xué)習(xí)訓(xùn)練和高性能計算市場,會得出如下表 3 所示的節(jié)點量。然后將這些節(jié)點量乘以 2025 年各計算領(lǐng)域的典型能源消耗 (TEC)(表 4),得出一個有意義的全球?qū)嶋H能源使用提升的總體指標。

f1ed319e-ee2d-11ec-ba43-dac502259ad0.png



原文標題:AMD EPYC(霄龍) 處理器和AMD Instinct 加速器為高能效添能助力

文章出處:【微信公眾號:AMD中國】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。


審核編輯:劉清

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • 加速器
    +關(guān)注

    關(guān)注

    2

    文章

    839

    瀏覽量

    40111
  • AMD處理器
    +關(guān)注

    關(guān)注

    2

    文章

    60

    瀏覽量

    14038
  • 人工智能
    +關(guān)注

    關(guān)注

    1817

    文章

    50115

    瀏覽量

    265581

原文標題:AMD EPYC(霄龍) 處理器和AMD Instinct 加速器為高能效添能助力

文章出處:【微信號:AMD中國,微信公眾號:AMD中國】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關(guān)推薦
    熱點推薦

    AMD銳龍AI嵌入式P100系列處理器產(chǎn)品簡介

    AMD 銳龍 AI 嵌入式 P100 系列處理器代表了 AMD 在車規(guī)級(通過 AECQ 100 認證)和工業(yè)級(寬溫)嵌入式處理器領(lǐng)域的下
    的頭像 發(fā)表于 01-23 09:19 ?2202次閱讀
    <b class='flag-5'>AMD</b>銳龍<b class='flag-5'>AI</b>嵌入式P100系列<b class='flag-5'>處理器</b>產(chǎn)品簡介

    奇異摩爾參編人工智能加速器互聯(lián)芯粒技術(shù)要求團體標準發(fā)布

    》標準(編號T/CESA 1457-2025)已獲批準,并予以近日正式實施。此項標準是構(gòu)建高性能人工智能超節(jié)點服務(wù)”的關(guān)鍵底層技術(shù)規(guī)范,旨在統(tǒng)一和規(guī)范加速器間的互聯(lián)接口,促進不同
    的頭像 發(fā)表于 01-09 11:20 ?612次閱讀
    奇異摩爾參編<b class='flag-5'>人工智能</b><b class='flag-5'>加速器</b>互聯(lián)芯粒技術(shù)要求團體標準發(fā)布

    一文了解Mojo編程語言

    Mojo 是一種由 Modular AI 公司開發(fā)的編程語言,旨在將 Python 的易用性與 C 語言的高性能相結(jié)合,特別適合人工智能AI)、
    發(fā)表于 11-07 05:59

    邊緣計算中的AI加速器類型與應(yīng)用

    人工智能正在推動對更快速、更智能、更高效計算的需求。然而,隨著每秒產(chǎn)生海量數(shù)據(jù),將所有數(shù)據(jù)發(fā)送至云端處理已變得不切實際。這正是邊緣計算
    的頭像 發(fā)表于 11-06 13:42 ?824次閱讀
    邊緣<b class='flag-5'>計算</b>中的<b class='flag-5'>AI</b><b class='flag-5'>加速器</b>類型與應(yīng)用

    【今晚7點半】正點原子 x STM32:智能加速邊緣AI應(yīng)用開發(fā)!今晚正點原子B站直播間等你

    【聯(lián)合直播】正點原子 x STM32:智能加速邊緣AI應(yīng)用開發(fā)! 一、直播介紹 隨著人工智能技術(shù)在邊緣計算領(lǐng)域的快速發(fā)展,STM32系列
    發(fā)表于 09-25 14:14

    瑞薩電子RZ/V系列微處理器助力邊緣AI開發(fā)

    邊緣AI越來越多地應(yīng)用于諸如工業(yè)攝像頭和公共設(shè)施攝像頭等嵌入式設(shè)備中,并要求嵌入式產(chǎn)品小型化且具有低功耗。瑞薩電子RZ/V系列微處理器(MPU)內(nèi)置AI加速器,即動態(tài)可重構(gòu)
    的頭像 發(fā)表于 09-23 10:31 ?921次閱讀
    瑞薩電子RZ/V系列微<b class='flag-5'>處理器</b><b class='flag-5'>助力</b>邊緣<b class='flag-5'>AI</b>開發(fā)

    關(guān)于人工智能處理器的11個誤解

    本文轉(zhuǎn)自:TechSugar編譯自ElectronicDesign人工智能浪潮已然席卷全球,將人工智能加速器處理器整合到各類應(yīng)用中也變得愈發(fā)普遍。然而,圍繞它們是什么、如何運作、能如
    的頭像 發(fā)表于 08-07 13:21 ?1089次閱讀
    關(guān)于<b class='flag-5'>人工智能</b><b class='flag-5'>處理器</b>的11個誤解

    AMD嵌入式處理器為您的應(yīng)用添能助力

    AMD 面向嵌入式應(yīng)用打造高性能、高能效處理器,全方位滿足網(wǎng)絡(luò)、存儲、汽車、工業(yè)、零售、醫(yī)療、測試與測量等領(lǐng)域的各種需求。無論您的應(yīng)用是涉及 AI
    的頭像 發(fā)表于 07-07 14:09 ?1911次閱讀

    芯原可擴展的高性能GPGPU-AI計算IP賦能汽車與邊緣服務(wù)AI解決方案

    人工智能 (AI) 加速器相融合,這些IP在熱和功耗受限的環(huán)境下,能夠高效支持大語言模型 (LLM) 推理、多模態(tài)感知以及實時決策等復(fù)雜的AI工作負載。 芯原的GPGPU-
    的頭像 發(fā)表于 06-16 10:44 ?1382次閱讀

    開售RK3576 高性能人工智能主板

    ZYSJ-2476B 高性能智能主板,采用瑞芯微 RK3576 高性能 AI 處理器、神經(jīng)網(wǎng)絡(luò)處理器
    發(fā)表于 04-23 10:55

    TPU處理器的特性和工作原理

    張量處理單元(TPU,Tensor Processing Unit)是一種專門為深度學(xué)習(xí)應(yīng)用設(shè)計的硬件加速器。它的開發(fā)源于對人工智能AI)和機器學(xué)習(xí)應(yīng)用的需求,尤其是深度學(xué)習(xí)中的神經(jīng)
    的頭像 發(fā)表于 04-22 09:41 ?4404次閱讀
    TPU<b class='flag-5'>處理器</b>的特性和工作原理

    Banana Pi 發(fā)布 BPI-AI2N &amp; BPI-AI2N Carrier,助力 AI 計算與嵌入式開發(fā)

    []() 2025年3月19日——Banana Pi 今日正式發(fā)布 BPI-AI2N & BPI-AI2N Carrier,基于瑞薩電子(Renesas)同步發(fā)布的最新的高性能處理器
    發(fā)表于 03-19 17:54

    支持實時物體識別的視覺人工智能處理器RZ/V2MA數(shù)據(jù)手冊

    DRP-AI 采用了一種由動態(tài)可重構(gòu)處理器(DRP)和 AI-MAC組成的人工智能加速器,該加速器
    的頭像 發(fā)表于 03-18 18:12 ?936次閱讀
    支持實時物體識別的視覺<b class='flag-5'>人工智能</b>微<b class='flag-5'>處理器</b>RZ/V2MA數(shù)據(jù)手冊

    嵌入式AI加速器DRP-AI 詳細介紹

    的嵌入式設(shè)備。此外,人工智能正在不斷發(fā)展,新的算法不時被開發(fā)出來。 在人工智能快速發(fā)展的過程中,瑞薩開發(fā)了人工智能加速器(DRP-AI)和軟
    的頭像 發(fā)表于 03-15 16:13 ?1817次閱讀
    嵌入式<b class='flag-5'>AI</b><b class='flag-5'>加速器</b>DRP-<b class='flag-5'>AI</b> 詳細介紹

    AI MPU# 瑞薩RZ/V2H 四核視覺 ,采用 DRP-AI3 加速器高性能實時處理器

    RZ/V2H 高端 AI MPU 采用瑞薩電子專有的AI 加速器-動態(tài)可重配置處理器 (DRP-AI3)、四核 Arm^?^ Cortex
    的頭像 發(fā)表于 03-15 11:50 ?2307次閱讀
    <b class='flag-5'>AI</b> MPU# 瑞薩RZ/V2H 四核視覺 ,采用 DRP-<b class='flag-5'>AI</b>3 <b class='flag-5'>加速器</b>和<b class='flag-5'>高性能</b>實時<b class='flag-5'>處理器</b>