91欧美超碰AV自拍|国产成年人性爱视频免费看|亚洲 日韩 欧美一厂二区入|人人看人人爽人人操aV|丝袜美腿视频一区二区在线看|人人操人人爽人人爱|婷婷五月天超碰|97色色欧美亚州A√|另类A√无码精品一级av|欧美特级日韩特级

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內(nèi)不再提示

AMD將于今年秋季在部分RDNA 3 GPU上添加ROCm的支持

AMD中國 ? 來源:AMD中國 ? 2023-07-25 15:40 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

AMD將于今年秋季在部分RDNA 3 GPU上添加ROCm的支持

人工智能是塑造下一代計算的決定性技術。近幾個月來,我們都看到了生成式人工智能和大語言模型的爆炸式增長正在徹底改變我們與技術交互的方式,并推動以GPU為中心的數(shù)據(jù)中心對高性能計算的需求顯著增加。

ROCm是一個開放軟件平臺,允許研究人員利用AMD Instinct加速器的強大功能,促進HPC和AI創(chuàng)新跨平臺的可移植性。ROCm 5具有針對AI和HPC工作負載的全面優(yōu)化套件。其中包括針對大型語言模型精細調(diào)整的內(nèi)核、對新數(shù)據(jù)類型的支持以及對像OpenAI Triton類編程語言等新技術的支持。

ROCm驗證現(xiàn)在包括每晚進行數(shù)十萬次框架測試,以及跨數(shù)千個模型和運算符的驗證。這包括對PyTorch、TensorFlow、ONNX和JAX等領先框架的支持,為基于這些框架構建的所有AI模型提供更佳的開箱即用的開發(fā)者體驗。

我很高興地宣布ROCm 5.6的最新版本。

ROCm 5.6通過針對大語言(和其他)模型的新型AI軟件附加組件增強了功能,包括跨ROCm 庫組合的許多性能優(yōu)化。它還反映了支持人工智能社區(qū)的持續(xù)改進,包括:

- 將Hugging Face單元測試套件集成到ROCm QA中

- 在PyTorch 2.0感應器模式下對OpenAI Triton的增量支持

- 通過ROCm對PyTorch、TensorFlow和JAX啟用OpenXLA支持,從而支持更廣泛的社區(qū)

ROCm 5.6還引入了對FFT、BLAS和求解器等多個數(shù)學庫的改進,這些數(shù)學庫構成了HPC應用程序的基礎,并增強了ROCm開發(fā)和部署工具,包括安裝、ROCgdb(CPU-GPU集成調(diào)試器)、ROCm分析器和文檔。

隨著行業(yè)朝著支持廣泛加速器的開放生態(tài)系統(tǒng)發(fā)展,我們將繼續(xù)努力進一步優(yōu)化框架和后端編譯器,以實現(xiàn)更佳性能,包括MLIR基礎設施改進,鞏固AMD對OpenAI Triton和OpenXLA編譯器的支持。我們還將繼續(xù)在Hugging Face的AMD hub中添加針對AMD解決方案優(yōu)化的其他開源AI模型。

對于HPC用戶,我們最近在AMD Infinity Hub上發(fā)布了許多發(fā)布方法,使客戶能夠構建HPC應用程序容器,未來的ROCm版本將增加AMD Instinct解決方案支持的HPC應用程序數(shù)量。

我們還看到開發(fā)人員對在Radeon消費級和 Radeon Pro工作站級GPU上運行用于AI和ML的ROCm開放軟件平臺表現(xiàn)出了極大的興趣,并聽到了社區(qū)對不受支持的GPU上的特定驅(qū)動程序問題提出的挑戰(zhàn)。我可以很高興地說,我們已經(jīng)修復了ROCm 5.6中報告的問題,并且我們致力于今后擴大我們的支持。

我們計劃將ROCm支持從當前支持的AMD RDNA 2工作站GPU:Radeon Pro v620和w6800 擴展到特定的AMD RDNA 3工作站和消費級GPU。Linux上對基于RDNA 3的GPU的正式支持計劃于今年秋季開始推出,首先是48GB Radeon PRO W7900和24GB Radeon RX 7900 XTX,隨著時間的推移,還會發(fā)布更多卡和擴展功能。

責任編輯:彭菁

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學習之用,如有內(nèi)容侵權或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • amd
    amd
    +關注

    關注

    25

    文章

    5684

    瀏覽量

    139968
  • 人工智能
    +關注

    關注

    1817

    文章

    50098

    瀏覽量

    265363
  • RDNA
    +關注

    關注

    0

    文章

    22

    瀏覽量

    2235

原文標題:新的ROCm? 5.6版本為AI和HPC工作負載帶來增強和優(yōu)化

文章出處:【微信號:AMD中國,微信公眾號:AMD中國】歡迎添加關注!文章轉(zhuǎn)載請注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關推薦
    熱點推薦

    AMD獲Meta千億美元芯片大單,AI芯片市場格局生變

    GPUAMD Helios整機柜服務器,預計于今年晚些時候開啟交付。 AMD首席執(zhí)行官蘇姿豐稱,交易價值每吉瓦達百億美元級別,協(xié)議總金額或超600億美元,甚至可能達到上千億美元。雙
    的頭像 發(fā)表于 02-26 09:19 ?2459次閱讀
    <b class='flag-5'>AMD</b>獲Meta千億美元芯片大單,AI芯片市場格局生變

    解析ISL62776:AMD CPU/GPU核心電源的理想之選

    解析ISL62776:AMD CPU/GPU核心電源的理想之選 如今的電子設備中,CPU和GPU的性能不斷提升,對電源管理的要求也越來越高。ISL62776作為一款專為
    的頭像 發(fā)表于 02-04 16:30 ?187次閱讀

    Robotec.ai與AMD Silo AI的合作實踐

    AMD Silo AI 正與領先的機器人應用仿真平臺開發(fā)商 Robotec.ai 合作,優(yōu)化和擴展基于 AMD GPUROCm 軟件堆棧的下一代汽車和機器人系統(tǒng)的數(shù)字孿生和場景重
    的頭像 發(fā)表于 01-28 16:23 ?502次閱讀

    AMD 推出銳龍 AI 嵌入式處理器產(chǎn)品組合,為汽車、工業(yè)和物理 AI 領域提供 AI 驅(qū)動的沉浸式體驗

    新聞亮點 ·?全新 AMD 銳龍 AI 嵌入式 P100 和 X100 系列處理器融入了高性能“Zen 5”CPU 核心、AMD RDNA 3.5 GPU
    的頭像 發(fā)表于 01-07 14:30 ?499次閱讀
    <b class='flag-5'>AMD</b> 推出銳龍 AI 嵌入式處理器產(chǎn)品組合,為汽車、工業(yè)和物理 AI 領域提供 AI 驅(qū)動的沉浸式體驗

    ROCm部署PP-StructureV3AMD GPU

    作者:AVNET 李鑫杰 我們在上一篇文章中介紹了ROCm+PP-OCRv5,為實現(xiàn)在AMD計算平臺上完成復雜文檔的端到端智能解析,本文基于ROCm軟件棧,提供一套完整的PP-StructureV
    的頭像 發(fā)表于 11-13 16:56 ?5532次閱讀
    用<b class='flag-5'>ROCm</b>部署PP-StructureV<b class='flag-5'>3</b>到<b class='flag-5'>AMD</b> <b class='flag-5'>GPU</b><b class='flag-5'>上</b>

    Imagination GPU 全面支持 Vulkan 1.4 和 Android 16

    是Imagination開發(fā)者社區(qū)中廣受歡迎的圖形API,因其提供了低開銷、跨平臺訪問現(xiàn)代GPU的能力,幫助開發(fā)者多種設備最大化性能與效率。其對GPU操作的顯式控制,以及對
    的頭像 發(fā)表于 08-14 11:18 ?2292次閱讀
    Imagination <b class='flag-5'>GPU</b> 全面<b class='flag-5'>支持</b> Vulkan 1.4 和 Android 16

    aicube的n卡gpu索引該如何添加?

    請問有人知道aicube怎樣才能讀取n卡的gpu索引呢,我已經(jīng)安裝了cuda和cudnn,全局的py里添加了torch,能夠調(diào)用gpu,當還是只能看到默認的
    發(fā)表于 07-25 08:18

    產(chǎn)品添加架API接口設計指南

    ? 現(xiàn)代電商或庫存管理系統(tǒng)中,產(chǎn)品添加架是關鍵流程。通過API接口實現(xiàn)自動化操作,能顯著提升效率。本文將分步解析如何設計和使用“產(chǎn)品添加”與“產(chǎn)品
    的頭像 發(fā)表于 07-24 14:45 ?668次閱讀
    產(chǎn)品<b class='flag-5'>添加</b>與<b class='flag-5'>上</b>架API接口設計指南

    ROCm 6.2.4 成功移植至 SG2044: 大模型部署速率飆升,RISC-V + AI 新紀元!代碼已經(jīng)開源,一起來試試!

    。AMD7900xtxonSOPHGOSG2044PCLT團隊傾注心血,精心完成了將ROCm軟件棧適配到SG2044獨特架構的復雜工作。這包括:內(nèi)核級適配:確保ROCm驅(qū)動程序和底層組件能夠與SG
    的頭像 發(fā)表于 07-14 17:04 ?1198次閱讀
    <b class='flag-5'>ROCm</b> 6.2.4 成功移植至 SG2044: 大模型部署速率飆升,RISC-V + AI 新紀元!代碼已經(jīng)開源,一起來試試!

    無法使用OpenVINO? GPU 設備運行穩(wěn)定擴散文本到圖像的原因?

    OpenVINO? GPU 設備使用圖像大小 (1024X576) 運行穩(wěn)定擴散文本到圖像,并收到錯誤消息: RuntimeError: Exception from
    發(fā)表于 06-25 06:36

    為什么無法GPU使用INT8 和 INT4量化模型獲得輸出?

    安裝OpenVINO? 2024.0 版本。 使用 optimum-intel 程序包將 whisper-large-v3 模型轉(zhuǎn)換為 int 4 和 int8,并在 GPU 使用 OpenVINO? 運行推理。 沒有可用的
    發(fā)表于 06-23 07:11

    三大運營商將于今年下半年全面重啟esIM

    行業(yè)芯事行業(yè)資訊
    電子發(fā)燒友網(wǎng)官方
    發(fā)布于 :2025年06月19日 13:43:10

    英偉達擬再推中國特供GPU,今年6月量產(chǎn)!

    。 ??????????????????????????????????????????????????? 最新消息顯示,英偉達擬新推出一款專門面向中國市場的人工智能芯片,且最早將于今年6月開始量產(chǎn)。這款芯片屬于英偉達最新一代基于Blackwell架構的人工智能處理器,但其
    發(fā)表于 05-27 00:03 ?4796次閱讀

    如何通過SFL為設備添加Flash編程支持

    SEGGER Flash Loader(SFL)是J-Link設備支持套件(DSK)的一部分,通過SFL,用戶可以為自己的新設備添加Flash編程支持
    的頭像 發(fā)表于 05-19 16:35 ?1483次閱讀
    如何通過SFL為設備<b class='flag-5'>添加</b>Flash編程<b class='flag-5'>支持</b>

    摩爾線程GPU率先支持Qwen3全系列模型

    近日,阿里云正式發(fā)布Qwen3系列的8款開源混合推理模型。摩爾線程團隊模型發(fā)布當天,率先完成了Qwen3全系列模型全功能GPU
    的頭像 發(fā)表于 05-07 15:24 ?1023次閱讀