91欧美超碰AV自拍|国产成年人性爱视频免费看|亚洲 日韩 欧美一厂二区入|人人看人人爽人人操aV|丝袜美腿视频一区二区在线看|人人操人人爽人人爱|婷婷五月天超碰|97色色欧美亚州A√|另类A√无码精品一级av|欧美特级日韩特级

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

AMD ROCm 6.1升級MIPOpen 3.1,引入AI參數預測模型

微云疏影 ? 來源:綜合整理 ? 作者:綜合整理 ? 2024-02-29 14:33 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

據最新消息,自 AMD 去年 12 月份公布 ROCm 6.0 以來,已經開始積極籌備 6.1 版的發(fā)布,以提高與英偉達(NVIDIA)CUDA 競爭的核心實力。

在此期間,AMD 頻繁向GitHub公共倉庫推送有關 ROCm 6.1 的最新開發(fā)進展,透露出不久后有可能正式上線新版本的意圖。

據悉,此次 ROCm 6.1 主要的突破在于其升級至全新版本的 MIPOpen 3.1;新增了使用AI進行參數預測的 conv_hip_igemm_group_fwd_xdlops 求解器;解決了當前版本的眾多 BUG,以及引入了新的求解器算法。

此外,該系列還努力提升了系統(tǒng)性能,尤其是優(yōu)化了MIGraphX功能,包含但不限于加入對FP8精度的支持,以及增加更多運算符等,同時更新了針對 Whisper / Llama-2 / Stable Diffusion 2.1 的文檔示例,以及提供新的ONNX示例,以便更好地適應 GEMM 的BLAS自動調整。

更重要的是,為了改善在Microsoft Windows 環(huán)境下運行 MIGraphX的效率,AMD特別推出了全新的“hipother”資源庫。

值得一提的是,HIP 技術是AMD專有的C++運行時API和內核語言,適配可移植的AMD/NVIDIA GPU應用程序,而HIPIFY 工具則能協(xié)助將CUDA源碼便捷地轉化成HIP腳本。

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • amd
    amd
    +關注

    關注

    25

    文章

    5684

    瀏覽量

    139947
  • 英偉達
    +關注

    關注

    23

    文章

    4087

    瀏覽量

    99174
  • 求解器
    +關注

    關注

    0

    文章

    85

    瀏覽量

    4936
收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關推薦
    熱點推薦

    模型 ai coding 比較

    序 我主要用途是 ai coding,從各種渠道獲取到了很多 不同的大模型排序 最多的是 opus 4.6 > k2.5 > glm5 >
    發(fā)表于 02-19 13:43

    使用NORDIC AI的好處

    不依賴持續(xù)聯(lián)網,整體系統(tǒng)可靠性更高。[Edge AI 概述; Nordic Edge AI 技術頁] 覆蓋從“小 MCU”到“高性能 SoC”的完整產品線 Neuton 模型 :超小模型
    發(fā)表于 01-31 23:16

    Robotec.aiAMD Silo AI的合作實踐

    AMD Silo AI 正與領先的機器人應用仿真平臺開發(fā)商 Robotec.ai 合作,優(yōu)化和擴展基于 AMD GPU 和 ROCm 軟件堆
    的頭像 發(fā)表于 01-28 16:23 ?466次閱讀

    ROCm部署PP-StructureV3到AMD GPU上

    作者:AVNET 李鑫杰 我們在上一篇文章中介紹了ROCm+PP-OCRv5,為實現(xiàn)在AMD計算平臺上完成復雜文檔的端到端智能解析,本文基于ROCm軟件棧,提供一套完整的PP-StructureV3
    的頭像 發(fā)表于 11-13 16:56 ?5532次閱讀
    用<b class='flag-5'>ROCm</b>部署PP-StructureV3到<b class='flag-5'>AMD</b> GPU上

    AMD Vitis AI 5.1測試版現(xiàn)已開放下載

    AMD Vitis AI 5.1全新發(fā)布——新增了對 AMD Versal AI Edge 系列神經網絡處理單元( NPU )的支持。Vitis A
    的頭像 發(fā)表于 11-08 09:24 ?1307次閱讀

    AMD Vitis AI 5.1測試版發(fā)布

    AMD Vitis AI 5.1全新發(fā)布——新增了對 AMD Versal AI Edge 系列神經網絡處理單元 (NPU) 的支持。Vitis A
    的頭像 發(fā)表于 10-31 12:46 ?793次閱讀

    AI模型的配置AI模型該怎么做?

    STM32可以跑AI,這個AI模型怎么搞,知識盲區(qū)
    發(fā)表于 10-14 07:14

    明遠智睿RK3568核心板如何助力工業(yè)4.0升級

    著工業(yè)升級的成效。某汽車工廠引入明遠智睿基于瑞芯微RK3568打造的核心板解決方案后,生產效率顯著提升30%,這一案例不僅驗證了該核心板的卓越性能,更展現(xiàn)了其在推動工業(yè)4.0升級過程中的關鍵作用。深入剖析這一應用案例,我們能清晰
    的頭像 發(fā)表于 09-04 17:42 ?840次閱讀

    Cognizant加速AI模型企業(yè)開發(fā)

    -Cognizant推出AI Training Data Services,助力企業(yè)AI模型加速開發(fā) Cognizant是數據與AI
    的頭像 發(fā)表于 07-31 17:25 ?707次閱讀

    訊飛星火X1升級版正式上線

    今天,基于全國產算力訓練的深度推理大模型——訊飛星火X1升級版正式上線。
    的頭像 發(fā)表于 07-30 14:12 ?2044次閱讀
    訊飛星火X1<b class='flag-5'>升級</b>版正式上線

    ROCm 6.2.4 成功移植至 SG2044: 大模型部署速率飆升,RISC-V + AI 新紀元!代碼已經開源,一起來試試!

    。AMD7900xtxonSOPHGOSG2044PCLT團隊傾注心血,精心完成了將ROCm軟件棧適配到SG2044獨特架構的復雜工作。這包括:內核適配:確保ROCm驅動程序和底層組
    的頭像 發(fā)表于 07-14 17:04 ?1198次閱讀
    <b class='flag-5'>ROCm</b> 6.2.4 成功移植至 SG2044: 大<b class='flag-5'>模型</b>部署速率飆升,RISC-V + <b class='flag-5'>AI</b> 新紀元!代碼已經開源,一起來試試!

    JDK從8升級到21的問題集

    一、背景與挑戰(zhàn) 1. 升級動因 ?Oracle長期支持策略 ?現(xiàn)代特性需求:協(xié)程、模式匹配、ZGC等 ?安全性與性能的需求 ?AI新技術引入的版本要求 2. 項目情況 ?100+項目并行升級
    的頭像 發(fā)表于 06-06 16:49 ?843次閱讀

    DevEco Studio AI輔助開發(fā)工具兩大升級功能 鴻蒙應用開發(fā)效率再提升

    帶來了前所未有的智能問答體驗。 RAG增強型與傳統(tǒng)生成式AI的關鍵差異: 圖2:DeepSeek模型增強RAG能力前后效果對比圖 升級點2:新增代碼解釋功能,提升初學者開發(fā)效率 針對
    發(fā)表于 04-18 14:43

    首創(chuàng)開源架構,天璣AI開發(fā)套件讓端側AI模型接入得心應手

    ,聯(lián)發(fā)科帶來了全面升級的天璣AI開發(fā)套件2.0,在模型庫規(guī)模、架構開放程度、前沿端側AI技術支持和端側LoRA訓練落地等方面均迎來全面躍遷,為開發(fā)者提供了更全面、更開放、更強大的端側
    發(fā)表于 04-13 19:52

    6.12.1升級到6.13老是閃退是什么原因導致的?

    6.12.1升級到6.13老是閃退,回到6.12.1又正常,問一下大家是什么原因導致,有什么解決辦法?
    發(fā)表于 03-11 08:13