91欧美超碰AV自拍|国产成年人性爱视频免费看|亚洲 日韩 欧美一厂二区入|人人看人人爽人人操aV|丝袜美腿视频一区二区在线看|人人操人人爽人人爱|婷婷五月天超碰|97色色欧美亚州A√|另类A√无码精品一级av|欧美特级日韩特级

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

NVIDIA RAPIDS 25.06版本新增多項功能

NVIDIA英偉達企業(yè)解決方案 ? 來源:NVIDIA英偉達企業(yè)解決方案 ? 2025-09-09 09:54 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

RAPIDS 是一套面向 Python 數(shù)據(jù)科學的 NVIDIA CUDA-X 庫,最新發(fā)布的 25.06 版本引入了多項亮眼新功能,其中包括 Polars GPU 流執(zhí)行引擎——這是一種面向圖神經網絡(GNN)的統(tǒng)一 API,以及無需更改代碼即可實現(xiàn)的支持向量機加速功能。在本篇博客中,我們將介紹其中的幾項重要更新。

Polars GPU 引擎更新

2024 年 9 月,NVIDIA 與 Polars 團隊合作推出了基于 NVIDIA cuDF 開發(fā)的 Polars GPU 引擎。此次發(fā)布的 25.06 版對 Polars GPU 引擎的功能進行了重大更新。

流執(zhí)行器現(xiàn)已進入實驗階段

25.06 版在 Polars GPU 引擎中引入了流執(zhí)行功能。流執(zhí)行器利用數(shù)據(jù)分區(qū)和并行處理技術,能夠處理超出顯存容量的數(shù)據(jù)集。要使用這個新的流執(zhí)行器,用戶可以將恰當配置的 GPUEngine 對象傳遞給 Polars 的 collect 調用。

這種新的流模式還能讓用戶將數(shù)據(jù)處理工作流擴展到多個 GPU,有助于加速分析數(shù)百 GB 到 TB 級的數(shù)據(jù)集。對于需要在分區(qū)之間移動數(shù)據(jù)的操作(例如連接和分組),新引入的數(shù)據(jù)混洗(shuffle)機制可在設備之間重新分配數(shù)據(jù)。多 GPU 執(zhí)行通過 Dask 分布式調度器進行編排,使用前需要先設置一個 Dask 客戶端。

流執(zhí)行器目前仍在積極開發(fā)中,尚未支持的操作將自動回退到內存執(zhí)行器。

支持滾動聚合及更多列操作

最新版本還包含了對 Polars GPU 引擎中一些關鍵新 DataFrame 功能的支持。首先,我們在 Polars 中添加了對 .rolling() 操作的支持,允許用戶基于一些 DataFrame 中的其他列創(chuàng)建滾動組。這在處理時間序列數(shù)據(jù)集時尤為實用。

此外 GPU 引擎現(xiàn)在支持更豐富的日期時間列表達式,目前已支持的新方法包括 .strftime() 和 .cast_time_unit()。隨著我們繼續(xù)擴展整體 API 覆蓋范圍,未來版本還將支持更多方法。

統(tǒng)一的 GNN API

NVIDIA cuGraph-PyG 進一步集成了 WholeGraph 以加速特征提取,形成了我們所說的統(tǒng)一 API。這個新 API 現(xiàn)在允許用戶在單 GPU 工作流中使用 WholeGraph 的加速特征存儲,同時無需修改腳本即可用于多 GPU 或多節(jié)點工作流。

借助統(tǒng)一 API,在單 GPU 上進行原型開發(fā)時使用相同的 GNN 訓練腳本就能在具有多個 GPU 的單節(jié)點以及多節(jié)點上運行。通過 PyTorch 的 torchrun 命令管理進程設置,使得大多數(shù) PyTorch 用戶都可以熟練地使用統(tǒng)一 API。

無需更改代碼的 cuML 增強功能

今年 3 月,NVIDIA 推出了由 cuML 驅動、用于 scikit-learn 的無需更改代碼的加速器,該加速器已進入公測階段。在 25.06 版本中,cuML 為用戶帶來了更多無需更改代碼的功能。

無需更改代碼的支持向量機

NVIDIA cuML 擴展了其無需更改代碼的加速功能,新增了對支持向量機的支持。支持向量分類(SVC)和支持向量回歸(SVR)這兩種強大的算法在 GPU 上執(zhí)行時,能很好地處理高維數(shù)據(jù)并顯著地提升速度。通過在 cuML 的零代碼變更接口中添加這些估計器,利用支持向量機的現(xiàn)有 scikit-learn 工作流無需修改即可加速。cuML 和 scikit-learn 在 SVC 和 SVR 的實現(xiàn)上存在一些關鍵差異,還請用戶加以了解。

改進的 scikit-learn 兼容性

25.06 版本對 cuML 加速 scikit-learn 估計器的方式進行了重大重構,增強了 scikit-learn 一致性,還改進了參數(shù)驗證和異常處理。此外,通過這次重新設計,cuML 也增強了與 scikit-learn API 的兼容性,可以更輕松地加速目前與 scikit-learn 集成的第三方庫。

隨機森林與更新后的森林推理庫(FIL)集成

通過集成更快、更強大的森林推理庫(FIL),cuML 的隨機森林估計器得到了升級,在保持向后兼容性的同時,提供了更高的性能和更好的內存管理。

需注意,舊版特有的一些 API 調節(jié)參數(shù)(knobs)現(xiàn)已棄用,并將在即將發(fā)布的 25.08 版本中移除。

RAPIDS 內存管理器與NVIDIABlackwell 解壓縮引擎的兼容性

RAPIDS 內存管理器(RMM)庫增加了全新功能,確保用戶能夠使用最新的 NVIDIA 硬件功能。在最新版本中,RMM 異步內存資源可支持兼容 NVIDIA Blackwell GPU 上基于硬件的解壓縮引擎,讓 IO 密集型工作流中的性能得到提升。

此外,RMM 現(xiàn)在以一個預編譯共享庫的形式存在,取代了之前的僅包含頭文件的庫。我們相信這一變化將為未來解鎖新功能奠定基礎。

平臺更新:Python 和NVIDIA CUDA 支持

25.06 版本為所有 RAPIDS 庫添加了對 Python 3.13 的支持,同時也是最后一個支持 CUDA 11 的版本。從 25.08 版開始,RAPIDS 將不再支持 CUDA 11。如需繼續(xù)使用 CUDA 11,可以固定使用 25.06 版本。

結語

RAPIDS 25.06 版為新的機器學習算法帶來了零代碼變更功能、新的 Polars GPU 流引擎、異步內存資源的硬件解壓縮功能等多項功能。

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • NVIDIA
    +關注

    關注

    14

    文章

    5592

    瀏覽量

    109716
  • gpu
    gpu
    +關注

    關注

    28

    文章

    5194

    瀏覽量

    135427
  • 引擎
    +關注

    關注

    1

    文章

    368

    瀏覽量

    23451

原文標題:RAPIDS 新增 GPU Polars 流執(zhí)行等多項新功能

文章出處:【微信號:NVIDIA-Enterprise,微信公眾號:NVIDIA英偉達企業(yè)解決方案】歡迎添加關注!文章轉載請注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關推薦
    熱點推薦

    索尼更新相機遙控軟件開發(fā)包2.01版本

    2026年2月03日,索尼(中國)有限公司正式發(fā)布了可通過電腦遠程操控索尼相機的相機遙控軟件開發(fā)包(Camera Remote SDK)2.01版本,本次更新帶來了2個新功能新增支持機型ILCE-7M5、PXW-Z380、DS
    的頭像 發(fā)表于 02-03 16:59 ?655次閱讀

    西門子PCB DFM分析工具Valor NPI 2510版本新增功能

    Valor NPI 2510 版本新增多項檢查功能、提升制造風險識別,并推出令人矚目的 3D 可視化增強特性,這標志著產品的重大升級。Valor NPI 的 3D 視圖經過重新設計,讓可制造性設計 (DFM) 結果的查看更直觀、
    的頭像 發(fā)表于 01-04 16:10 ?395次閱讀
    西門子PCB DFM分析工具Valor NPI 2510<b class='flag-5'>版本</b>的<b class='flag-5'>新增</b><b class='flag-5'>功能</b>

    睿擎平臺v1.7.2版本正式發(fā)布|技術集結

    核心亮點:●RC3562新產品系列重磅上線●RC3506平臺新增多項核心功能RC3562新產品系列重磅推出RC3562作為睿擎平臺全新產品系列,具備以下核心優(yōu)勢:●默認集成AMP混合部署方案,提升
    的頭像 發(fā)表于 12-17 18:10 ?566次閱讀
    睿擎平臺v1.7.2<b class='flag-5'>版本</b>正式發(fā)布|技術集結

    NVIDIA CUDA 13.1版本新增功能與改進

    NVIDIA CUDA 13.1 是自 CUDA 二十年前發(fā)明以來,規(guī)模最大、內容最全面的一次更新。
    的頭像 發(fā)表于 12-13 10:08 ?2201次閱讀

    AMD Vivado Design Suite 2025.2版本現(xiàn)已發(fā)布

    AMD Vivado Design Suite 2025.2 版本現(xiàn)已發(fā)布,新增對 AMD Versal 自適應 SoC 的設計支持,包含新器件支持、QoR 功能及易用性增強。
    的頭像 發(fā)表于 12-09 15:11 ?941次閱讀

    連接標準聯(lián)盟正式推出Matter 1.5版本

    、土壤傳感器的支持,同時還新增多項能源管理功能。此次更新延續(xù)了 Matter 的核心使命,即簡化智能家居開發(fā)流程、增強設備互操作性,為消費者與開發(fā)者打造更豐富、更可持續(xù)的互操作體驗。
    的頭像 發(fā)表于 11-30 10:34 ?1076次閱讀

    開鴻Bot系列大版本更新:體驗穩(wěn)定升級,樂享高效協(xié)同!

    V5.0.1.22版本開鴻Bot系列今日,開鴻Bot系列迎來第二次大版本更新——V5.0.1.22。此次版本更新致力于進一步提升系統(tǒng)穩(wěn)定性與用戶體驗,新增多項實用
    的頭像 發(fā)表于 09-26 17:06 ?1346次閱讀
    開鴻Bot系列大<b class='flag-5'>版本</b>更新:體驗穩(wěn)定升級,樂享高效協(xié)同!

    匠芯創(chuàng)發(fā)布新版GUI開發(fā)工具 新增多國語言設置等功能

    。此次版本更新,為用戶帶來了諸多實用的新功能,進一步提升了設計體驗和開發(fā)效率。在V1.3.0版本中,AiUIBuilder新增了多國語言切換功能
    的頭像 發(fā)表于 08-07 15:36 ?1299次閱讀
    匠芯創(chuàng)發(fā)布新版GUI開發(fā)工具 <b class='flag-5'>新增多</b>國語言設置等<b class='flag-5'>功能</b>

    匠芯創(chuàng)發(fā)布新版GUI開發(fā)工具 新增多國語言設置等功能

    。此次版本更新,為用戶帶來了諸多實用的新功能,進一步提升了設計體驗和開發(fā)效率。 在V1.3.0版本中,AiUIBuilder新增了 多國語言切換功能
    發(fā)表于 07-16 13:54

    NVIDIA DOCA 3.0版本的亮點解析

    NVIDIA DOCA 框架已發(fā)展成為新一代 AI 基礎設施的重要組成部分。從初始版本到備受期待的 NVIDIA DOCA 3.0 發(fā)布,每個版本都擴展了
    的頭像 發(fā)表于 07-04 14:27 ?1237次閱讀
    <b class='flag-5'>NVIDIA</b> DOCA 3.0<b class='flag-5'>版本</b>的亮點解析

    CANoe產品體系19版本新特性及新增Option(上)

    版本持續(xù)助力當前車輛E/E架構中ECU開發(fā)驗證,同時賦能后續(xù)智能網聯(lián)電動車型預研驗證。新版本CANoe產品體系新增數(shù)據(jù)驅動的DDS、車輛互聯(lián)服務和高效電機模型庫,進一步支持CANXL
    的頭像 發(fā)表于 06-11 10:03 ?2911次閱讀
    CANoe產品體系19<b class='flag-5'>版本</b>新特性及<b class='flag-5'>新增</b>Option(上)

    NVIDIA在ICRA 2025展示多項最新研究成果

    在亞特蘭大舉行的國際機器人與自動化大會 (ICRA) 上,NVIDIA 展示了其在生成式 AI、仿真和自主操控領域的多項研究成果。
    的頭像 發(fā)表于 06-06 14:56 ?1408次閱讀

    深度操作系統(tǒng)deepin 23.1版本上線

    為優(yōu)化系統(tǒng)更新體驗并提升穩(wěn)定性,deepin 團隊發(fā)布 deepin 23.1 版本。此版本聚焦于解決基礎組件更新后的安裝效率問題,大幅提升新用戶安裝體驗,同時集成多項功能優(yōu)化與問題修
    的頭像 發(fā)表于 04-17 15:16 ?1554次閱讀

    NVIDIA虛擬GPU 18.0版本的亮點

    NVIDIA 虛擬 GPU(vGPU)技術可在虛擬桌面基礎設施(VDI)中解鎖 AI 功能,使其比以往更加強大、用途更加廣泛。vGPU 通過為各種虛擬化環(huán)境中的 AI 驅動工作負載提供動力,提高了
    的頭像 發(fā)表于 04-07 11:28 ?1429次閱讀

    Altium Designer 25.4.2版本的新功能

    在原理圖元件的屬性中,新增了對動態(tài)(條目級)參數(shù)的可見性支持。這些動態(tài)參數(shù)的值可以在源數(shù)據(jù)庫 / PLM系統(tǒng)中進行更改,并同步到已放置的工作區(qū)庫元件中,而無需創(chuàng)建這些元件的新修訂版本?,F(xiàn)在,當在
    的頭像 發(fā)表于 03-24 11:34 ?1904次閱讀
    Altium Designer 25.4.2<b class='flag-5'>版本</b>的新<b class='flag-5'>功能</b>