91欧美超碰AV自拍|国产成年人性爱视频免费看|亚洲 日韩 欧美一厂二区入|人人看人人爽人人操aV|丝袜美腿视频一区二区在线看|人人操人人爽人人爱|婷婷五月天超碰|97色色欧美亚州A√|另类A√无码精品一级av|欧美特级日韩特级

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

利用NVIDIA RAPIDS加速DolphinDB Shark平臺提升計算性能

NVIDIA英偉達(dá)企業(yè)解決方案 ? 來源:NVIDIA英偉達(dá)企業(yè)解決方案 ? 2024-09-09 09:57 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

DolphinDB 是一家高性能數(shù)據(jù)庫研發(fā)企業(yè),也是 NVIDIA 初創(chuàng)加速計劃成員,其開發(fā)的產(chǎn)品基于高性能分布式時序數(shù)據(jù)庫,是支持復(fù)雜計算和流數(shù)據(jù)分析的實時計算平臺,適用于金融、電力、物聯(lián)網(wǎng)和零售等行業(yè)。

DolphinDB 公司推出的 CPU-GPU 異構(gòu)計算平臺 Shark,將 DolphinDB 上的復(fù)雜指標(biāo)計算能力無縫切換到 GPU 算力平臺,從而大幅提升了計算性能。

DolphinDB 開發(fā)團(tuán)隊與 NVIDIA 團(tuán)隊合作,通過利用NVIDIA RAPIDS加速 Shark 異構(gòu)計算平臺的因子挖掘算法運行效率,幫助 Shark 將因子挖掘的效率提升 2 - 10 倍,并基于NVIDIA cuDF實現(xiàn) Shark 因子高效計算,大幅減少開發(fā)成本,縮短開發(fā)周期。

RAPIDS 的 RMM 是一套開源的內(nèi)存/顯存管理庫,提供 C++Python 接口,相比 cuMalloc、cuFree 等操作來講,具有更好的性能和靈活性;RAPIDS libcudf 是基于 GPU 的 C++ DataFrame 庫,提供了基礎(chǔ)數(shù)據(jù)結(jié)構(gòu),并且內(nèi)置了基礎(chǔ)的函數(shù)算子。

Shark 的因子挖掘功能,能通過利用遺傳算法從數(shù)據(jù)中挖掘出有效的因子。在這一場景中,遺傳算法會隨機(jī)生成大量因子并進(jìn)行計算。這一過程會頻繁地創(chuàng)建和釋放臨時空間來存儲中間結(jié)果,直接使用原生的 CUDA C 顯存分配和釋放接口,會嚴(yán)重降低執(zhí)行效率。

Shark 的因子計算功能,針對金融領(lǐng)域的數(shù)據(jù)分析與處理,提供了豐富的函數(shù)庫。如果從零開始將 CPU 的函數(shù)遷移至 GPU,需要為 GPU 重新實現(xiàn)一套底層數(shù)據(jù)結(jié)構(gòu)以及基礎(chǔ)計算函數(shù),會導(dǎo)致開發(fā)周期的延長以及開發(fā)成本的增加。

基于以上挑戰(zhàn),DolphinDB 開發(fā)團(tuán)隊與 NVIDIA 團(tuán)隊及 RAPIDS 開發(fā)團(tuán)隊合作,通過利用 RAPIDS RMM,解決因子挖掘過程中頻繁申請和釋放顯存導(dǎo)致的性能問題;通過基于 RAPIDS libcudf 進(jìn)行二次開發(fā),實現(xiàn)因子計算,從而縮短開發(fā)周期,降低開發(fā)成本。

Shark 進(jìn)行因子挖掘時,會通過遺傳算法隨機(jī)生成海量的因子計算公式。這些公式長度不等,接受的參數(shù)數(shù)量也不盡相同。因此在計算時,需要頻繁地申請和釋放臨時空間用于存儲中間結(jié)果。DolphinDB 開發(fā)團(tuán)隊通過使用 RMM 對顯存進(jìn)行池化,從而對中間結(jié)果所使用的顯存進(jìn)行高效地分配、釋放和重用。

Shark 支持用戶輸入自定義的公式,自動將自定義公式轉(zhuǎn)換為計算圖,并在 GPU 完成計算,從而加快數(shù)據(jù)分析和處理的效率。如果從零開始將 DolphinDB 的計算函數(shù)遷移至 Shark,則需要在 GPU 構(gòu)建 array、table 等底層數(shù)據(jù)結(jié)構(gòu),并實現(xiàn)大量基礎(chǔ)計算函數(shù)。經(jīng)過調(diào)研后,DolphinDB 開發(fā)團(tuán)隊決定基于 RAPIDS libcudf 進(jìn)行二次開發(fā),復(fù)用 cuDF 的 column、table 等底層數(shù)據(jù)結(jié)構(gòu),并借助 cuDF 的 groupby 和 rolling 框架,只需要完成算子的核心計算邏輯,即可完成 DolphinDB 時序算子和橫截面算子的遷移,這樣不僅極大提升了開發(fā)效率,還降低了開發(fā)成本。

下圖展示了在不同規(guī)模數(shù)據(jù)下,使用 RAPIDS 的 RMM 顯存管理庫相對于原生的 CUDA 顯存分配 API,Shark 因子挖掘效率的對比。可以清楚地看到,使用 RMM 可以顯著提升 Shark 因子挖掘效率,最高可達(dá)到 10 倍的加速比。

50de12f3c871da8be6a7494a93111a82.png

除此之外,Shark 通過使用 RAPIDS libcudf,大大提升了因子的計算效率。下圖中對比了 1000 個 group,每個 group 有 10 萬行的數(shù)據(jù),采用分組方式計算下面的算子??梢钥吹脚c CPU 相比,利用 GPU 總體耗時(包含拷貝時間),基本達(dá)到了一個數(shù)量級的加速比。

75c03a398e3c2fe4ee975f744d834f86.png

借助 RAPIDS ,Shark 的因子挖掘效率提升了 10 倍。除此之外,基于 cuDF 進(jìn)行二次開發(fā),只需要實現(xiàn)算子的核心邏輯,就可以達(dá)到一個數(shù)量級的加速,并極大降低了算子遷移成本。

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • NVIDIA
    +關(guān)注

    關(guān)注

    14

    文章

    5594

    瀏覽量

    109732
  • gpu
    gpu
    +關(guān)注

    關(guān)注

    28

    文章

    5194

    瀏覽量

    135450
  • 數(shù)據(jù)庫
    +關(guān)注

    關(guān)注

    7

    文章

    4020

    瀏覽量

    68349

原文標(biāo)題:NVIDIA RAPIDS 助力 Shark 平臺實現(xiàn)高效數(shù)據(jù)挖掘和計算

文章出處:【微信號:NVIDIA-Enterprise,微信公眾號:NVIDIA英偉達(dá)企業(yè)解決方案】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關(guān)推薦
    熱點推薦

    NVIDIA DGX SuperPOD為Rubin平臺橫向擴(kuò)展提供藍(lán)圖

    NVIDIA DGX Rubin 系統(tǒng)整合了 NVIDIA計算、網(wǎng)絡(luò)和軟件領(lǐng)域的最新突破,將推理 token 成本降至 NVIDIA Blackwell
    的頭像 發(fā)表于 01-14 09:14 ?609次閱讀

    利用NVIDIA Cosmos開放世界基礎(chǔ)模型加速物理AI開發(fā)

    NVIDIA 最近發(fā)布了 NVIDIA Cosmos 開放世界基礎(chǔ)模型(WFM)的更新,旨在加速物理 AI 模型的測試與驗證數(shù)據(jù)生成。借助 NVIDIA Omniverse 庫和 Co
    的頭像 發(fā)表于 12-01 09:25 ?1135次閱讀

    NVIDIA Spectrum-X 以太網(wǎng)交換機(jī)助力 Meta 和 Oracle 加速網(wǎng)絡(luò)性能

    Facebook 開放交換系統(tǒng)平臺。 Oracle 采用 Spectrum-X 以太網(wǎng)交換機(jī)構(gòu)建十億瓦級(Giga-Scale)AI 超級計算機(jī)。 NVIDIA 宣布 Meta 和 Oracle 將升級為
    的頭像 發(fā)表于 10-14 10:26 ?1797次閱讀
    <b class='flag-5'>NVIDIA</b> Spectrum-X 以太網(wǎng)交換機(jī)助力 Meta 和 Oracle <b class='flag-5'>加速</b>網(wǎng)絡(luò)<b class='flag-5'>性能</b>

    Cadence 借助 NVIDIA DGX SuperPOD 模型擴(kuò)展數(shù)字孿生平臺庫,加速 AI 數(shù)據(jù)中心部署與運營

    [1]? 利用搭載 DGX GB200 系統(tǒng)的 NVIDIA DGX SuperPOD[2]?數(shù)字孿生系統(tǒng)實現(xiàn)了庫的重大擴(kuò)展 。借助 NVIDIA性能
    的頭像 發(fā)表于 09-15 15:19 ?1508次閱讀

    NVIDIA RAPIDS 25.06版本新增多項功能

    RAPIDS 是一套面向 Python 數(shù)據(jù)科學(xué)的 NVIDIA CUDA-X 庫,最新發(fā)布的 25.06 版本引入了多項亮眼新功能,其中包括 Polars GPU 流執(zhí)行引擎——這是一種面向圖
    的頭像 發(fā)表于 09-09 09:54 ?1064次閱讀

    如何利用硬件加速提升通信協(xié)議的安全性?

    產(chǎn)品實拍圖 利用硬件加速提升通信協(xié)議安全性,核心是通過 專用硬件模塊或可編程硬件 ,承接軟件層面難以高效處理的安全關(guān)鍵操作(如加密解密、認(rèn)證、密鑰管理等),在提升
    的頭像 發(fā)表于 08-27 09:59 ?978次閱讀
    如何<b class='flag-5'>利用</b>硬件<b class='flag-5'>加速</b><b class='flag-5'>提升</b>通信協(xié)議的安全性?

    NVIDIA助力CoreWeave云平臺性能升級

    AI 變革正在重塑數(shù)據(jù)中心格局,亟需能夠提供更靈活、高性價比的計算和數(shù)據(jù)能力的平臺。為了滿足這些需求,作為推動 AI 變革的超大規(guī)模云服務(wù)提供商,CoreWeave 致力于開發(fā)一種用于加速計算
    的頭像 發(fā)表于 07-23 10:49 ?1296次閱讀
    <b class='flag-5'>NVIDIA</b>助力CoreWeave云<b class='flag-5'>平臺</b><b class='flag-5'>性能</b>升級

    全球各大品牌利用NVIDIA AI技術(shù)提升運營效率

    歐萊雅、LVMH 集團(tuán)和雀巢利用 NVIDIA 加速的智能體 AI 和物理 AI,大幅提升產(chǎn)品設(shè)計、營銷及物流等方面的運營效率。
    的頭像 發(fā)表于 06-19 14:36 ?1204次閱讀

    NVIDIA技術(shù)助力歐洲廠商推出機(jī)器人系統(tǒng)與平臺

    基于 NVIDIA 安全的全棧機(jī)器人開發(fā)平臺,Agile?Robots、Humanoid、Neura?Robotics、Universal Robots、Vorwerk?和?Wandelbots 等公司推出 NVIDIA
    的頭像 發(fā)表于 06-16 13:54 ?1472次閱讀

    NVIDIA助力解決量子計算領(lǐng)域重大挑戰(zhàn)

    NVIDIA 加速量子研究中心提供了強大的工具,助力解決量子計算領(lǐng)域的重大挑戰(zhàn)。
    的頭像 發(fā)表于 03-27 09:17 ?1265次閱讀

    Cognizant將與NVIDIA合作部署神經(jīng)人工智能平臺,加速企業(yè)人工智能應(yīng)用

    -Cognizant將與NVIDIA合作部署神經(jīng)人工智能平臺,加速企業(yè)人工智能應(yīng)用 Cognizant將在關(guān)鍵增長領(lǐng)域提供解決方案,包括企業(yè)級AI智能體、定制化行業(yè)大型語言模型及搭載NVIDI
    的頭像 發(fā)表于 03-26 14:42 ?742次閱讀
    Cognizant將與<b class='flag-5'>NVIDIA</b>合作部署神經(jīng)人工智能<b class='flag-5'>平臺</b>,<b class='flag-5'>加速</b>企業(yè)人工智能應(yīng)用

    使用NVIDIA CUDA-X庫加速科學(xué)和工程發(fā)展

    NVIDIA GTC 全球 AI 大會上宣布,開發(fā)者現(xiàn)在可以通過 CUDA-X 與新一代超級芯片架構(gòu)的協(xié)同,實現(xiàn) CPU 和 GPU 資源間深度自動化整合與調(diào)度,相較于傳統(tǒng)加速計算架構(gòu),該技術(shù)可使
    的頭像 發(fā)表于 03-25 15:11 ?1533次閱讀

    Cadence 利用 NVIDIA Grace Blackwell 加速AI驅(qū)動的工程設(shè)計和科學(xué)應(yīng)用

    融合設(shè)計專業(yè)知識與加速計算,推動科技創(chuàng)新、實現(xiàn)能效和工程生產(chǎn)力方面的突破性進(jìn)展,引領(lǐng)全球生活新范式 內(nèi)容提要 ●?Cadence 借助 NVIDIA 最新 Blackwell 系統(tǒng),將求解器的速度
    的頭像 發(fā)表于 03-24 10:14 ?1418次閱讀

    英偉達(dá)GTC2025亮點:NVIDIA Blackwell加速計算機(jī)輔助工程軟件,實現(xiàn)實時數(shù)字孿生性能數(shù)量級提升

    、Altair、Cadence、Siemens 和 Synopsys 等在內(nèi)的領(lǐng)先計算機(jī)輔助工程(CAE)軟件供應(yīng)商正在使用 NVIDIA Blackwell 平臺加速其仿真工具,速度
    的頭像 發(fā)表于 03-21 15:12 ?1494次閱讀

    Oracle 與 NVIDIA 合作助力企業(yè)加速代理式 AI 推理

    ——Oracle 和 NVIDIA 今日宣布,NVIDIA 加速計算和推理軟件與 Oracle 的 AI 基礎(chǔ)設(shè)施以及生成式 AI 服務(wù)首次實現(xiàn)集成,以幫助全球企業(yè)組織
    發(fā)表于 03-19 15:24 ?577次閱讀
    Oracle 與 <b class='flag-5'>NVIDIA</b> 合作助力企業(yè)<b class='flag-5'>加速</b>代理式 AI 推理