91欧美超碰AV自拍|国产成年人性爱视频免费看|亚洲 日韩 欧美一厂二区入|人人看人人爽人人操aV|丝袜美腿视频一区二区在线看|人人操人人爽人人爱|婷婷五月天超碰|97色色欧美亚州A√|另类A√无码精品一级av|欧美特级日韩特级

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

如何使用PyCaret + RAPIDS簡化模型構(gòu)建

星星科技指導(dǎo)員 ? 來源:NVIDIA ? 作者:Sofia Sayyah ? 2022-04-19 16:32 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

PyCaret是一個低代碼 Python 機器學(xué)習(xí)庫,基于流行的 R Caret 庫。它自動化了從數(shù)據(jù)預(yù)處理到 i NSight 的數(shù)據(jù)科學(xué)過程,因此短代碼行可以用最少的人工完成每個步驟。此外,使用簡單的命令比較和調(diào)整許多模型的能力可以簡化效率和生產(chǎn)效率,同時減少創(chuàng)建有用模型的時間。

PyCaret 團隊在 2 . 2 版中添加了 NVIDIA GPU 支持,包括RAPIDS中所有最新和最偉大的版本。使用 GPU 加速, PyCaret 建模時間可以快 2 到 200 倍,具體取決于工作負(fù)載。

這篇文章將介紹如何在 GPU 上使用 PyCaret 以節(jié)省大量的開發(fā)和計算成本。

所有基準(zhǔn)測試都是在一臺 32 核 CPU 和四個 NVIDIA Tesla T4 的機器上運行的,代碼幾乎相同。為簡單起見, GPU 代碼編寫為在單個 GPU 上運行。

PyCaret 入門

使用 PyCaret 與導(dǎo)入庫和執(zhí)行 setup 語句一樣簡單。setup()功能創(chuàng)建環(huán)境,并提供一系列預(yù)處理功能,一氣呵成。

from pycaret.regression import * exp_reg = setup(data = df, target = ‘Year’, session_id = 123, normalize = True)

在一個簡單的設(shè)置之后,數(shù)據(jù)科學(xué)家可以開發(fā)其管道的其余部分,包括數(shù)據(jù)預(yù)處理/準(zhǔn)備、模型訓(xùn)練、集成、分析和部署。在準(zhǔn)備好數(shù)據(jù)后,最好從比較模型開始。

與 PyCaret 的簡約精神一樣,我們可以通過一行代碼來比較一系列標(biāo)準(zhǔn)模型,看看哪些模型最適合我們的數(shù)據(jù)。 compare _ models 命令使用默認(rèn)超參數(shù)訓(xùn)練 PyCaret 模型庫中的所有模型,并使用交叉驗證評估性能指標(biāo)。然后,數(shù)據(jù)科學(xué)家可以根據(jù)這些信息選擇他們想要使用的模型、調(diào)整和集成。

top3 = compare_models(exclude = [‘ransac’], n_select=3)

比較模型

pYYBAGJec6KAEuJVAAJfAB5I3Mw802.png

圖 1 : PyCaret 中 compare _ models 命令的輸出。

**模型從最佳到最差排序, PyCaret 突出顯示了每個度量類別中的最佳結(jié)果,以便于使用。

用 RAPIDS cuML 加速 PyCaret

PyCaret 對于任何數(shù)據(jù)科學(xué)家來說都是一個很好的工具,因為它簡化了模型構(gòu)建并使運行許多模型變得簡單。使用 GPU s , PyCaret 可以做得更好。由于 PyCaret 在幕后做了大量工作,因此看似簡單的命令可能需要很長時間。例如,我們在一個具有大約 50 萬個實例和 90 多個屬性(加州大學(xué)歐文分校的年度預(yù)測 MSD 數(shù)據(jù)集)的數(shù)據(jù)集上運行了前面的命令。在 CPU 上,花費了 3 個多小時。在 GPU 上,只花了不到一半的時間。

在過去,在 GPU 上使用 PyCaret 需要許多手動編碼,但謝天謝地, PyCaret 團隊集成了 RAPIDS 機器學(xué)習(xí)庫( cuML ),這意味著您可以使用使 PyCaret 如此有效的相同簡單 API ,同時還可以使用 GPU 的計算能力。

在 GPU 上運行 PyCaret 往往要快得多,這意味著您可以充分利用 PyCaret 提供的一切,而無需平衡時間成本。使用剛才提到的同一個數(shù)據(jù)集,我們在 CPU 和 GPU 上測試了 PyCaret ML 功能,包括比較、創(chuàng)建、調(diào)優(yōu)和集成模型。切換到 GPU 很簡單;我們在設(shè)置函數(shù)中將use_gpu設(shè)置為True:

exp_reg = setup(data = df, target = ‘Year’, session_id = 123, normalize = True, use_gpu = True)

PyCaret 設(shè)置為在 GPU 上運行,它使用 cuML 來訓(xùn)練以下所有型號:

對數(shù)幾率回歸

脊分類器

隨機森林

K 鄰域分類器

K 鄰域回歸器

支持向量機

線性回歸

嶺回歸

套索回歸

群集分析

基于密度的空間聚類

僅在 GPU 上運行相同的compare_models代碼的速度是 GPU 的2.5倍多。

對于流行但計算昂貴的模型,在模型基礎(chǔ)上的影響更大。例如, K 鄰域回歸器在 GPU 上的速度是其 265 倍。

poYBAGJec6aAZgk7AABQVDYtMHQ115.png

圖 2 : CPU 和 GPU 上運行的常見 PyCaret 操作的比較。

影響

PyCaret API 的簡單性釋放了原本用于編碼的時間,因此數(shù)據(jù)科學(xué)家可以做更多的實驗并對實驗進行微調(diào)。當(dāng)與 GPU 配合使用時,這種影響甚至更大,因為充分利用 PyCaret 的評估和比較工具套件的計算成本顯著降低。

結(jié)論

廣泛的比較和評估模型有助于提高結(jié)果的質(zhì)量,而 PyCaret 正是為了這樣做。 GPU 上的 PyCaret 抵消了大量處理所帶來的時間成本。

RAPIDS 的目標(biāo)是加速您的數(shù)據(jù)科學(xué), PyCaret 是越來越多的庫之一,它們與 RAPIDS 套件的兼容性有助于為您的機器學(xué)習(xí)追求帶來新的效率。

關(guān)于作者

Sofia Sayyah 是 NVIDIA 的數(shù)據(jù)工程實習(xí)生。

審核編輯:郭婷

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • gpu
    gpu
    +關(guān)注

    關(guān)注

    28

    文章

    5218

    瀏覽量

    135680
  • 機器學(xué)習(xí)
    +關(guān)注

    關(guān)注

    66

    文章

    8558

    瀏覽量

    137069
收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關(guān)推薦
    熱點推薦

    工作流大模型節(jié)點說明

    用與端側(cè)匹配版本的插件進行返回。 配置技能后,大模型節(jié)點的能力更接近一個獨立運行的智能體,可以自動進行意圖識別,并判斷調(diào)用技能的時機和方式,大幅度提高此節(jié)點的文本處理能力和文本生成效果,簡化
    發(fā)表于 03-19 14:56

    如何構(gòu)建適合自動駕駛的世界模型?

    [首發(fā)于智駕最前沿微信公眾號]世界模型經(jīng)歷了系統(tǒng)動力學(xué)階段(1960年~2000年)、認(rèn)知科學(xué)階段(2001年~2017年)、深度學(xué)習(xí)階段(2018年至今),但將其應(yīng)用到自動駕駛汽車上,還是近幾年才
    的頭像 發(fā)表于 02-18 08:14 ?1.1w次閱讀
    如何<b class='flag-5'>構(gòu)建</b>適合自動駕駛的世界<b class='flag-5'>模型</b>?

    安寶特產(chǎn)品丨3DE-實體模型簡化-快捷簡化和表面收縮

    CAD 實體模型如何輕量化?快捷簡化與表面收縮助力版權(quán)保護和營銷素材制作成本優(yōu)化。
    的頭像 發(fā)表于 12-01 13:28 ?309次閱讀
    安寶特產(chǎn)品丨3DE-實體<b class='flag-5'>模型</b><b class='flag-5'>簡化</b>-快捷<b class='flag-5'>簡化</b>和表面收縮

    構(gòu)建CNN網(wǎng)絡(luò)模型并優(yōu)化的一般化建議

    通過實踐,本文總結(jié)了構(gòu)建CNN網(wǎng)絡(luò)模型并優(yōu)化的一般化建議,這些建議將會在構(gòu)建高準(zhǔn)確率輕量級CNN神經(jīng)網(wǎng)絡(luò)模型方面提供幫助。 1)避免單層神經(jīng)網(wǎng)絡(luò):我們清楚神經(jīng)網(wǎng)絡(luò)本身是需要不斷抽象出
    發(fā)表于 10-28 08:02

    如何在vivadoHLS中使用.TLite模型

    測試 在Vivado HLS中運行綜合、高級綜合和RTL仿真,確保設(shè)計正確。 注意事項 以上步驟是一個簡化的示例,具體的實現(xiàn)可能因您的模型和需求而有所不同。在實際應(yīng)用中,您可能需要進一步優(yōu)化接口和數(shù)據(jù)傳輸,以滿足性能和資源要求。
    發(fā)表于 10-22 06:29

    NVIDIA RAPIDS 25.06版本新增多項功能

    RAPIDS 是一套面向 Python 數(shù)據(jù)科學(xué)的 NVIDIA CUDA-X 庫,最新發(fā)布的 25.06 版本引入了多項亮眼新功能,其中包括 Polars GPU 流執(zhí)行引擎——這是一種面向圖
    的頭像 發(fā)表于 09-09 09:54 ?1114次閱讀

    構(gòu)建適用于三維集成系統(tǒng)的互連線長分布模型

    在三維集成電路設(shè)計中,TSV技術(shù)通過垂直互連顯著優(yōu)化了互連線長分布特性。基于倫特定律的經(jīng)典分析框架,可構(gòu)建適用于三維集成系統(tǒng)的互連線長分布模型。
    的頭像 發(fā)表于 08-21 10:41 ?1184次閱讀
    <b class='flag-5'>構(gòu)建</b>適用于三維集成系統(tǒng)的互連線長分布<b class='flag-5'>模型</b>

    實現(xiàn)SSC-EARSM湍流模型的關(guān)鍵技術(shù)

    簡化基線顯式代數(shù)雷諾應(yīng)力模型(S-BSL-EARSM)相比,分離敏感型修正顯式代數(shù)雷諾應(yīng)力模型(SSC-EARSM)旨在更好地預(yù)測分離流動。
    的頭像 發(fā)表于 08-13 15:08 ?750次閱讀
    實現(xiàn)SSC-EARSM湍流<b class='flag-5'>模型</b>的關(guān)鍵技術(shù)

    瑞芯微模型量化文件構(gòu)建

    模型是一張圖片輸入時,量化文件如上圖所示。但是我現(xiàn)在想量化deepprivacy人臉匿名模型,他的輸入是四個輸入。該模型訓(xùn)練時數(shù)據(jù)集只標(biāo)注了人臉框和關(guān)鍵點,該模型的預(yù)處理是放到
    發(fā)表于 06-13 09:07

    知識分享 | 評估模型架構(gòu)——如何實現(xiàn)?

    確保良好的模型架構(gòu)對于開發(fā)安全和可靠的軟件非常重要。本文為您介紹MES Model Examiner? (MXAM)如何優(yōu)化模型架構(gòu),簡化復(fù)雜度管理步驟,并最終提升軟件質(zhì)量。
    的頭像 發(fā)表于 06-05 11:46 ?681次閱讀
    知識分享 | 評估<b class='flag-5'>模型</b>架構(gòu)——如何實現(xiàn)?

    碳化硅襯底厚度測量中探頭溫漂的熱傳導(dǎo)模型與實驗驗證

    引言 在碳化硅襯底厚度測量過程中,探頭溫漂會嚴(yán)重影響測量精度。構(gòu)建探頭溫漂的熱傳導(dǎo)模型并進行實驗驗證,有助于深入理解探頭溫漂的產(chǎn)生機理,為提高測量準(zhǔn)確性提供理論依據(jù)與技術(shù)支持。 熱傳導(dǎo)模型構(gòu)
    的頭像 發(fā)表于 06-04 09:37 ?565次閱讀
    碳化硅襯底厚度測量中探頭溫漂的熱傳導(dǎo)<b class='flag-5'>模型</b>與實驗驗證

    如何使用Docker部署大模型

    隨著深度學(xué)習(xí)和大模型的快速發(fā)展,如何高效地部署這些模型成為了一個重要的挑戰(zhàn)。Docker 作為一種輕量級的容器化技術(shù),能夠?qū)?b class='flag-5'>模型及其依賴環(huán)境打包成一個可移植的容器,極大地簡化了部署流程
    的頭像 發(fā)表于 05-24 16:39 ?1206次閱讀

    望石智慧基于亞馬遜云科技構(gòu)建醫(yī)藥行業(yè)專屬大模型 推動藥物研發(fā)創(chuàng)新

    北京 ——2025 年 5 月 13 日 創(chuàng)新型生物醫(yī)藥科技企業(yè)望石智慧應(yīng)用亞馬遜云科技的底層基礎(chǔ)設(shè)施、高性能計算和存儲等技術(shù)與服務(wù),構(gòu)建多模態(tài)3D分子生成大模型,在降低運維負(fù)擔(dān)與成本的同時,推動
    發(fā)表于 05-13 14:21 ?1097次閱讀

    小白學(xué)大模型:從零實現(xiàn) LLM語言模型

    ://github.com/FareedKhan-dev/train-llm-from-scratch本文將為你提供一個簡單直接的方法,從下載數(shù)據(jù)到生成文本,帶你一步步構(gòu)建大院模型。步
    的頭像 發(fā)表于 04-30 18:34 ?1373次閱讀
    小白學(xué)大<b class='flag-5'>模型</b>:從零實現(xiàn) LLM語言<b class='flag-5'>模型</b>

    大華星漢大模型2.0重塑產(chǎn)業(yè)格局

    模型的蓬勃發(fā)展,正以前所未有的速度和方式融入社會各領(lǐng)域。大華星漢大模型2.0創(chuàng)新構(gòu)建行業(yè)智能體,重塑產(chǎn)業(yè)格局。
    的頭像 發(fā)表于 04-15 10:38 ?1283次閱讀