91欧美超碰AV自拍|国产成年人性爱视频免费看|亚洲 日韩 欧美一厂二区入|人人看人人爽人人操aV|丝袜美腿视频一区二区在线看|人人操人人爽人人爱|婷婷五月天超碰|97色色欧美亚州A√|另类A√无码精品一级av|欧美特级日韩特级

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

使用 NVIDIA AI Enterprise 3.0 優(yōu)化生產(chǎn)級 AI 的性能和效率

NVIDIA英偉達 ? 來源:未知 ? 2023-04-17 23:15 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

NVIDIA AI Enterprise 是一款端到端的安全云原生 AI 軟件套件。最近發(fā)布的 NVIDIA AI Enterprise 3.0 加入了幫助優(yōu)化生產(chǎn)級 AI 性能與效率的新功能。本文將詳細(xì)介紹以下新功能及其工作原理。

· Magnum IO GPUDirect Storage

· VMware vSphere 8.0的 GPU 虛擬化功能

· Red Hat Enterprise Linux(RHEL)KVM 8 和 9

· Fractional multi-vGPU 支持

· 對 NVIDIA AI 的擴展支持

生產(chǎn)級 AI 功能

NVIDIA AI Enterprise 3.0 版本中的新 AI 工作流有助于縮短生產(chǎn)級 AI 的開發(fā)時間。這些工作流是常見 AI 用例的參考應(yīng)用,包括聯(lián)絡(luò)中心智能虛擬助理、音頻轉(zhuǎn)錄、數(shù)字指紋等。

未加密的預(yù)訓(xùn)練模型也首次包括在內(nèi),這確保了 AI 的可解釋性并使開發(fā)者能夠查看模型的權(quán)重和偏差,并了解模型的偏差。

NVIDIA AI Enterprise 現(xiàn)在支持 NGC 目錄中發(fā)布的所有 NVIDIA AI 軟件。已經(jīng)使用過 NGC 的開發(fā)者現(xiàn)在可以無縫過渡到 NVIDIA AI Enterprise 并使用支持 50 多個 AI 框架、預(yù)訓(xùn)練模型和 SDK 的 NVIDIA Enterprise Support。

基礎(chǔ)設(shè)施性能功能

NVIDIA AI Enterprise 3.0 包含許多有助于優(yōu)化基礎(chǔ)設(shè)施性能的新功能,因此用戶可以從他們的 AI 投資中獲得最大收益并最大程度地節(jié)約成本和時間。下面將對這些功能進行詳細(xì)說明。

Magnum IO GPUDirect Storage

企業(yè)現(xiàn)在可以在部署 NVIDIA AI Enterprise 3.0 的情況下,利用 Magnum IO GPUDirect Storage 的性能優(yōu)勢來加速和擴展他們的 AI 工作負(fù)載。GPUDirect Storage 1.4 打通了本地或遠程存儲與 GPU 內(nèi)存之間的直接數(shù)據(jù)路徑,為復(fù)雜的工作負(fù)載提供無與倫比的性能。

GPUDirect Storage 簡化并提高了存儲和 GPU 緩沖區(qū)之間的數(shù)據(jù)流的效率,適用于在 GPU 上消耗或產(chǎn)生數(shù)據(jù)而不需要 CPU 處理的應(yīng)用。該功能通過遠程直接內(nèi)存訪問(RDMA),在從存儲到 GPU 內(nèi)存的直接路徑上快速移動數(shù)據(jù),減少延遲并通過消除回彈緩沖區(qū)產(chǎn)生的多余復(fù)制來減輕 CPU 的負(fù)擔(dān)。

GPUDirect Storage 帶來了明顯的性能提升。與 NumPy 相比,使用 NVIDIA DALI 進行深度學(xué)習(xí)推理時,性能提高了 7.2 倍。

美國國家航空航天局(NASA)的火星探測器演示項目使用 NVIDIA IndeX 和 GPUDirect Storage 以及 27000 多個 NVIDIA GPU 來模擬逆向推進,在使用 PCIe 交換機和 NVLinks 以及 GPUDirect Storage 時,帶寬提高了 5 倍。

406dec70-dd32-11ed-bfe3-dac502259ad0.png

圖 1. GPUDirect Storage 提供了一條從存儲出發(fā)、完全跳過 CPU 的直接路徑,消除了綁定在 CPU 上的回彈緩沖。

VMware vSphere 8.0 的 GPU 虛擬化功能

NVIDIA AI Enterprise 3.0 引入了對 VMware vSphere 8 的支持,包括多項可加速性能和提高運行效率的功能。VMware 環(huán)境現(xiàn)在可以在一個虛擬機上添加多達 8 個虛擬 GPU,vGPU 數(shù)量比之前的版本多了一倍。這提高了大型 ML 模型的性能,為復(fù)雜的 AI 和 ML 工作負(fù)載提供了更高的可擴展性。

隨著設(shè)備組的引入,IT 管理員現(xiàn)在可以更好的控制虛擬機的放置。vSphere 附帶的管理工具分布式資源調(diào)度(DRS)可確定虛擬機的最佳放置位置。

新的設(shè)備組功能提供了對 PCIe 設(shè)備的洞察,這些設(shè)備在硬件層面上(通過 NVLink 或 PCIe 開關(guān))相互配對,IT 管理員可以從中選擇一個子集,提交給虛擬機作出 DRS 調(diào)度決策。

通過設(shè)備組,IT 管理員可以確保設(shè)備子集被一起分配給虛擬機。例如,如果用戶想要通過擴展 GPU 來加速大型模型,IT 管理員可以創(chuàng)建一個包含 GPU 的設(shè)備組并通過 NVLink 連接這些設(shè)備,比如圖 2 中的設(shè)備組 1。

如果用戶想要向外擴展到多臺服務(wù)器以進行分布式訓(xùn)練,可以使用共享同一 PCIe 交換機的 GPU 和 NIC 組成設(shè)備組,比如圖 2 中的設(shè)備組 2。

4091dd92-dd32-11ed-bfe3-dac502259ad0.png

圖 2. 有兩個 GPU 的設(shè)備組(左)和服務(wù)器上有一個 GPU 與網(wǎng)卡的設(shè)備組(右)

Red Hat Enterprise Linux KVM

NVIDIA AI Enterprise 3.0 將虛擬化支持?jǐn)U展至 Red Hat Enterprise Linux 8.4、8.6、8.7、9.0 和 9.1,使企業(yè)能夠?qū)?KVM 功能擴展到他們的 AI 工作負(fù)載。通過 RHEL KVM,管理員可以在一個虛擬機上添加多達 16 個虛擬 GPU,將計算密集型工作負(fù)載的處理速度提高數(shù)倍。

Fractional multi-vGPU 支持

管理員現(xiàn)在可以通過 NVIDIA AI Enterprise 3.0,為一臺虛擬機配置多個 Fractional vGPU,從而更加靈活地根據(jù)工作負(fù)載優(yōu)化虛擬機的配置。在該版本發(fā)布之前,每臺虛擬機只能通過一個或多個整數(shù)份 GPU 加速。

管理員現(xiàn)在能夠更加靈活地根據(jù)工作負(fù)載的計算需求,為一個虛擬機分配多個部分 vGPU 配置文件。例如,當(dāng)運行具有不同計算需求的多個推理工作負(fù)載時,管理員可以根據(jù)工作負(fù)載的內(nèi)存需求,為一個虛擬機分配不同數(shù)量幀緩沖器的 NVIDIA A100 Tensor Core GPU 的部分配置文件。

需要注意的是,所有部分配置文件必須是相同的板卡類型和系列??梢詫⒁粋€或多個物理 GPU 分成這些份額的 vGPU 配置文件。該功能在 VMware vSphere 8 和 RHEL KVM 8 和 9 上均可以使用。

40abb082-dd32-11ed-bfe3-dac502259ad0.png

圖 3. 將一個配置文件分成多個 vGPU 分配給一個虛擬機

對 NVIDIA AI 的擴展支持

NVIDIA AI Enterprise 為 NGC 目錄中發(fā)布的所有 NVIDIA AI 軟件提供支持,該目錄目前包含 50 多個框架和模型。所有受支持的模型都標(biāo)有“NVIDIA AI Enterprise Supported”以幫助用戶輕松識別支持的軟件。

40c3de96-dd32-11ed-bfe3-dac502259ad0.png

圖 4. 所有 NVIDIA AI Enterprise 支持的模型在 NGC 目錄中都有標(biāo)注

總結(jié)

通過最新 3.0 版本的 NVIDIA AI Enterprise,企業(yè)可以使用最新的性能和效率優(yōu)化功能縮短生產(chǎn)級 AI 的開發(fā)時間。NVIDIA LaunchPad 使用戶可以在私有加速計算環(huán)境中即時、短期訪問 NVIDIA AI Enterprise 軟件套件,包括各種動手實操實驗室。

即刻點擊“閱讀原文”掃描下方海報二維碼在 NVIDIA On-Demand 上觀看 GTC 精選回放,包括主題演講相關(guān)精選、中國本地精選內(nèi)容、生成式 AI 專題以及全球各行業(yè)及領(lǐng)域最新成果!


原文標(biāo)題:使用 NVIDIA AI Enterprise 3.0 優(yōu)化生產(chǎn)級 AI 的性能和效率

文章出處:【微信公眾號:NVIDIA英偉達】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。


聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • 英偉達
    +關(guān)注

    關(guān)注

    23

    文章

    4090

    瀏覽量

    99237

原文標(biāo)題:使用 NVIDIA AI Enterprise 3.0 優(yōu)化生產(chǎn)級 AI 的性能和效率

文章出處:【微信號:NVIDIA_China,微信公眾號:NVIDIA英偉達】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關(guān)推薦
    熱點推薦

    邊緣AI算力臨界點:深度解析176TOPS香橙派AI Station的產(chǎn)業(yè)價值

    AI服務(wù)器) 這一形態(tài)應(yīng)運而生。它需要在極小體積內(nèi),提供接近服務(wù)器AI吞吐能力,同時具備工業(yè)的接口擴展性。 OrangePi AI S
    發(fā)表于 03-10 14:19

    Magna AI加入NVIDIA Inception計劃,推動生產(chǎn)人工智能規(guī)?;l(fā)展

    Magna AI是一家由Trend Micro與Wistron的戰(zhàn)略合作成立的全球全價值鏈人工智能轉(zhuǎn)型領(lǐng)導(dǎo)者。公司今日宣布,已加入NVIDIA Inception計劃,躋身全球率先實現(xiàn)生產(chǎn)
    的頭像 發(fā)表于 01-12 15:46 ?182次閱讀

    瑞芯微SOC智能視覺AI處理器

    RK3568B2: 一款性能均衡、接口豐富的中高端AIoT應(yīng)用處理器,是RK3568的優(yōu)化版本,主打穩(wěn)定與可靠性。CPU/GPU: 延續(xù)RK3568的4核A55 + G52 GPU架構(gòu),性能可靠
    發(fā)表于 12-19 13:44

    BPI-AIM7 RK3588 AINvidia Jetson Nano 生態(tài)系統(tǒng)兼容的低功耗 AI 模塊

    8K視頻編解碼和AI推理任務(wù),降低延遲70%。 6 TOPS NPU 定制優(yōu)化 :針對 YOLO/Transformer 等模型定制算子庫,推理效率提升 5 倍。 2. 全面接口兼容,無縫生態(tài)系統(tǒng)遷移
    發(fā)表于 10-11 09:08

    【「AI芯片:科技探索與AGI愿景」閱讀體驗】+AI的科學(xué)應(yīng)用

    和量子計算的兩項新興的技術(shù),將在生產(chǎn)假說方面發(fā)揮重要作用,從而改變科學(xué)發(fā)現(xiàn)的范式。 生成式AI: 2、窮舉搜索 3、分析排錯與組合優(yōu)化 分析排錯是生成假說的重要手段。強化學(xué)習(xí)也在優(yōu)化
    發(fā)表于 09-17 11:45

    汽車制造:AI 助力工藝優(yōu)化,為整車生產(chǎn)提速

    AI 在汽車制造工藝優(yōu)化和設(shè)備管理系統(tǒng)中的應(yīng)用已成效顯著,從提升產(chǎn)品質(zhì)量、提高生產(chǎn)效率,到降低成本、增強企業(yè)競爭力,AI 正深刻改變行業(yè)格局
    的頭像 發(fā)表于 08-25 10:55 ?779次閱讀
    汽車制造:<b class='flag-5'>AI</b> 助力工藝<b class='flag-5'>優(yōu)化</b>,為整車<b class='flag-5'>生產(chǎn)</b>提速

    NVIDIA DOCA 3.0版本的亮點解析

    NVIDIA DOCA 框架已發(fā)展成為新一代 AI 基礎(chǔ)設(shè)施的重要組成部分。從初始版本到備受期待的 NVIDIA DOCA 3.0 發(fā)布,每個版本都擴展了
    的頭像 發(fā)表于 07-04 14:27 ?1254次閱讀
    <b class='flag-5'>NVIDIA</b> DOCA <b class='flag-5'>3.0</b>版本的亮點解析

    全球各大品牌利用NVIDIA AI技術(shù)提升運營效率

    歐萊雅、LVMH 集團和雀巢利用 NVIDIA 加速的智能體 AI 和物理 AI,大幅提升產(chǎn)品設(shè)計、營銷及物流等方面的運營效率
    的頭像 發(fā)表于 06-19 14:36 ?1213次閱讀

    NVIDIA攜手合作伙伴提升AI智能體的交互能力

    NVIDIA Enterprise AI Factory 的經(jīng)驗證設(shè)計和全新的 NVIDIA AI Blueprint 可幫助企業(yè)部署具有溝
    的頭像 發(fā)表于 05-22 09:52 ?1073次閱讀

    NVIDIA助力安利生成式AI在效能和安全上破局

    依托 NVIDIA AI Enterprise 企業(yè)解決方案,安利正在構(gòu)建安全、高效、可擴展的 AI 基礎(chǔ)設(shè)施體系,全面提升算力資源調(diào)度能
    的頭像 發(fā)表于 05-10 09:28 ?1335次閱讀

    DevEco Studio AI輔助開發(fā)工具兩大升級功能 鴻蒙應(yīng)用開發(fā)效率再提升

    HarmonyOS應(yīng)用的AI智能輔助開發(fā)助手——CodeGenie,該AI助手深度集成在DevEco Studio中,提供鴻蒙知識智能問答、鴻蒙ArkTS代碼補全/生成和萬能卡片生成等功能,提升了開發(fā)效率,深受廣大
    發(fā)表于 04-18 14:43

    首創(chuàng)開源架構(gòu),天璣AI開發(fā)套件讓端側(cè)AI模型接入得心應(yīng)手

    PIX GP模型的整合,并且針對模型進行全鏈路微秒分析,以確保最佳的端到端性能表現(xiàn)。在雙方的整個合作流程中,開發(fā)效率提升了30%。 天璣AI生態(tài)同樣拓展到了智能座艙領(lǐng)域。聯(lián)發(fā)科和絕影
    發(fā)表于 04-13 19:52

    NVIDIA AI Enterprise助力AI智能體重構(gòu)工作模式

    無論是為人道主義援助、客戶服務(wù)還是醫(yī)療健康而開發(fā),基于NVIDIA AI Enterprise軟件平臺構(gòu)建的 AI 智能體構(gòu)成了新型數(shù)字勞動力,幫助專業(yè)人士以更低的成本、更大的影響力來
    的頭像 發(fā)表于 03-25 14:59 ?1058次閱讀

    英偉達GTC2025亮點:Oracle與NVIDIA合作助力企業(yè)加速代理式AI推理

    Enterprise 軟件平臺之間的集成,將使 160 多個 AI 工具和 100 多個 NVIDIA NIM 微服務(wù)通過 OCI 控制臺以原生方式提供。此外,Oracle 和 NVIDIA
    的頭像 發(fā)表于 03-21 12:01 ?1448次閱讀
    英偉達GTC2025亮點:Oracle與<b class='flag-5'>NVIDIA</b>合作助力企業(yè)加速代理式<b class='flag-5'>AI</b>推理

    Oracle 與 NVIDIA 合作助力企業(yè)加速代理式 AI 推理

    Oracle Cloud Infrastructure (OCI) 與 NVIDIA AI Enterprise 軟件平臺之間的集成,將使 160 多個 AI 工具和 100 多個
    發(fā)表于 03-19 15:24 ?580次閱讀
    Oracle 與 <b class='flag-5'>NVIDIA</b> 合作助力企業(yè)加速代理式 <b class='flag-5'>AI</b> 推理