91欧美超碰AV自拍|国产成年人性爱视频免费看|亚洲 日韩 欧美一厂二区入|人人看人人爽人人操aV|丝袜美腿视频一区二区在线看|人人操人人爽人人爱|婷婷五月天超碰|97色色欧美亚州A√|另类A√无码精品一级av|欧美特级日韩特级

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

NVIDIA Triton系列文章:開發(fā)資源說明

NVIDIA英偉達企業(yè)解決方案 ? 來源:NVIDIA英偉達企業(yè)解決方案 ? 作者:NVIDIA英偉達企業(yè)解 ? 2022-11-09 16:17 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

大部分要學(xué)習(xí) Triton 推理服務(wù)器的入門者,都會被搜索引擎或網(wǎng)上文章引導(dǎo)至官方的https://developer.nvidia.com/nvidia-triton-inference-server處(如下截圖),然后從 “Get Started” 直接安裝服務(wù)器與用戶端軟件、創(chuàng)建基礎(chǔ)的模型倉、執(zhí)行一些最基本的范例。

075dc9d0-5f58-11ed-8abf-dac502259ad0.png

這條路徑雖然能在很短時間內(nèi)跑起 Triton 的應(yīng)用,但在未掌握整個應(yīng)用架構(gòu)之前便貿(mào)然執(zhí)行,反倒容易讓初學(xué)者陷入迷失的狀態(tài),因此建議初學(xué)者最好先對 Triton 項目有比較更完整的了解之后,再執(zhí)行前面的 “Get Started” 就會更容易掌握項目的精髓。

要獲得比較完整的 Triton 技術(shù)資料,就得到項目開源倉里去尋找。與 NVIDIA 其他放在 https://github.com/NVIDIA或https://github.com/NVIDIA-AI-IOT的項目不同,Triton 項目有獨立的開源倉,位置在https://github.com/triton-inference-server,進入開源倉后會看到如下截屏的內(nèi)容:

0777b1f6-5f58-11ed-8abf-dac502259ad0.png

下面列出四大部分的技術(shù)資源:

1. Getting Start(新手上路):

這里提供三個鏈接,比較重要的是 “Quick Start(快速啟動)” 的部分,提供以下三個步驟就能輕松執(zhí)行 Triton 的基礎(chǔ)示范:

(1) Create a Model Repository(創(chuàng)建模型倉)

(2) Launch Triton(啟動Triton服務(wù)器與用戶端)

(3) Send an Inference Request(提交推理要求)

2. Production Documentation(生產(chǎn)文件):

這里最重要的是 “server documents on GitHub” 鏈接,點進去后會進入整個 Triton 項目中最完整的技術(shù)文件中心(如下圖),除 Installation 與 Getting Started 屬于入門范疇,其余 User Guide、API Guide、Additional Resources 與 Customization Guide 等四個部分,都是 Triton 推理服務(wù)器非常重要的技術(shù)內(nèi)容。

079daa00-5f58-11ed-8abf-dac502259ad0.png

因此這個部分可以算得上是學(xué)習(xí) Triton 服務(wù)器的最重要資源。

例如點擊 “User Guide” 之后,就會看到以下所條例的執(zhí)行步驟:

Creating a Model Repository

Writing a Model Configuration

Buillding a Model Pipeline

Managing Model Availablity

Collecting Server Metrics

Supporting Custom Ops/layers

Using the Client API

Analyzing Performance

Deploying on edge (Jetson)

3. Examples(范例):

這里的范例,比較重要的是指向https://github.com/NVIDIA/DeepLearningExamples鏈接,列出針對 NVIDIA Tensor Core 計算單元的深度學(xué)習(xí)模型列表,包括計算機視覺、NLP 自然語言處理、推薦系統(tǒng)、語音轉(zhuǎn)文字 / 文字轉(zhuǎn)語音、圖形神經(jīng)網(wǎng)絡(luò)、時間序列等各種神經(jīng)網(wǎng)絡(luò)模型細節(jié),包括網(wǎng)絡(luò)結(jié)構(gòu)與相關(guān)參數(shù)的內(nèi)容。

對于未來要在 Triton 服務(wù)器上,對于所使用的網(wǎng)絡(luò)后端進行性能優(yōu)化或者創(chuàng)建新的后端,會有很大的助益,但是對于初學(xué)者來說是相對艱澀的,因此現(xiàn)階段先不做深入的說明與示范。

4. Feedback(反饋):

這里會鏈接到https://github.com/triton-inference-server/server/issues問題中心,是 Triton 項目中最重要的技術(shù)問題解決資源之一,后面執(zhí)行過程中所遇到的問題,都可以先到這里來查看是否有人已經(jīng)提出?如果沒有的話,也可以在這里提交自己所遇到的問題,項目負責(zé)人會提供合適的回復(fù)。

以上第 2、4 兩項資源,對初學(xué)者來說會有最大的幫助。接著看一下項目里 “釘?。≒inned)” 的 6 個倉(如下圖),是比較重要的基礎(chǔ)部分,涵蓋了 Triton 架構(gòu)圖中的主要板塊。

07cfb18a-5f58-11ed-8abf-dac502259ad0.png

主要內(nèi)容如下:

1. server 倉:

這里集成整個項目的主要內(nèi)容,包括幾部分:

(1)deploy(部署):提供在阿里巴巴、亞馬遜等云資源的部署方式,以及基于 NVIDIA Fleet 指令集、GKE(Google kubernets Engine)、k8s、Helm 等應(yīng)用平臺的各種部署方法;

(2)docker(容器):修正一些創(chuàng)建容器腳本的錯誤;

(3)docs(使用說明):就是前面 “生產(chǎn)文件(Production Documentation)” 的內(nèi)容,這里不重復(fù)贅述;

(4)qa(質(zhì)量優(yōu)化):由于 Triton 推理服務(wù)器有非常多優(yōu)化的環(huán)節(jié),在這個目錄下提供上百個不同狀況的優(yōu)化測試腳本;

(5)src(源代碼):目錄下存放整個 Triton 推理服務(wù)器的開源代碼(.cc)、頭文件(.h)與編譯腳本(CMakeLists.txt);

(6)其他代碼與腳本

2. core 倉:

此存儲庫包含實現(xiàn) Triton 核心功能的庫的源代碼和標頭。核心庫可以如下所述構(gòu)建,并通過其 CAPI 直接使用。為了有用,核心庫必須與一個或多個后端配對。您可以在后端回購中了解有關(guān)后端的更多信息。

3. backend 倉:

提供創(chuàng)建 Triton 服務(wù)器后端(backend)的源代碼、腳本與工具。“后端” 是用來執(zhí)行不同深度學(xué)習(xí)模型的管理模塊,以深度學(xué)習(xí)框架進行封裝,例如 PyTorch、Tensorflow、ONNX Runtime 與 TensorRT 等等,用戶也可以為了性能目的,自行定義 C / C++ 封裝方式。

4. client 倉:

提供 Triton 用戶端的 C++ / Python / Java 開發(fā)接口、能生成適用于不同編程語言的 GRPC 開發(fā)接口的 protoc 編譯器,以及對應(yīng)的用戶端范例;

5. model_analyzer 倉:

深度學(xué)習(xí)模型(model)是 Triton 推理服務(wù)器的最基礎(chǔ)組成元件,因此對分析模型的計算與內(nèi)存需求是服務(wù)器性能的一項關(guān)鍵功能。這個 model_analyzer 模型分析工具是一種 CLI 工具,這款新工具可以自動化地從數(shù)百種組合中為 AI 模型選擇最佳配置,以實現(xiàn)最優(yōu)性能,同時確保應(yīng)用程序所需的服務(wù)質(zhì)量,能幫助開發(fā)人員更好地了解不同配置中的權(quán)衡,并選擇能夠最大化 Triton 的性能配置;

6. model_navigator 倉:

這個 model_navigator 模型導(dǎo)航器是一種能夠自動將模型從源移動到最佳格式和配置的工具,支持將模型從源導(dǎo)出為所有可能的格式,并應(yīng)用 Triton 服務(wù)器的后端優(yōu)化。使用模型分析器能找到最佳的模型配置,匹配提供的約束條件并優(yōu)化性能。

以上是 Triton 開源項目里比較核心的 6 個倉,另外還有 20 多個代碼倉,其中大約 15 個是項目提供的后端(backend)擴充應(yīng)用,例如 tensorrt_backend、fil_backend、square_backend 等等,以及一些額外的管理工具,并且不斷增加中。

本系列后面的內(nèi)容都會基于這個 server 倉的 docs 目錄下的內(nèi)容為主,按部就班地帶著讀者循序漸進創(chuàng)建與調(diào)試 Triton 推理服務(wù)器的運作環(huán)境。

審核編輯 :李倩

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • NVIDIA
    +關(guān)注

    關(guān)注

    14

    文章

    5598

    瀏覽量

    109803
  • 服務(wù)器
    +關(guān)注

    關(guān)注

    14

    文章

    10261

    瀏覽量

    91526

原文標題:NVIDIA Triton 系列文章(3):開發(fā)資源說明

文章出處:【微信號:NVIDIA-Enterprise,微信公眾號:NVIDIA英偉達企業(yè)解決方案】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關(guān)推薦
    熱點推薦

    借助NVIDIA CUDA Tile IR后端推進OpenAI Triton的GPU編程

    NVIDIA CUDA Tile 是基于 GPU 的編程模型,其設(shè)計目標是為 NVIDIA Tensor Cores 提供可移植性,從而釋放 GPU 的極限性能。CUDA Tile 的一大優(yōu)勢是允許開發(fā)者基于其構(gòu)建自定義的 DS
    的頭像 發(fā)表于 02-10 10:31 ?266次閱讀

    NVIDIA 推出 Alpamayo 系列開源 AI 模型與工具,加速安全可靠的推理型輔助駕駛汽車開發(fā)

    新聞?wù)?: l NVIDIA 率先發(fā)布為應(yīng)對輔助駕駛長尾場景挑戰(zhàn)而設(shè)計的開源視覺-語言-動作推理模型(Reasoning VLA);NVIDIA Alpamayo 系列還包含賦能輔助駕駛汽車
    的頭像 發(fā)表于 01-06 09:40 ?393次閱讀
    <b class='flag-5'>NVIDIA</b> 推出 Alpamayo <b class='flag-5'>系列</b>開源 AI 模型與工具,加速安全可靠的推理型輔助駕駛汽車<b class='flag-5'>開發(fā)</b>

    NVIDIA Jetson系列開發(fā)者套件助力打造面向未來的智能機器人

    NVIDIA Jetson AGX Thor、AGX Orin 以及 Jetson Orin Nano Super 開發(fā)者套件,助力打造面向未來的智能機器人。
    的頭像 發(fā)表于 12-13 10:20 ?3077次閱讀

    利用NVIDIA Cosmos開放世界基礎(chǔ)模型加速物理AI開發(fā)

    NVIDIA 最近發(fā)布了 NVIDIA Cosmos 開放世界基礎(chǔ)模型(WFM)的更新,旨在加速物理 AI 模型的測試與驗證數(shù)據(jù)生成。借助 NVIDIA Omniverse 庫和 Cosmos,
    的頭像 發(fā)表于 12-01 09:25 ?1150次閱讀

    NVIDIA DRIVE AGX Thor開發(fā)者套件重磅發(fā)布

    這款由 NVIDIA DriveOS 7 驅(qū)動的開發(fā)者套件能夠幫助開發(fā)者們打造出更安全的智能汽車和交通解決方案。
    的頭像 發(fā)表于 09-04 11:20 ?1393次閱讀

    NVIDIA Omniverse Extension開發(fā)秘籍

    NVIDIA Omniverse 是一個模塊化平臺,使用高級 API 和微服務(wù)來構(gòu)建由 OpenUSD 和 NVIDIA RTX 提供支持的 3D 應(yīng)用。OpenUSD 功能強大的 3D 框架與 NVIDIA RTX 用于視覺渲
    的頭像 發(fā)表于 08-22 15:52 ?3722次閱讀
    <b class='flag-5'>NVIDIA</b> Omniverse Extension<b class='flag-5'>開發(fā)</b>秘籍

    芯科科技Arduino開發(fā)資源重大更新

    Silicon Labs (芯科科技)近期于在線技術(shù)社群中發(fā)布了面向Arduino Core和Matter庫的重大更新,帶來了兩個關(guān)鍵突破:全面支持Matter 1.4標準,以及人工智能和機器學(xué)習(xí)(AI/ML)無線共存(Wireless Coexistence),從而實現(xiàn)更強的連接能力、更廣泛的設(shè)備支持。
    的頭像 發(fā)表于 08-20 15:51 ?929次閱讀

    NVIDIA桌面GPU系列擴展新產(chǎn)品

    NVIDIA 桌面 GPU 系列擴展,推出 NVIDIA RTX PRO 4000 SFF Edition GPU 和 RTX PRO 2000 Blackwell GPU,可提高工程、內(nèi)容創(chuàng)作和 3D 可視化等應(yīng)用的性能。
    的頭像 發(fā)表于 08-18 11:50 ?1433次閱讀

    使用NVIDIA Triton和TensorRT-LLM部署TTS應(yīng)用的最佳實踐

    針對基于 Diffusion 和 LLM 類別的 TTS 模型,NVIDIA Triton 和 TensorRT-LLM 方案能顯著提升推理速度。在單張 NVIDIA Ada Lovelace
    的頭像 發(fā)表于 06-12 15:37 ?1905次閱讀
    使用<b class='flag-5'>NVIDIA</b> <b class='flag-5'>Triton</b>和TensorRT-LLM部署TTS應(yīng)用的最佳實踐

    NVIDIA Isaac Sim與NVIDIA Isaac Lab的更新

    在 COMPUTEX 2025 上,NVIDIA 宣布了機器人仿真參考應(yīng)用 NVIDIA Isaac Sim 和機器人學(xué)習(xí)框架 NVIDIA Isaac Lab 的更新,以加速各種形態(tài)機器人的
    的頭像 發(fā)表于 05-28 10:06 ?2133次閱讀

    芯科科技助力藍牙Mesh設(shè)備開發(fā)

    藍牙Mesh 1.1是藍牙技術(shù)聯(lián)盟(Bluetooth SIG)發(fā)布的最新標準版本,Silicon Labs(芯科科技)作為開發(fā)和實施藍牙Mesh標準的主要貢獻者之一,特別制作了藍牙Mesh開發(fā)流程頁面,以幫助開發(fā)人員快速了解新
    的頭像 發(fā)表于 05-16 13:51 ?1278次閱讀
    芯科科技助力藍牙Mesh設(shè)備<b class='flag-5'>開發(fā)</b>

    Xilinx Ultrascale系列FPGA的時鐘資源與架構(gòu)解析

    Ultrascale是賽靈思開發(fā)的支持包含步進功能的增強型FPGA架構(gòu),相比7系列的28nm工藝,Ultrascale采用20nm的工藝,主要有2個系列:Kintex和Virtex
    的頭像 發(fā)表于 04-24 11:29 ?2643次閱讀
    Xilinx Ultrascale<b class='flag-5'>系列</b>FPGA的時鐘<b class='flag-5'>資源</b>與架構(gòu)解析

    【米爾-全志T536開發(fā)板試用體驗】開發(fā)資源關(guān)鍵要點

    (ENET1/2千兆,ENET3 USB轉(zhuǎn)百兆)。 六、資源獲取與支持 官方文檔:米爾提供原理圖、PCB源文件(Allegro格式)及預(yù)配置Docker開發(fā)環(huán)境。
    發(fā)表于 04-14 23:06

    使用NVIDIA RTX PRO Blackwell系列GPU加速AI開發(fā)

    NVIDIA GTC 推出新一代專業(yè)級 GPU 和 AI 賦能的開發(fā)者工具—同時,ChatRTX 更新現(xiàn)已支持 NVIDIA NIM,RTX Remix 正式結(jié)束測試階段,本月的 NVIDIA
    的頭像 發(fā)表于 03-28 09:59 ?1310次閱讀

    NVIDIA 推出開放推理 AI 模型系列,助力開發(fā)者和企業(yè)構(gòu)建代理式 AI 平臺

    月 18 日 —— ?NVIDIA 今日發(fā)布具有推理功能的開源 Llama Nemotron 模型系列,旨在為開發(fā)者和企業(yè)提供業(yè)務(wù)就緒型基礎(chǔ),助力構(gòu)建能夠獨立工作或以團隊形式完成復(fù)雜任務(wù)的高級 AI 智能體。
    發(fā)表于 03-19 09:31 ?396次閱讀
    <b class='flag-5'>NVIDIA</b> 推出開放推理 AI 模型<b class='flag-5'>系列</b>,助力<b class='flag-5'>開發(fā)</b>者和企業(yè)構(gòu)建代理式 AI 平臺