91欧美超碰AV自拍|国产成年人性爱视频免费看|亚洲 日韩 欧美一厂二区入|人人看人人爽人人操aV|丝袜美腿视频一区二区在线看|人人操人人爽人人爱|婷婷五月天超碰|97色色欧美亚州A√|另类A√无码精品一级av|欧美特级日韩特级

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

在 NGC 上玩轉(zhuǎn)新一代推理部署工具 FastDeploy,幾行代碼搞定 AI 部署

NVIDIA英偉達(dá)企業(yè)解決方案 ? 來源:未知 ? 2022-12-13 19:50 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

號(hào)外:

全場(chǎng)景高性能 AI 部署工具

FastDeploy 發(fā)版 v1.0

幾行代碼搞定 AI 部署,快速使用 150+ 預(yù)置部署示例,支持 CV、NLP、Speech、Cross-model 模型,并提供開箱即用的云邊端部署體驗(yàn),實(shí)現(xiàn) AI 模型端到端的推理性能優(yōu)化。

歡迎廣大開發(fā)者使用 NVIDIA 與飛槳聯(lián)合深度適配的 NGC 飛槳容器,在 NVIDIA GPU 上進(jìn)行體驗(yàn) FastDeploy!

全場(chǎng)景高性能 AI 部署工具 FastDeploy

人工智能技術(shù)在各行各業(yè)正加速應(yīng)用落地。為了向開發(fā)者提供產(chǎn)業(yè)實(shí)踐推理部署最優(yōu)解,百度飛槳發(fā)起了 FastDeploy 開源項(xiàng)目。FastDeploy 具備全場(chǎng)景、簡(jiǎn)單易用、極致高效三大特點(diǎn)。

(1)簡(jiǎn)單易用:幾行代碼完成 AI 模型的 GPU 部署,一行命令切換推理后端,快速體驗(yàn) 150+ 熱門模型部署

FastDeploy 精心設(shè)計(jì)模型 API,不同語言統(tǒng)一 API 體驗(yàn),只需要幾行核心代碼,就可以實(shí)現(xiàn)預(yù)知模型的高性能推理,極大降低了 AI 模型部署難度和工作量。一行命令切換 TensorRT、Paddle Inference、ONNX Runtime、Poros 等不同推理后端,充分利用推理引擎在 GPU 硬件上的優(yōu)勢(shì)。

import fastdeploy as fd
import cv2
option = fd.RuntimeOption()
option.use_gpu()
option.use_trt_backend() # 一行命令切換使用 TensorRT部署
model = fd.vision.detection.PPYOLOE("model.pdmodel", 
                                    "model.pdiparams", 
                                    "infer_cfg.yml",
                                    runtime_option=option)
im = cv2.imread("test.jpg")
result=model.predict(im)

FastDeploy 幾行命令完成 AI 模型部署

FastDeploy 支持 CV、NLP、Speech、Cross-modal(跨模態(tài))四大 AI 領(lǐng)域,覆蓋 20 多主流場(chǎng)景、150 多個(gè) SOTA 產(chǎn)業(yè)模型的端到端示例,包括圖像分類、圖像分割、語義分割、物體檢測(cè)、字符識(shí)別(OCR)、人臉檢測(cè)、人臉關(guān)鍵點(diǎn)檢測(cè)、人臉識(shí)別、人像扣圖、視頻扣圖、姿態(tài)估計(jì)、文本分類、信息抽取、文圖生成、行人跟蹤、語音合成等。支持飛槳 PaddleClas、PaddleDetection、PaddleSeg、PaddleOCR、PaddleNLP、PaddleSpeech 6 大熱門 AI 套件的主流模型及生態(tài)(如 PyTorch、ONNX 等)熱門模型的部署。

ce727aea-7adb-11ed-8abf-dac502259ad0.png

FastDeploy 在 NVIDIA GPU、Jetson上的 AI 模型部署庫(kù)

(2)全場(chǎng)景:支持多框架,輕松搞定 PaddlePaddle、PyTorch、ONNX 等模型部署

FastDeploy 支持 TensorRT、Paddle Inference、ONNX Runtime、Poros 推理引擎,統(tǒng)一部署 API,只需要一行代碼,便可靈活切換多個(gè) GPU 推理引擎后端。內(nèi)置了 X2Paddle 和 Paddle2ONNX 模型轉(zhuǎn)換工具,只需要一行命令便可完成其他深度學(xué)習(xí)框架到飛槳以及 ONNX 的相互轉(zhuǎn)換,讓其他框架的開發(fā)者也能通過 FastDeploy 體驗(yàn)到飛槳模型壓縮與推理引擎的端到端優(yōu)化效果。覆蓋 GPU、Jetson Nano、Jetson TX2、Jetson AGX、Jetson Orin 等云邊端場(chǎng)景全系列 NVIDIA 硬件部署。同時(shí)支持服務(wù)化部署、離線部署、端側(cè)部署方式。

cefeae48-7adb-11ed-8abf-dac502259ad0.png

(3)極致高效:一鍵壓縮提速,預(yù)處理加速,端到端性能優(yōu)化,提升 AI 算法產(chǎn)業(yè)落地

FastDeploy 集成了自動(dòng)壓縮工具,在參數(shù)量大大減小的同時(shí)(精度幾乎無損),推理速度大幅提升。使用 CUDA 加速優(yōu)化預(yù)處理和后處理模塊,將 YOLO 系列的模型推理加速整體從 41ms 優(yōu)化到 25ms。端到端的優(yōu)化策略,徹底解決 AI 部署落地中的性能難題。更多性能優(yōu)化,歡迎關(guān)注 GitHub 了解詳情。

https://github.com/PaddlePaddle/FastDeploy

cf2995a4-7adb-11ed-8abf-dac502259ad0.png

FastDeploy 一行命令實(shí)現(xiàn)自動(dòng)壓縮,充分利用硬件資源提升推理速度

cf465f7c-7adb-11ed-8abf-dac502259ad0.png

FastDeploy 提升 AI 任務(wù)端到端推理速

直播預(yù)告:服務(wù)化部署高并發(fā)調(diào)優(yōu)實(shí)戰(zhàn)

12 月 12 日 - 12 月 30 日,《產(chǎn)業(yè)級(jí) AI 模型部署全攻略》系列直播課程,F(xiàn)astDeploy 聯(lián)合 10 家硬件公司與大家直播見面。

12 月 14 日 20:30 開始,NVIDIA 與百度資深專家將為大家?guī)硪浴?strong>一鍵搞定服務(wù)化部署,實(shí)現(xiàn)穩(wěn)定高并發(fā)服務(wù)”為主題的精彩分享,詳細(xì)解說 FastDeploy 服務(wù)化部署實(shí)戰(zhàn)教學(xué),以及如何提升 GPU 利用率和吞吐量!歡迎大家掃碼報(bào)名獲取直播鏈接,加入交流群與行業(yè)精英深度共同探討 AI 部署落地話題。

一鍵搞定服務(wù)化部署

實(shí)現(xiàn)穩(wěn)定高并發(fā)服務(wù)

cf8eaeb2-7adb-11ed-8abf-dac502259ad0.png

12 月 14 日,星期三,20:30

精彩亮點(diǎn)

  • 企業(yè)級(jí) NGC 容器,快速獲取強(qiáng)大的軟硬件能力

  • 三行代碼搞定 AI 部署,一鍵體驗(yàn) 150+ 部署 demo

  • 服務(wù)化部署實(shí)戰(zhàn)教學(xué),提升 GPU 利用率和吞吐量

會(huì)議嘉賓

cfa5c0fc-7adb-11ed-8abf-dac502259ad0.jpg

Adam | NVIDIA 亞太區(qū)資深產(chǎn)品經(jīng)理

cfd0522c-7adb-11ed-8abf-dac502259ad0.png

Jason|百度資深研發(fā)工程師

參與方式

d0400824-7adb-11ed-8abf-dac502259ad0.png

掃碼報(bào)名獲取直播鏈接


原文標(biāo)題:在 NGC 上玩轉(zhuǎn)新一代推理部署工具 FastDeploy,幾行代碼搞定 AI 部署

文章出處:【微信公眾號(hào):NVIDIA英偉達(dá)企業(yè)解決方案】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。


聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • 英偉達(dá)
    +關(guān)注

    關(guān)注

    23

    文章

    4089

    瀏覽量

    99232

原文標(biāo)題:在 NGC 上玩轉(zhuǎn)新一代推理部署工具 FastDeploy,幾行代碼搞定 AI 部署

文章出處:【微信號(hào):NVIDIA-Enterprise,微信公眾號(hào):NVIDIA英偉達(dá)企業(yè)解決方案】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評(píng)論

    相關(guān)推薦
    熱點(diǎn)推薦

    智譜AI正式上線并開源全新一代大模型GLM-5

    智譜AI正式上線并開源全新一代大模型GLM-5。作為面向復(fù)雜系統(tǒng)工程與長(zhǎng)程Agent任務(wù)打造的新一代模型,GLM-5Coding與Agent能力
    的頭像 發(fā)表于 02-12 14:40 ?722次閱讀

    AI端側(cè)部署開發(fā)(SC171開發(fā)套件V2-FAS)

    AI端側(cè)部署開發(fā)(SC171開發(fā)套件V2-FAS) 序列 課程名稱 視頻課程時(shí)長(zhǎng) 視頻課程鏈接 課件鏈接 工程源碼 1 Fibo AI Stack模型轉(zhuǎn)化指南 27分19秒 https
    發(fā)表于 02-11 11:44

    云巨頭算力戰(zhàn)升級(jí)!微軟新一代3nm AI推理芯片性能提升30%,落地?cái)?shù)據(jù)中心

    據(jù)外媒報(bào)道,微軟發(fā)布新一代人工智能芯片Maia 200,這款芯片有望成為英偉達(dá)旗艦處理器以及云服務(wù)競(jìng)爭(zhēng)對(duì)手亞馬遜、谷歌同類產(chǎn)品的替代選擇。微軟稱,這款芯片是為 AI 推理規(guī)?;?b class='flag-5'>部署打造
    的頭像 發(fā)表于 01-27 12:29 ?4967次閱讀
    云巨頭算力戰(zhàn)升級(jí)!微軟<b class='flag-5'>新一代</b>3nm <b class='flag-5'>AI</b><b class='flag-5'>推理</b>芯片性能提升30%,落地?cái)?shù)據(jù)中心

    AI端側(cè)部署開發(fā)(SC171開發(fā)套件V3)2026版

    AI端側(cè)部署開發(fā)(SC171開發(fā)套件V3)2026版 序列 課程名稱 視頻課程時(shí)長(zhǎng) 視頻課程鏈接 課件鏈接 工程源碼 1 Fibo AI Stack模型轉(zhuǎn)化指南 27分19秒 https
    發(fā)表于 01-15 10:31

    【NPU實(shí)戰(zhàn)】迅為RK3588玩轉(zhuǎn)YOLOv8:目標(biāo)檢測(cè)與語義分割站式部署指南

    【NPU實(shí)戰(zhàn)】迅為RK3588玩轉(zhuǎn)YOLOv8:目標(biāo)檢測(cè)與語義分割站式部署指南
    的頭像 發(fā)表于 12-12 14:30 ?6159次閱讀
    【NPU實(shí)戰(zhàn)】<b class='flag-5'>在</b>迅為RK3588<b class='flag-5'>上</b><b class='flag-5'>玩轉(zhuǎn)</b>YOLOv8:目標(biāo)檢測(cè)與語義分割<b class='flag-5'>一</b>站式<b class='flag-5'>部署</b>指南

    高性能 AI 平臺(tái)上部署 EtherCAT 主站:實(shí)測(cè)低抖動(dòng)、低占用方案

    機(jī)器人與邊緣AI應(yīng)用中,底層通信的實(shí)時(shí)性決定了系統(tǒng)的響應(yīng)速度與控制精度。JetsonThor作為NVIDIA最新一代嵌入式平臺(tái),具備強(qiáng)大的算力與實(shí)時(shí)推理能力,為EtherCAT網(wǎng)絡(luò)提
    的頭像 發(fā)表于 10-30 15:35 ?699次閱讀
    <b class='flag-5'>在</b>高性能 <b class='flag-5'>AI</b> 平臺(tái)上<b class='flag-5'>部署</b> EtherCAT 主站:實(shí)測(cè)低抖動(dòng)、低占用方案

    使用瑞薩RUHMI工具實(shí)現(xiàn)AI模型部署過程

    AI無處不在。你部署AI,你的競(jìng)爭(zhēng)對(duì)手也部署AI
    的頭像 發(fā)表于 10-17 10:00 ?2778次閱讀
    使用瑞薩RUHMI<b class='flag-5'>工具</b>實(shí)現(xiàn)<b class='flag-5'>AI</b>模型<b class='flag-5'>部署</b>過程

    使用OpenVINO將PP-OCRv5模型部署Intel顯卡

    個(gè)用于優(yōu)化和部署人工智能(AI)模型,提升AI推理性能的開源工具集合,不僅支持以卷積神經(jīng)網(wǎng)絡(luò)
    的頭像 發(fā)表于 09-20 11:17 ?1247次閱讀
    使用OpenVINO將PP-OCRv5模型<b class='flag-5'>部署</b><b class='flag-5'>在</b>Intel顯卡<b class='flag-5'>上</b>

    新唐科技推出高效AI MCU部署工具NuML Toolkit

    ,這套工具整合模型轉(zhuǎn)換、項(xiàng)目生成、部署與除錯(cuò)流程,特別針對(duì) NuMicro M55M1 微控制器平臺(tái)優(yōu)化,廣受使用者致好評(píng)。
    的頭像 發(fā)表于 08-01 17:21 ?2291次閱讀

    AI的未來,屬于那些既能寫代碼,又能焊電路的“雙棲人才”

    AI的未來,屬于那些既能寫代碼,又能焊電路的“雙棲人才”——來自WAIC 2025的線觀察2025年7月,上海世博中心,**第七屆世界人工智能大會(huì)(WAIC 2025)**,我們看
    發(fā)表于 07-30 16:15

    基于米爾瑞芯微RK3576開發(fā)板部署運(yùn)行TinyMaix:超輕量級(jí)推理框架

    推理庫(kù),可以讓你在任意低資源MCU運(yùn)行輕量級(jí)深度學(xué)習(xí)模型。關(guān)鍵特性核心代碼少于 400行(tm_layers.c+tm_model.c+arch_cpu.h), 代碼段(.text
    發(fā)表于 07-25 16:35

    STM32F769是否可以部署邊緣AI?

    STM32F769是否可以部署邊緣AI
    發(fā)表于 06-17 06:44

    AI端側(cè)部署開發(fā)(SC171開發(fā)套件V3)

    AI端側(cè)部署開發(fā)(SC171開發(fā)套件V3) 序列 課程名稱 視頻課程時(shí)長(zhǎng) 視頻課程鏈接 課件鏈接 工程源碼 1 Fibo AI Stack模型轉(zhuǎn)化指南------Docker Desktop環(huán)境操作
    發(fā)表于 04-16 18:30

    谷歌新一代 TPU 芯片 Ironwood:助力大規(guī)模思考與推理AI 模型新引擎?

    電子發(fā)燒友網(wǎng)報(bào)道(文 / 李彎彎)日前,谷歌 Cloud Next 大會(huì)上,隆重推出了最新一代 TPU AI 加速芯片 ——Ironwood。據(jù)悉,該芯片預(yù)計(jì)于今年晚些時(shí)候面向 Google
    的頭像 發(fā)表于 04-12 00:57 ?3741次閱讀

    【幸狐Omni3576邊緣計(jì)算套件試用體驗(yàn)】DeepSeek 部署及測(cè)試

    開源。 部署方案 目前幸狐 Omni3576 板端部署 Deepseek 提供了兩種方法,分別是使用 Ollama 工具部署和使用瑞芯微官
    發(fā)表于 03-21 19:31