91欧美超碰AV自拍|国产成年人性爱视频免费看|亚洲日韩欧美一厂二区入|人人看人人爽人人操aV|丝袜美腿视频一区二区在线看|人人操人人爽人人爱|婷婷五月天超碰|97色色欧美亚州A√|另类A√无码精品一级av|欧美特级日韩特级

<button id="ygy4o"></button>

<code id="ygy4o"></code>

搜索歷史

清空

搜索熱詞

0

聊天消息
系統(tǒng)消息
評論與回復(fù)

查看更多

查看更多

查看更多

VIP于到期續(xù)費(fèi)

登錄后你可以

下載海量資料
學(xué)習(xí)在線課程
觀看技術(shù)視頻
寫文章/發(fā)帖/加入社區(qū)

會員中心

創(chuàng)作中心

發(fā)布

創(chuàng)作活動

完善資料讓更多小伙伴認(rèn)識你，還能領(lǐng)取20積分哦，立即完善>

3天內(nèi)不再提示

NVIDIA TensorRT插件的全自動生成工具

NVIDIA TensorRT 是性能最優(yōu)、應(yīng)用最廣的 GPU 推理框架，但用戶常常因?yàn)椴恢С值乃阕佣媾R手寫插件的痛點(diǎn)。為此，騰訊 TEG 與 NVIDIA 聯(lián)合開發(fā)了一款能自動生成插件的工具：TensorRT Plugin Autogen Tool，簡稱 TPAT。它能支持幾乎所有的 ONNX 算子，在節(jié)省人力成本的同時，性能對比手寫插件也毫不遜色。

騰訊 TEG（技術(shù)工程團(tuán)隊(duì)）為騰訊各個團(tuán)隊(duì)提供技術(shù)與工程服務(wù)，日常任務(wù)是為各種產(chǎn)品提供工程設(shè)計(jì)與實(shí)現(xiàn)，以滿足其他團(tuán)隊(duì)的業(yè)務(wù)需要。

隨著 AI 應(yīng)用的普及，騰訊 TEG 在深度學(xué)習(xí)模型的推理上也開始了技術(shù)積累。騰訊 TEG 選擇了TensorRT作為 NVIDIA GPU 上推理應(yīng)用的基礎(chǔ)軟件，開發(fā)了大量基于 TensorRT 的 AI 模型，并與 NVIDIA 展開了深入合作。

TensorRT 是一個由 NVIDIA 開發(fā)的用于推理的高性能 SDK，包含深度學(xué)習(xí)推理優(yōu)化器和運(yùn)行時環(huán)境，可以為深度學(xué)習(xí)推理應(yīng)用提供低延遲和高吞吐量，這也是 TensorRT 相比其他框架最大的優(yōu)勢。

不過，TensorRT 也存在一定局限性，當(dāng)現(xiàn)有模型的算子不能被 TensorRT 直接支持時，工程師不得不手寫插件，比較耗時耗力。

騰訊 TEG 表示，手寫插件往往是 TensorRT 模型開發(fā)中最耗時的一部分，其難點(diǎn)在于：

手寫插件需要熟悉 TensorRT 插件的編程接口，需要學(xué)習(xí) GPU 和 CUDA 相關(guān)知識。

新入門的工程師通常需要 1~2 周時間來編寫一個算子實(shí)現(xiàn)，模型中如果包含多個不支持算子，就需要更多時間來逐個編寫和調(diào)試。

如果有一種自動生成插件的工具，將極大地提高 TensorRT 模型開發(fā)的效率，于是騰訊 TEG 與 NVIDIA 開展了這方面的合作，歷時數(shù)月，共同開發(fā)了TPAT（TensorRT Plugin Autogen Tool）。

TPAT 本質(zhì)上是對 TensorRT 的功能擴(kuò)展。它要解決的關(guān)鍵問題在于如下方面：

為了生成通用的插件，需要開發(fā)出 TensorRT 插件的代碼模板。與此同時，需要提供部分插件的手工參考實(shí)現(xiàn)，用于比對計(jì)算結(jié)果與性能。這一部分由 NVIDIA 負(fù)責(zé)。

對于給定的具體算子，其 GPU 上的 CUDA kernel 需要一種自動生成機(jī)制。經(jīng)騰訊 TEG 與 NVIDIA 協(xié)商，選擇 ONNX 作為候選算子集合，在編寫中間代碼之后由 TVM 生成 CUDA kernel。這一部分由騰訊 TEG 負(fù)責(zé)。

在完成上述開發(fā)之后，騰訊 TEG 與 NVIDIA 進(jìn)行聯(lián)調(diào)，并后續(xù)同步進(jìn)行版本迭代。

歷經(jīng)騰訊 TEG 與 NVIDIA 工程師的共同努力，TPAT 已正式發(fā)布 1.0 版本。它基于 TVM 和 ONNX，實(shí)現(xiàn)了 TensorRT 插件的全自動生成，使得 TensorRT 的部署和上線能基本流程化，不再需要人工參與。

另外，TPAT 全自動生成一個算子插件耗時僅需要 30-60 分鐘的時間（該時間用于搜索算子的高性能 CUDA kernel），TensorRT 會因此成為一個真正端到端的推理框架。

TPAT 亮點(diǎn):

覆蓋度：幾乎支持 ONNX 所有的算子

全自動：端到端全自動生成用戶指定的 TensorRT Plugin

高性能：大部分算子的性能與手寫插件相比并不遜色

值得一提的是，最新發(fā)布的 TPAT 也支持了動態(tài) batch，從而成為真正具有業(yè)界實(shí)用性的工具。

TPAT 已經(jīng)用在了騰訊游戲中心的多個游戲 AI 模型上，體現(xiàn)了優(yōu)秀的好用性與性能。此外，很多其他騰訊團(tuán)隊(duì)也對 TPAT 感興趣，在評估與嘗試部署 TPAT 生成的 TensorRT 模型。

“對內(nèi)部業(yè)務(wù)模型里的部分算子進(jìn)行了測試，TPAT 的性能幾乎全面達(dá)到甚至超越 CUDA 工程師手寫的插件，并且端到端的設(shè)計(jì)能夠大幅減少人力投入。”來自騰訊 TEG 的工程師邱騫表示。

審核編輯：湯梓紅

聲明：本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人，不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用，如有內(nèi)容侵權(quán)或者其他違規(guī)問題，請聯(lián)系本站處理。舉報投訴

NVIDIA

NVIDIA

+關(guān)注

關(guān)注
14

文章
5598

瀏覽量
109805
gpu

gpu

+關(guān)注

關(guān)注
28

文章
5198

瀏覽量
135521

原文標(biāo)題：騰訊 TEG 與 NVIDIA 團(tuán)隊(duì)共同開發(fā) TPAT：TensorRT 插件的全自動生成工具

文章出處：【微信號：NVIDIA-Enterprise，微信公眾號：NVIDIA英偉達(dá)企業(yè)解決方案】歡迎添加關(guān)注！文章轉(zhuǎn)載請注明出處。

評論

電子發(fā)燒友

My ElecFans

APP
網(wǎng)站地圖

設(shè)計(jì)技術(shù)

可編程邏輯

電源/新能源

MEMS/傳感技術(shù)

測量儀表

嵌入式技術(shù)

制造/封裝

模擬技術(shù)

RF/無線

接口/總線/驅(qū)動

處理器/DSP

EDA/IC設(shè)計(jì)

存儲技術(shù)

光電顯示

EMC/EMI設(shè)計(jì)

連接器

行業(yè)應(yīng)用

LEDs

汽車電子

音視頻及家電

通信網(wǎng)絡(luò)

醫(yī)療電子

人工智能

虛擬現(xiàn)實(shí)

可穿戴設(shè)備

機(jī)器人

安全設(shè)備/系統(tǒng)

軍用/航空電子

移動通信

工業(yè)控制

便攜設(shè)備

觸控感測

物聯(lián)網(wǎng)

智能電網(wǎng)

區(qū)塊鏈

新科技

特色內(nèi)容

專欄推薦

學(xué)院

設(shè)計(jì)資源

設(shè)計(jì)技術(shù)

電子百科

電子視頻

元器件知識

工具箱

VIP會員

最新技術(shù)文章

產(chǎn)品地圖

品牌地圖

社區(qū)

小組

論壇

問答

評測試用

企業(yè)服務(wù)

產(chǎn)品

資料

文章

方案

企業(yè)

供應(yīng)鏈服務(wù)

硬件開發(fā)

媒體服務(wù)

網(wǎng)站廣告

在線研討會

活動策劃

新聞發(fā)布

新品發(fā)布

小測驗(yàn)

設(shè)計(jì)大賽

電子發(fā)燒友

關(guān)于我們

聯(lián)系我們

舉報投訴

社交網(wǎng)絡(luò)

微博

移動端

發(fā)燒友APP

WAP

聯(lián)系我們

廣告合作

王婉珠：wangwanzhu@elecfans.com

內(nèi)容合作

張迎輝：mikezhang@elecfans.com

關(guān)注我們的微信

下載發(fā)燒友APP

電子發(fā)燒友觀察

版權(quán)所有 ? 長沙勒克斯教育咨詢有限公司

湖南省長沙市開福區(qū)月湖街道匍園路20號聚恒科技園1棟2301-1房
電子發(fā)燒友 （電路圖） 湘公網(wǎng)安備43011202000918 工商網(wǎng)監(jiān) 湘ICP備2023036445號-105-1

感谢您访问我们的网站，您可能还对以下资源感兴趣：
91欧美超碰AV自拍|国产成年人性爱视频免费看|亚洲日韩欧美一厂二区入|人人看人人爽人人操aV|丝袜美腿视频一区二区在线看|人人操人人爽人人爱|婷婷五月天超碰|97色色欧美亚州A√|另类A√无码精品一级av|欧美特级日韩特级
国产操人视频在线|亚洲欧美第一区第二区在线视频观看|日本A片在线看一级无码片|sese国产sy导航|久久国产老熟女按摩AV|久久无码最新视频|免费靥色AV在线青草热|亚洲AV无码乱码一区二三区|成人免费在线A片|一级片在线免费天天久久 97亚洲国产怡红啊AV|a片大全免费在线观看|在线能看的黄色视频网站|日韩精品国模成人午夜福利|AV毛片在线看三级片黄片免费|日韩成人av在线观看|日本不卡小说欧美一区大毛片|超碰人妻AV在线|日韩精妻视频美日韩性爱|手机看片日韩一区二区图片一区中文字幕亚洲|国产在线一区二区三区有字幕|黄色影片无码五月亭AV|日韩一级久久视频|人人爱人人操人人爱|亚洲av激情电影|日韩一区二区三区制服师生中出|动漫五码中文字幕|日韩人妻精品中文字幕专区不卡|成人伦理Av一级一级a片