三级片日韩成人人妻一级,日本免费A图欧美三级片福利,嫩草91在线99国厂

PaddleSlim 發(fā)布 AI 模型自動壓縮的工具，帶來全新升級 AI 模型一鍵自動壓縮體驗。歡迎廣大開發(fā)者使用 NVIDIA 與飛槳聯(lián)合深度適配的 NGC 飛槳容器在 NVIDIA GPU 上體驗！

PaddleSlim 自動壓縮工具，

30+CV、NLP 模型實戰(zhàn)

眾所周知，計算機視覺技術(shù)（CV）是企業(yè)人工智能應(yīng)用比重最高的領(lǐng)域之一。為降低企業(yè)成本，工程師們一直在探索各類模型壓縮技術(shù)，來產(chǎn)出“更準、更小、更快”的 AI 模型部署落地。而在自然語言處理領(lǐng)域（NLP）中，隨著模型精度的不斷提升，模型的規(guī)模也越來越大，例如以 BERT、GPT 為代表的預訓練模型等，這成為企業(yè) NLP 模型部署落地的攔路虎。

針對企業(yè)落地模型壓縮迫切的需求，PaddleSlim 團隊開發(fā)了一個低成本、高收益的 AI 模型自動壓縮工具（ACT, Auto Compression Toolkit），無需修改訓練源代碼，通過幾十分鐘量化訓練，保證模型精度的同時，極大的減小模型體積，降低顯存占用，提升模型推理速度，助力 AI 模型的快速落地！

使用 ACT 中的基于知識蒸餾的量化訓練方法訓練 YOLOv7 模型，與原始的 FP32 模型相比，INT8 量化后的模型減小 75%，在 NVIDIA GPU 上推理加速 5.90 倍。

?表1 自動壓縮工具在 CV 模型上的壓縮效果和推理加速

使用 ACT 中的結(jié)構(gòu)化稀疏和蒸餾量化方法訓練 ERNIE3.0 模型，與原始的 FP32 對比，INT8 量化后的模型減小 185%，在 NVIDIA GPU 上推理加速 6.37 倍。

表2 自動壓縮工具在 NLP 模型上的壓縮效果和推理加速

支持如此強大功能的核心技術(shù)是來源于 PaddleSlim 團隊自研的自動壓縮工具。自動壓縮相比于傳統(tǒng)手工壓縮，自動化壓縮的“自動”主要體現(xiàn)在 4 個方面：解耦訓練代碼、離線量化超參搜索、算法自動組合和硬件感知。

圖1 傳統(tǒng)手工壓縮與自動化壓縮工具對比

圖2 傳統(tǒng)手工壓縮與自動化壓縮工具代碼量對比

更多詳細文檔，請參考：

https://github.com/PaddlePaddle/PaddleSlim/tree/develop/example/auto_compression

PaddleSlim 研發(fā)團隊詳解自動壓縮工具 CV 模型和NLP模型兩日課回放，可以掃描下方二維碼，加入自動壓縮技術(shù)官方交流群獲取。除此之外，入群福利還包括：深度學習學習資料、歷屆頂會壓縮論文、百度架構(gòu)師詳解自動壓縮等。

NGC 飛槳容器介紹

如果您希望體驗自動壓縮工具的新特性，歡迎使用 NGC 飛槳容器。NVIDIA 與百度飛槳聯(lián)合開發(fā)了 NGC 飛槳容器，將最新版本的飛槳與最新的 NVIDIA 的軟件棧（如 CUDA）進行了無縫的集成與性能優(yōu)化，最大程度的釋放飛槳框架在 NVIDIA 最新硬件上的計算能力。這樣，用戶不僅可以快速開啟 AI 應(yīng)用，專注于創(chuàng)新和應(yīng)用本身，還能夠在 AI 訓練和推理任務(wù)上獲得飛槳+NVIDIA 帶來的飛速體驗。

最佳的開發(fā)環(huán)境搭建工具 - 容器技術(shù)。

容器其實是一個開箱即用的服務(wù)器。極大降低了深度學習開發(fā)環(huán)境的搭建難度。例如你的開發(fā)環(huán)境中包含其他依賴進程（redis，MySQL，Ngnix，selenium-hub 等等），或者你需要進行跨操作系統(tǒng)級別的遷移。
容器鏡像方便了開發(fā)者的版本化管理
容器鏡像是一種易于復現(xiàn)的開發(fā)環(huán)境載體
容器技術(shù)支持多容器同時運行

最好的 PaddlePaddle 容器

NGC 飛槳容器針對 NVIDIA GPU 加速進行了優(yōu)化，并包含一組經(jīng)過驗證的庫，可啟用和優(yōu)化 NVIDIA GPU 性能。此容器還可能包含對 PaddlePaddle 源代碼的修改，以最大限度地提高性能和兼容性。此容器還包含用于加速 ETL（DALI，RAPIDS）、訓練（cuDNN，NCCL）和推理（TensorRT）工作負載的軟件。

PaddlePaddle 容器具有以下優(yōu)點：

適配最新版本的 NVIDIA 軟件棧（例如最新版本 CUDA），更多功能，更高性能。
更新的 Ubuntu 操作系統(tǒng)，更好的軟件兼容性
按月更新
滿足 NVIDIA NGC 開發(fā)及驗證規(guī)范，質(zhì)量管理

通過飛槳官網(wǎng)快速獲取

環(huán)境準備

使用 NGC 飛槳容器需要主機系統(tǒng)（Linux）安裝以下內(nèi)容：

Docker 引擎
NVIDIA GPU 驅(qū)動程序
NVIDIA 容器工具包

有關(guān)支持的版本，請參閱 NVIDIA 框架容器支持矩陣和 NVIDIA 容器工具包文檔。

不需要其他安裝、編譯或依賴管理。無需安裝 NVIDIA CUDA Toolkit。

NGC 飛槳容器正式安裝：

要運行容器，請按照 NVIDIA Containers For Deep Learning Frameworks User’s Guide 中 Running A Container 一章中的說明發(fā)出適當?shù)拿?，并指定注冊表、存儲庫?a target="_blank">標簽。有關(guān)使用 NGC 的更多信息，請參閱 NGC 容器用戶指南。如果您有 Docker 19.03 或更高版本，啟動容器的典型命令是：

*詳細安裝介紹《NGC 飛槳容器安裝指南》

https://www.paddlepaddle.org.cn/documentation/docs/zh/install/install_NGC_PaddlePaddle_ch.html

*詳細產(chǎn)品介紹視頻

【飛槳開發(fā)者說｜NGC 飛槳容器全新上線 NVIDIA 產(chǎn)品專家全面解讀】

https://www.bilibili.com/video/BV16B4y1V7ue?share_source=copy_web&vd_source=266ac44430b3656de0c2f4e58b4daf82

原文標題：在 NVIDIA NGC 上搞定模型自動壓縮，YOLOv7 部署加速比 5.90，BERT 部署加速比 6.22

文章出處：【微信公眾號：NVIDIA英偉達】歡迎添加關(guān)注！文章轉(zhuǎn)載請注明出處。

聲明：本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人，不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學習之用，如有內(nèi)容侵權(quán)或者其他違規(guī)問題，請聯(lián)系本站處理。舉報投訴