91欧美超碰AV自拍|国产成年人性爱视频免费看|亚洲 日韩 欧美一厂二区入|人人看人人爽人人操aV|丝袜美腿视频一区二区在线看|人人操人人爽人人爱|婷婷五月天超碰|97色色欧美亚州A√|另类A√无码精品一级av|欧美特级日韩特级

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

通過(guò)稀疏性支持和變壓器優(yōu)化增強(qiáng)AI推理

星星科技指導(dǎo)員 ? 來(lái)源:嵌入式計(jì)算設(shè)計(jì) ? 作者:Saumitra Jagdale ? 2022-10-18 09:32 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

英偉達(dá)張量RT 8 概述

NVIDIA 張量RT 是一個(gè)高性能推理平臺(tái),對(duì)于利用 NVIDIA 張量核心 GPU 的強(qiáng)大功能至關(guān)重要。TensorRT 8 是一個(gè)具有增強(qiáng)功能的軟件開發(fā)工具包,旨在提高性能和準(zhǔn)確性,以應(yīng)對(duì)邊緣和嵌入式設(shè)備中發(fā)生的越來(lái)越多的 AI 推理。它允許對(duì)張量流和PyTorch神經(jīng)網(wǎng)絡(luò)進(jìn)行廣泛的計(jì)算推斷。

與僅 CPU 平臺(tái)相比,TensorRT 可提供高達(dá) 40 倍的吞吐量,同時(shí)最大限度地減少延遲。它允許您從任何框架開始,并在生產(chǎn)中快速優(yōu)化、驗(yàn)證和部署經(jīng)過(guò)訓(xùn)練的神經(jīng)網(wǎng)絡(luò)。

新版本在 NVIDIA 安培 GPU 上集成了稀疏性,可修剪對(duì)網(wǎng)絡(luò)整體計(jì)算無(wú)貢獻(xiàn)的弱連接。此外,張量RT 8 支持變壓器優(yōu)化和 BERT 大。變壓器優(yōu)化可提高性能,而量化感知訓(xùn)練可提高準(zhǔn)確性。

英偉達(dá)的張量RT 8 有什么新功能?

推理的目的是在訓(xùn)練階段盡可能多地保持準(zhǔn)確性。訓(xùn)練的模型可以在硬件設(shè)備上運(yùn)行,以獲得客戶的最低響應(yīng)時(shí)間和最大的吞吐量。但是,盡可能精確的必要性有時(shí)可能與邊緣可用的內(nèi)存量和吞吐量發(fā)生沖突。訓(xùn)練有素、高度準(zhǔn)確的模型可能運(yùn)行速度太慢。

因此,TensorRT版本8結(jié)合了深度學(xué)習(xí)推理或訓(xùn)練的神經(jīng)網(wǎng)絡(luò)模型應(yīng)用的最新進(jìn)展,以理解數(shù)據(jù)如何影響響應(yīng)。它使用兩個(gè)主要功能將語(yǔ)言查詢推理時(shí)間減少一半:

英偉達(dá)安培架構(gòu)的稀疏性

深度神經(jīng)網(wǎng)絡(luò)擅長(zhǎng)各種任務(wù),如計(jì)算機(jī)視覺語(yǔ)音識(shí)別和自然語(yǔ)言處理。隨著處理這些神經(jīng)網(wǎng)絡(luò)所需的計(jì)算能力的增加,高效的建模和計(jì)算變得越來(lái)越重要。

稀疏是采用 NVIDIA 安培架構(gòu)的 GPU 的一種全新性能方法,通過(guò)減少計(jì)算流程來(lái)提高開發(fā)人員的效率。深度學(xué)習(xí)模型的其他方面不如其他方面重要,有些甚至可能為零。因此,神經(jīng)網(wǎng)絡(luò)不需要對(duì)特定權(quán)重或參數(shù)進(jìn)行計(jì)算。因此,NVIDIA 可以通過(guò)使用稀疏性將模型的權(quán)重減少近一半來(lái)增強(qiáng)性能、吞吐量和延遲。

通過(guò)變壓器優(yōu)化減少推理計(jì)算

在張量RT 8中,性能增強(qiáng)是通過(guò)變壓器優(yōu)化實(shí)現(xiàn)的。量化開發(fā)人員可以利用訓(xùn)練的模型通過(guò) 8 位計(jì)算 (INT8) 執(zhí)行推理。這大大減少了張量核心中的推理計(jì)算和存儲(chǔ)。INT8 越來(lái)越多地用于優(yōu)化機(jī)器學(xué)習(xí)框架,如張量流和 NVIDIA 的張量壓縮包,以減少內(nèi)存和計(jì)算需求。因此,NVIDIA可以在張量RT 8上提供非常高的性能,同時(shí)保持準(zhǔn)確性。

例如,量化感知訓(xùn)練 (QAT) 有可能將準(zhǔn)確性提高一倍。因此,與舊版本張量RT 7相比,張量RT 8可以將許多模型的性能提高一倍。

張量RT部署在眾多行業(yè)中

TensorRT更好的性能和準(zhǔn)確性使其成為醫(yī)療保健,汽車,互聯(lián)網(wǎng)/電信服務(wù),金融服務(wù)和零售等行業(yè)的熱門選擇。例如,張量RT用于為GE醫(yī)療保健的心血管超聲系統(tǒng)提供動(dòng)力。數(shù)字診斷解決方案提供商使用該技術(shù)在其 Vivid E95 掃描器上加速了自動(dòng)心臟視圖檢測(cè)。心臟病專家可以通過(guò)使用改進(jìn)的視圖檢測(cè)算法,在早期階段做出更準(zhǔn)確的診斷和檢測(cè)疾病。此外,TensorRT還被Verizon,福特,美國(guó)郵政服務(wù),美國(guó)運(yùn)通和其他知名公司使用。

隨著張量RT 8的發(fā)布,NVIDIA還推出了使用張量RT的Google BERT大推理的突破,來(lái)自變形金剛的雙向編碼器表示(BERT)是一種基于變壓器的機(jī)器學(xué)習(xí)技術(shù),用于預(yù)訓(xùn)練自然語(yǔ)言處理。BERT-Large 模型只需 1.2 毫秒進(jìn)行分析,從而可以實(shí)時(shí)響應(yīng)自然語(yǔ)言查詢。這意味著公司可以將其模型的尺寸增加一倍或三倍,以提高準(zhǔn)確性。

像 BERT-Large 這樣的語(yǔ)言模型被許多推理服務(wù)在幕后使用。另一方面,基于語(yǔ)言的應(yīng)用程序通常無(wú)法識(shí)別細(xì)微差別或情感,從而導(dǎo)致整體糟糕的體驗(yàn)?,F(xiàn)在,公司可以使用張量RT 8在幾毫秒內(nèi)部署整個(gè)工作流程。這些突破可以為新一代對(duì)話式AI應(yīng)用程序鋪平道路,為用戶提供更智能、更低的延遲體驗(yàn)。

審核編輯:郭婷

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • AI
    AI
    +關(guān)注

    關(guān)注

    91

    文章

    40086

    瀏覽量

    301719
  • 變壓器
    +關(guān)注

    關(guān)注

    0

    文章

    1899

    瀏覽量

    4010
收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評(píng)論

    相關(guān)推薦
    熱點(diǎn)推薦

    船用變壓器怕潮濕?CSD船用變壓器防潮好嗎?

    成本高、耽誤航行。到底有沒有防潮好的船用變壓器?CSD船用變壓器,密封防潮,輕松應(yīng)對(duì)海洋高濕環(huán)境。核心科普:海洋高濕環(huán)境,防潮是變壓器的核心要求海洋環(huán)境的相對(duì)濕度可
    的頭像 發(fā)表于 03-05 11:05 ?124次閱讀
    船用<b class='flag-5'>變壓器</b>怕潮濕?CSD船用<b class='flag-5'>變壓器</b>防潮<b class='flag-5'>性</b>好嗎?

    128周才能交貨!AI狂潮下,全球數(shù)據(jù)中心排隊(duì)等變壓器?

    %左右。 ? 如此龐大的能源消耗背后,是電力基礎(chǔ)設(shè)施的全面升級(jí),其中變壓器作為電能傳輸與轉(zhuǎn)換的核心設(shè)備,正從傳統(tǒng)電網(wǎng)配角躍升為AI時(shí)代不可或缺的設(shè)備。就在近期,中國(guó)變壓器成為硬通貨的話題引起廣泛關(guān)注與討論。 ? ? 交付周期超三
    的頭像 發(fā)表于 01-30 09:06 ?5990次閱讀

    音頻變壓器:守護(hù)音質(zhì)傳輸?shù)暮诵碾娮咏M件

    信號(hào)純凈度。級(jí)間變壓器位于前后級(jí)放大器之間,需具備寬頻帶耦合特性,常見電壓比為1:1或1:2,支持推挽放大電路的差分輸入需求,典型應(yīng)用于膽機(jī)功放的前后級(jí)耦合,通過(guò)倒相功能確保信號(hào)相位一致
    發(fā)表于 01-09 09:01

    損耗↓15%!AI服務(wù)電源變壓器解法新思路

    千赫茲甚至接近兆赫茲區(qū)間。 在這一過(guò)程中,變壓器產(chǎn)品所承受的工作條件已明顯不同于傳統(tǒng)服務(wù)時(shí)代。高頻化帶來(lái)的損耗放大、散熱受限以及寄生參數(shù)問題,使變壓器產(chǎn)品逐漸成為制約電源系統(tǒng)進(jìn)一步優(yōu)化
    的頭像 發(fā)表于 01-07 13:54 ?367次閱讀
    損耗↓15%!<b class='flag-5'>AI</b>服務(wù)<b class='flag-5'>器</b>電源<b class='flag-5'>變壓器</b>解法新思路

    什么是UL變壓器

    與評(píng)估,并確認(rèn)符合特定UL安全標(biāo)準(zhǔn)的變壓器。 簡(jiǎn)單來(lái)說(shuō),它包含兩個(gè)關(guān)鍵點(diǎn): ? ?它是一個(gè)變壓器? ?:完成電壓轉(zhuǎn)換(如480V轉(zhuǎn)380V)、電氣隔離等功能。 ? ?它擁有UL認(rèn)證? ?:這個(gè)“認(rèn)證”是一個(gè)標(biāo)志,證明該變壓器的安
    的頭像 發(fā)表于 10-20 15:18 ?738次閱讀
    什么是UL<b class='flag-5'>變壓器</b>

    【「AI芯片:科技探索與AGI愿景」閱讀體驗(yàn)】+AI芯片到AGI芯片

    和計(jì)算成本。 核心: MoE模型利用稀疏驅(qū)動(dòng)結(jié)構(gòu),通過(guò)包含多個(gè)專家網(wǎng)絡(luò)的稀疏MoE層替換密集層,其中每個(gè)專家致力于特定的訓(xùn)練數(shù)據(jù)或任務(wù)的子集,并且一個(gè)可訓(xùn)練的門控機(jī)制動(dòng)態(tài)地將輸入標(biāo)記
    發(fā)表于 09-18 15:31

    干式變壓器線圈制造詳細(xì)步驟解析

    在現(xiàn)代電力系統(tǒng)中,干式變壓器扮演著至關(guān)重要的角色,為各種電氣設(shè)備提供穩(wěn)定、可靠的電力支持,而干式變壓器線圈作為其核心部件之一,其性能與質(zhì)量直接影響著整個(gè)變壓器的運(yùn)行效能、安全
    的頭像 發(fā)表于 08-11 14:40 ?1048次閱讀
    干式<b class='flag-5'>變壓器</b>線圈制造詳細(xì)步驟解析

    信而泰×DeepSeek:AI推理引擎驅(qū)動(dòng)網(wǎng)絡(luò)智能診斷邁向 “自愈”時(shí)代

    網(wǎng)絡(luò)智能診斷平臺(tái)。通過(guò)對(duì)私有化網(wǎng)絡(luò)數(shù)據(jù)的定向訓(xùn)練,信而泰打造了高性能、高可靠的網(wǎng)絡(luò)診斷模型,顯著提升了AI輔助診斷的精準(zhǔn)度與實(shí)用。該方案實(shí)現(xiàn)了網(wǎng)絡(luò)全流量深度解析能力與
    發(fā)表于 07-16 15:29

    華興變壓器:智能化監(jiān)測(cè)服務(wù),為BK機(jī)床控制變壓器保駕護(hù)航

    在自動(dòng)化生產(chǎn)線中,BK機(jī)床控制變壓器的可靠是確保生產(chǎn)順利進(jìn)行的關(guān)鍵。華興變壓器通過(guò)一系列創(chuàng)新舉措,成功提升了BK機(jī)床控制變壓器的可靠
    的頭像 發(fā)表于 07-08 14:55 ?523次閱讀
    華興<b class='flag-5'>變壓器</b>:智能化監(jiān)測(cè)服務(wù),為BK機(jī)床控制<b class='flag-5'>變壓器</b>保駕護(hù)航

    反激變換變壓器

    主要內(nèi)容 磁性元件對(duì)功率變換發(fā)展的重要 反激式變壓器的設(shè)計(jì)考慮 反激式變壓器雜散參數(shù)的效應(yīng) 反激式變壓器的磁(場(chǎng))特性-感性效應(yīng) 反激
    發(fā)表于 07-01 15:32

    MAX13253ATB+T 1A、擴(kuò)頻、推挽式變壓器驅(qū)動(dòng),用于隔離電源

    一、產(chǎn)品概述 MAX13253ATB+T是一款 1A推挽式變壓器驅(qū)動(dòng) ,專為簡(jiǎn)化低EMI隔離電源設(shè)計(jì)而優(yōu)化。其核心價(jià)值在于通過(guò)單芯片集成振蕩
    發(fā)表于 06-18 11:56

    變壓器的設(shè)計(jì)實(shí)例(帶公式計(jì)算)

    部分,更加要求效率高、成本小、體積小、重量輕、具有可移動(dòng)和能夠模塊化。變壓器作為開關(guān)電源必不可少磁性元件,對(duì)其進(jìn)行合理優(yōu)化設(shè)計(jì)顯得非常重要。在高頻開關(guān)電源設(shè)計(jì)中,真止難以把握是磁路部分設(shè)計(jì),開關(guān)電源
    發(fā)表于 05-23 17:45

    變壓器與電感設(shè)計(jì)手冊(cè)

    本書涉及了用于輕質(zhì)量、高頻率航空航天變壓器和低頻率、工業(yè)用變壓器設(shè)計(jì)的全部關(guān)鍵元器件。 修訂和擴(kuò)展的目的在于展示磁器件設(shè)計(jì)領(lǐng)域當(dāng)前的技術(shù)水平,此第三版給出了變壓器和電感設(shè)計(jì)的實(shí)際方法
    發(fā)表于 05-13 17:04

    隔離變壓器和普通變壓器有什么不同

    在現(xiàn)代社會(huì)的日常生活中,電力已經(jīng)成為不可或缺的一部分,而變壓器作為電力傳輸中的關(guān)鍵設(shè)備,隔離變壓器和普通變壓器是兩種常見的類型,它們?cè)诮Y(jié)構(gòu)、工作原理、應(yīng)用場(chǎng)景等方面存在顯著差異,下面小編來(lái)說(shuō)說(shuō)隔離
    的頭像 發(fā)表于 04-26 15:15 ?3304次閱讀

    一種分段氣隙的CLLC變換平面變壓器設(shè)計(jì)

    一種路徑,采用磁集成方法,對(duì)1MHz雙向CLLC變換變壓器進(jìn)行研究、設(shè)計(jì)與測(cè)試,通過(guò)優(yōu)化PCB繞線方法、進(jìn)行仿真優(yōu)化,提出了一種分段氣隙
    發(fā)表于 03-27 13:57