91欧美超碰AV自拍|国产成年人性爱视频免费看|亚洲 日韩 欧美一厂二区入|人人看人人爽人人操aV|丝袜美腿视频一区二区在线看|人人操人人爽人人爱|婷婷五月天超碰|97色色欧美亚州A√|另类A√无码精品一级av|欧美特级日韩特级

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫(xiě)文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

關(guān)于深度學(xué)習(xí)硬件加速器的介紹和應(yīng)用

西門(mén)子EDA ? 來(lái)源:djl ? 2019-10-11 14:59 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

Chips&Media 成功采用 Mentor Catapult High-Level Synthesis (HLS) 平臺(tái)實(shí)現(xiàn)了首個(gè)計(jì)算機(jī)視覺(jué) IP;

Chips&Media 通過(guò) Catapult HLS 將模塊設(shè)計(jì)/驗(yàn)證時(shí)間縮短了一半,并實(shí)現(xiàn)了關(guān)鍵的現(xiàn)場(chǎng)可編程門(mén)陣列 (FPGA) 演示系統(tǒng);

Catapult HLS 方法論使探索多種架構(gòu)并為深度神經(jīng)網(wǎng)絡(luò)加速器尋找最佳實(shí)現(xiàn)方案成為了可能。

Mentor, A Siemens Business 宣布 Chips&Media 已成功部署 Mentor Catapult HLS 平臺(tái),將使用深度神經(jīng)網(wǎng)絡(luò) (DNN) 算法設(shè)計(jì)和驗(yàn)證其 c.WAVE 計(jì)算機(jī)視覺(jué) IP 的實(shí)時(shí)對(duì)象檢測(cè)。Chips&Media 是一家面向片上系統(tǒng) (SoC) 設(shè)計(jì)高性能、高質(zhì)量視頻 IP 的領(lǐng)先供應(yīng)商,其產(chǎn)品廣泛應(yīng)用于汽車(chē)、監(jiān)控和消費(fèi)電子領(lǐng)域。

Chips&Media 需要通過(guò)減少功能驗(yàn)證時(shí)間、時(shí)序收斂、自定義和最終優(yōu)化來(lái)大幅提高生產(chǎn)力,把更多時(shí)間用于機(jī)器算法和架構(gòu)的研發(fā)上,從而為客戶快速提供差異化的機(jī)器學(xué)習(xí) IP。為實(shí)現(xiàn)這些目標(biāo),他們棄用了傳統(tǒng)的手工編碼寄存器傳輸級(jí) (RTL) 流程,轉(zhuǎn)而采用 Catapult HLS 平臺(tái),以使用 C 語(yǔ)言編寫(xiě)算法和驗(yàn)證平臺(tái)。與同一項(xiàng)目中使用 RTL 流程的團(tuán)隊(duì)相比,HLS 設(shè)計(jì)和驗(yàn)證團(tuán)隊(duì)將項(xiàng)目時(shí)間縮短了一半。

“要應(yīng)對(duì)以推理為目標(biāo)的設(shè)備帶來(lái)的加速挑戰(zhàn),我們認(rèn)為關(guān)鍵在于使用深度神經(jīng)網(wǎng)絡(luò)建立一個(gè)專(zhuān)注于功耗、性能和面積 (PPA) 并高度優(yōu)化的硬件架構(gòu),”Chips&Media 首席技術(shù)官 Mickey Jeon 表示?!癏LS 使我們能夠極其高效地完成這項(xiàng)工作。我們的項(xiàng)目取得了突出的成績(jī),我們計(jì)劃在接下來(lái)的項(xiàng)目中部署應(yīng)用 Catapult 的 HLS 流程?!?/p>

基于 DNN 的計(jì)算機(jī)視覺(jué)處理的特征,就是乘法/加法/累加的重復(fù)計(jì)算,同時(shí)通過(guò)神經(jīng)網(wǎng)絡(luò)層進(jìn)行大量數(shù)據(jù)遷移。DNN 是在 Caffe 或 TensorFlow 等框架上開(kāi)發(fā)的,然后在 C 模型中捕獲其算法。Chips&Media 將此算法 C 模型改進(jìn)為可綜合的 C 代碼,并使用 Catapult HLS 平臺(tái)快速探索各種架構(gòu)并綜合到 RTL 中,以找到此類(lèi)設(shè)計(jì)的最佳解決方案。

“根據(jù)我們的觀察,在市場(chǎng)快速變化的多個(gè)應(yīng)用領(lǐng)域,采用 Catapult HLS 是提高生產(chǎn)力來(lái)獲得成功的唯一途徑,”Mentor 數(shù)字設(shè)計(jì)和實(shí)施解決方案總經(jīng)理 Badru Agarwala 表示?!拔覀円恢迸c Chips&Media 密切合作,以確保他們平穩(wěn)過(guò)渡到 HLS。該平臺(tái)可以讓他們專(zhuān)注于算法/架構(gòu)設(shè)計(jì),而不是底層實(shí)現(xiàn)和調(diào)試等細(xì)節(jié),從而更快地把想法變成產(chǎn)品,然后推向市場(chǎng)?!?/p>

借助 Catapult HLS 平臺(tái),設(shè)計(jì)人員便能利用行業(yè)標(biāo)準(zhǔn) ANSI C++ 和 SystemC 來(lái)描述功能意圖,并將其提高到生產(chǎn)率更高的抽象層次。根據(jù)這些高層次的描述,Catapult 即可快速生成產(chǎn)品級(jí)的 RTL。Catapult 平臺(tái)將綜合與形式 C 屬性檢查功能相結(jié)合,以便及早發(fā)現(xiàn) C++/SystemC 級(jí)別的錯(cuò)誤并在綜合之前全面驗(yàn)證源代碼。高度交互的 Catapult 工作流程可提供對(duì)綜合過(guò)程的完全可見(jiàn)性和控制,使設(shè)計(jì)人員能夠迅速收斂到 PPA 的最佳實(shí)現(xiàn)方案。此外,Catapult 的高級(jí)功耗優(yōu)化功能也可以自動(dòng)大幅降低動(dòng)態(tài)功耗。

聲明:本文內(nèi)容及配圖由入駐作者撰寫(xiě)或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問(wèn)題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評(píng)論

    相關(guān)推薦
    熱點(diǎn)推薦

    FPGA硬件加速卡設(shè)計(jì)原理圖:1-基于Xilinx XCKU115的半高PCIe x8 硬件加速卡 PCIe半高 XCKU115-3-FLVF1924-E芯片

    FPGA硬件加速, PCIe半高卡, XCKU115, 光纖采集卡, 信號(hào)計(jì)算板, 硬件加速
    的頭像 發(fā)表于 02-12 09:52 ?403次閱讀
    FPGA<b class='flag-5'>硬件加速</b>卡設(shè)計(jì)原理圖:1-基于Xilinx XCKU115的半高PCIe x8 <b class='flag-5'>硬件加速</b>卡 PCIe半高 XCKU115-3-FLVF1924-E芯片

    工業(yè)級(jí)-專(zhuān)業(yè)液晶圖形顯示加速器RA8889ML3N簡(jiǎn)介+顯示方案選型參考表

    本帖最后由 MTCN2013 于 2025-11-17 15:23 編輯 專(zhuān)業(yè)液晶圖形顯示加速器能夠有效減少對(duì)MCU運(yùn)算資源的占用,對(duì)于只需普通單片機(jī)運(yùn)算資源的儀器儀表來(lái)說(shuō),專(zhuān)業(yè)圖形顯示加速器
    發(fā)表于 11-14 16:03

    邊緣計(jì)算中的AI加速器類(lèi)型與應(yīng)用

    人工智能正在推動(dòng)對(duì)更快速、更智能、更高效計(jì)算的需求。然而,隨著每秒產(chǎn)生海量數(shù)據(jù),將所有數(shù)據(jù)發(fā)送至云端處理已變得不切實(shí)際。這正是邊緣計(jì)算中AI加速器變得不可或缺的原因。這種專(zhuān)用硬件能夠直接在邊緣設(shè)備上
    的頭像 發(fā)表于 11-06 13:42 ?825次閱讀
    邊緣計(jì)算中的AI<b class='flag-5'>加速器</b>類(lèi)型與應(yīng)用

    常用硬件加速的方法

    之前總結(jié)了一些常用硬件加速方法 1)面積換速度:也就是串轉(zhuǎn)并運(yùn)算,可以多個(gè)模塊同時(shí)計(jì)算; 2)時(shí)間換空間:時(shí)序收斂下通過(guò)頻率提高性能,雖然面積可能稍微加大點(diǎn); 3)流水線操作:流水線以面積換性能,以
    發(fā)表于 10-29 06:20

    硬件協(xié)同技術(shù)分享 - 任務(wù)劃分 + 自定義指令集

    開(kāi)發(fā)技術(shù)。分文將分享介紹硬件加速器與軟件結(jié)合的協(xié)同開(kāi)發(fā)方式 軟硬件任務(wù)劃分 我們的硬件設(shè)計(jì)涉及到MFCC模塊。直接交由CPU的一次指令的五級(jí)流水線處理在麥克風(fēng)數(shù)據(jù)取入上的資源耗費(fèi)
    發(fā)表于 10-28 08:03

    硬件加速模塊的時(shí)鐘設(shè)計(jì)

    硬件加速模塊需要四個(gè)時(shí)鐘,分別為clk_l , clk_r , clk_c , clk_n 。 clk_l : 整個(gè)硬件加速模塊為了最大化的節(jié)約時(shí)間成本而采用了類(lèi)似處理的流水線設(shè)計(jì),具體上將每一層
    發(fā)表于 10-23 07:28

    如何驗(yàn)證硬件加速是否真正提升了通信協(xié)議的安全性?

    驗(yàn)證硬件加速是否真正提升通信協(xié)議的安全性,需從 安全功能正確性、抗攻擊能力增強(qiáng)、安全性能適配、合規(guī)一致性 等核心維度展開(kāi),結(jié)合實(shí)驗(yàn)室測(cè)試與真實(shí)場(chǎng)景驗(yàn)證,避免 “硬件參與即安全提升” 的表面判斷。以下
    的頭像 發(fā)表于 08-27 10:16 ?1168次閱讀
    如何驗(yàn)證<b class='flag-5'>硬件加速</b>是否真正提升了通信協(xié)議的安全性?

    有哪些方法可以確保硬件加速與通信協(xié)議的兼容性?

    ? 確保硬件加速與通信協(xié)議的兼容性,核心是從 硬件選型、協(xié)議標(biāo)準(zhǔn)匹配、軟硬件接口適配、全場(chǎng)景測(cè)試驗(yàn)證 四個(gè)維度建立閉環(huán),避免因硬件功能缺失、接口不兼容或協(xié)議特性支持不全導(dǎo)致的性能損耗、
    的頭像 發(fā)表于 08-27 10:07 ?1112次閱讀

    如何利用硬件加速提升通信協(xié)議的安全性?

    產(chǎn)品實(shí)拍圖 利用硬件加速提升通信協(xié)議安全性,核心是通過(guò) 專(zhuān)用硬件模塊或可編程硬件 ,承接軟件層面難以高效處理的安全關(guān)鍵操作(如加密解密、認(rèn)證、密鑰管理等),在提升性能的同時(shí),通過(guò)硬件級(jí)
    的頭像 發(fā)表于 08-27 09:59 ?1008次閱讀
    如何利用<b class='flag-5'>硬件加速</b>提升通信協(xié)議的安全性?

    英特爾Gaudi 2E AI加速器為DeepSeek-V3.1提供加速支持

    英特爾? Gaudi 2EAI加速器現(xiàn)已為DeepSeek-V3.1提供深度優(yōu)化支持。憑借出色的性能和成本效益,英特爾Gaudi 2E以更低的投入、更高的效率,實(shí)現(xiàn)從模型訓(xùn)練的深度突破到推理部署的實(shí)時(shí)響應(yīng),為大模型的
    的頭像 發(fā)表于 08-26 19:18 ?3052次閱讀
    英特爾Gaudi 2E AI<b class='flag-5'>加速器</b>為DeepSeek-V3.1提供<b class='flag-5'>加速</b>支持

    Andes晶心科技推出新一代深度學(xué)習(xí)加速器

    高效能、低功耗 32/64 位 RISC-V 處理核與 AI 加速解決方案的領(lǐng)導(dǎo)供貨商—Andes晶心科技(Andes Technology)今日正式發(fā)表最新深度學(xué)習(xí)
    的頭像 發(fā)表于 08-20 17:43 ?2450次閱讀

    大模型推理顯存和計(jì)算量估計(jì)方法研究

    GPU、FPGA等硬件加速。通過(guò)分析硬件加速器的性能參數(shù),可以估算模型在硬件加速下的計(jì)算量。 四、實(shí)驗(yàn)與分析 為了驗(yàn)證上述估計(jì)方法的有效性,我們選取了幾個(gè)具有代表性的深度
    發(fā)表于 07-03 19:43

    粒子加速器?——?科技前沿的核心裝置

    粒子加速器全稱(chēng)“荷電粒子加速器”,是一種利用電磁場(chǎng)在高真空環(huán)境中對(duì)帶電粒子(如電子、質(zhì)子、離子)進(jìn)行加速和控制,使其獲得高能量的特種裝置。粒子加速器技術(shù)現(xiàn)已發(fā)展成為集高能物理、核物理、
    的頭像 發(fā)表于 06-19 12:05 ?3650次閱讀
    粒子<b class='flag-5'>加速器</b>?——?科技前沿的核心裝置

    TPU處理的特性和工作原理

    張量處理單元(TPU,Tensor Processing Unit)是一種專(zhuān)門(mén)為深度學(xué)習(xí)應(yīng)用設(shè)計(jì)的硬件加速器。它的開(kāi)發(fā)源于對(duì)人工智能(AI)和機(jī)器學(xué)習(xí)應(yīng)用的需求,尤其是
    的頭像 發(fā)表于 04-22 09:41 ?4415次閱讀
    TPU處理<b class='flag-5'>器</b>的特性和工作原理

    小型加速器中子源監(jiān)測(cè)系統(tǒng)解決方案

    小型加速器中子源是一種基于先進(jìn)加速器技術(shù)的中子產(chǎn)生裝置,憑借體積小、成本低、安全性高的優(yōu)勢(shì),在醫(yī)學(xué)、工業(yè)、科研、安全、能源等多個(gè)領(lǐng)域展現(xiàn)出巨大的應(yīng)用潛力和價(jià)值。無(wú)論是用于醫(yī)學(xué)領(lǐng)域的精準(zhǔn)放療,還是工業(yè)
    的頭像 發(fā)表于 03-13 11:19 ?1417次閱讀
    小型<b class='flag-5'>加速器</b>中子源監(jiān)測(cè)系統(tǒng)解決方案