91欧美超碰AV自拍|国产成年人性爱视频免费看|亚洲 日韩 欧美一厂二区入|人人看人人爽人人操aV|丝袜美腿视频一区二区在线看|人人操人人爽人人爱|婷婷五月天超碰|97色色欧美亚州A√|另类A√无码精品一级av|欧美特级日韩特级

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

當 DSP 擊敗硬件加速器時

Petc ? 來源:rockenergy ? 作者:rockenergy ? 2022-07-21 10:25 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

嵌入式 CPU 幾乎無處不在,因為它們提供了靈活性以及相當好的性能和低功耗,而且通常成本更低。與需要將單獨的微處理器微控制器耦合到您的定制硬件的解決方案相比,切換到基于嵌入式 CPU 的設(shè)計是輕而易舉的事。但是任何類型的 CPU 都有限制。即使我們可以將我們的算法轉(zhuǎn)移到軟件中,算法的潛在復(fù)雜性是無限的。我們可以編寫程序并且它們會運行,但不一定在可接受的時間或合理的功率預(yù)算內(nèi)。

這就是為什么微處理器制造商很快提出了硬件加速器的概念——硬件功能可以執(zhí)行通常需要的任務(wù),例如浮點運算,比在 CPU 上運行的軟件要快得多。這個想法很快就流行起來,其他加速器開始出現(xiàn),對于密碼學、正則表達式處理和圖形功能只是幾個例子。

所有這些都非常有效,但犧牲了基于軟件的解決方案的一個重要優(yōu)勢:因為實現(xiàn)大多是硬編碼的,所以很難修改。加速器可能允許通過寄存器控制進行一些有限級別的調(diào)整,但是如果您需要修復(fù)錯誤或更改算法,則必須重新設(shè)計硬件。響應(yīng)現(xiàn)場故障和不斷變化的市場需求變得更加昂貴。

您真正想要的是兩全其美——一種在加速算法的同時仍然能夠在軟件中定義這些算法的方法。當然,所有可能算法的范圍是無限的,因此不可能對所有情況都有一個解決方案。但是對于大量非常常用的功能,DSP 正好可以提供這種解決方案。

考慮幾乎所有必須處理流數(shù)據(jù)的操作。在音頻處理中可以找到明顯的例子,從濾波到 PDM-PCM 轉(zhuǎn)換再到聲學回聲消除。或者考慮基于流的密碼,例如 SNOW 和 ZUC(用于 LTE)。在信號處理環(huán)境中,考慮基站和手機之間的信道估計。這旨在優(yōu)化當前條件下的傳輸以獲得最大的可靠性,并且需要對接收到的信號進行復(fù)雜的矩陣計算。更一般地說,考慮任何可以從非常廣泛的并行性中受益的應(yīng)用程序,例如 AES 加密。

流計算、復(fù)雜數(shù)學(矩陣、浮點)和/或高級并行性都是 DSP 大放異彩的領(lǐng)域,應(yīng)該認真考慮作為硬件加速器的替代品。在許多情況下,實現(xiàn)也將小于硬編碼加速器,從而降低產(chǎn)品的單位成本。至于功耗,也許加速器會比 DSP 實現(xiàn)略低,但 DSP 功耗仍將遠低于基于 CPU 的同等產(chǎn)品。更好的是,如果這些加速不需要同時運行,您可以將多個加速功能整合到一個 DSP 上,從而消除對多個加速器的需求。為了獲得更大的處理能力,您可以使用多核 DSP,就像您可以使用多核 CPU 一樣。

最重要的是,DSP 實現(xiàn)是可編程的,用 C 語言編寫,就像您的 CPU 內(nèi)核一樣。您需要做一些稍微不同的事情——例如優(yōu)化并行性——但是一個好的 DSP 編譯器和建模模擬器應(yīng)該會讓這相對容易。因此,您無需更改底層硬件即可獲得錯誤修復(fù)和產(chǎn)品升級的所有優(yōu)勢。提高客戶滿意度并改善收入來源。不錯。

還有另一個優(yōu)勢:作為處理器,它可以支持多種功能??紤]一下全球定位標準 GNSS,以及從基于 DSP 的計算中顯著受益的功能。這當然是移動設(shè)備中的一個很好的功能,但現(xiàn)在固定設(shè)備的 GNSS 也出現(xiàn)了繁榮,以簡化配置、更新和維護。如果您的設(shè)備已經(jīng)啟用了 DSP,則 GNSS 可能是某些供應(yīng)商的軟件插件,并且可以在其他功能處于休眠狀態(tài)時在安靜時期運行。如果您已經(jīng)擁有基于硬件的 GNSS 或計劃添加一個,您可以節(jié)省空間和電力。

我并不是說 DSP 實現(xiàn)一定可以取代你所有的硬件加速器。某些加速器功能可能不適合 DSP 的優(yōu)勢。有些可能適合某個范圍,但不能超出該范圍;例如,對于非常大的過濾器,您唯一的選擇可能仍然是硬連線實現(xiàn)。但這留下了許多功能,其中 DSP 在性能和功率上接近等效的硬件加速器,實際上可能在成本上更好,并且比硬件版本具有無限更多的靈活性。值得考慮。

本博客是系列文章中的第二篇,該系列以“為什么 DSP 突然無處不在”開始,并以第三篇博客結(jié)尾:“決策,決策:硬件加速器還是 DSP?”。

審核編輯 黃昊宇

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學習之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • dsp
    dsp
    +關(guān)注

    關(guān)注

    561

    文章

    8250

    瀏覽量

    367039
  • 硬件加速器
    +關(guān)注

    關(guān)注

    0

    文章

    43

    瀏覽量

    13501
收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關(guān)推薦
    熱點推薦

    FPGA硬件加速卡設(shè)計原理圖:1-基于Xilinx XCKU115的半高PCIe x8 硬件加速卡 PCIe半高 XCKU115-3-FLVF1924-E芯片

    FPGA硬件加速, PCIe半高卡, XCKU115, 光纖采集卡, 信號計算板, 硬件加速
    的頭像 發(fā)表于 02-12 09:52 ?417次閱讀
    FPGA<b class='flag-5'>硬件加速</b>卡設(shè)計原理圖:1-基于Xilinx XCKU115的半高PCIe x8 <b class='flag-5'>硬件加速</b>卡 PCIe半高 XCKU115-3-FLVF1924-E芯片

    工業(yè)級-專業(yè)液晶圖形顯示加速器RA8889ML3N簡介+顯示方案選型參考表

    本帖最后由 MTCN2013 于 2025-11-17 15:23 編輯 專業(yè)液晶圖形顯示加速器能夠有效減少對MCU運算資源的占用,對于只需普通單片機運算資源的儀器儀表來說,專業(yè)圖形顯示加速器
    發(fā)表于 11-14 16:03

    邊緣計算中的AI加速器類型與應(yīng)用

    人工智能正在推動對更快速、更智能、更高效計算的需求。然而,隨著每秒產(chǎn)生海量數(shù)據(jù),將所有數(shù)據(jù)發(fā)送至云端處理已變得不切實際。這正是邊緣計算中AI加速器變得不可或缺的原因。這種專用硬件能夠直接在邊緣設(shè)備上
    的頭像 發(fā)表于 11-06 13:42 ?847次閱讀
    邊緣計算中的AI<b class='flag-5'>加速器</b>類型與應(yīng)用

    STEVAL-DPSG474數(shù)字電源控制套件深度解析與技術(shù)實踐

    編程的適配器板。STM32G4混合信號微控制 (MCU) 結(jié)合了運行頻率為170MHz的32位Arm? Cortex?-M4內(nèi)核(帶FPU和DSP指令)。這些特性還結(jié)合了三種不同的硬件加速器:ART Accelerator?、
    的頭像 發(fā)表于 10-30 10:56 ?765次閱讀
    STEVAL-DPSG474數(shù)字電源控制套件深度解析與技術(shù)實踐

    常用硬件加速的方法

    之前總結(jié)了一些常用硬件加速方法 1)面積換速度:也就是串轉(zhuǎn)并運算,可以多個模塊同時計算; 2)時間換空間:時序收斂下通過頻率提高性能,雖然面積可能稍微加大點; 3)流水線操作:流水線以面積換性能,以
    發(fā)表于 10-29 06:20

    硬件協(xié)同技術(shù)分享 - 任務(wù)劃分 + 自定義指令集

    開發(fā)技術(shù)。分文將分享介紹硬件加速器與軟件結(jié)合的協(xié)同開發(fā)方式 軟硬件任務(wù)劃分 我們的硬件設(shè)計涉及到MFCC模塊。直接交由CPU的一次指令的五級流水線處理在麥克風數(shù)據(jù)取入上的資源耗費可以說是
    發(fā)表于 10-28 08:03

    硬件加速模塊的時鐘設(shè)計

    硬件加速模塊需要四個時鐘,分別為clk_l , clk_r , clk_c , clk_n 。 clk_l : 整個硬件加速模塊為了最大化的節(jié)約時間成本而采用了類似處理的流水線設(shè)計,具體上將每一層
    發(fā)表于 10-23 07:28

    HXS320F28035數(shù)字信號控制

    RISC-V架構(gòu),提供高效指令執(zhí)行能力,同時3.3V供電降低功耗。專用硬件加速器:CLA(控制律加速器)支持浮點運算,可獨立處理復(fù)雜控制算法(如FOC電機控制),釋放主核資源。豐富的工業(yè)接口:多路PWM
    發(fā)表于 10-22 09:05

    航裕電源以大電流技術(shù)為國內(nèi)外超導(dǎo)加速器項目提供優(yōu)質(zhì)方案

    航裕電源:以大電流技術(shù),護航尖端科技 大科學裝置建設(shè)熱潮中,超導(dǎo)加速器作為探索微觀世界、推動前沿科研的 “國之重”,對供電系統(tǒng)的穩(wěn)定性、精度及功率提出極致要求。航裕電源以31.5kA、80kA萬安
    的頭像 發(fā)表于 10-12 15:02 ?1591次閱讀

    如何驗證硬件加速是否真正提升了通信協(xié)議的安全性?

    驗證硬件加速是否真正提升通信協(xié)議的安全性,需從 安全功能正確性、抗攻擊能力增強、安全性能適配、合規(guī)一致性 等核心維度展開,結(jié)合實驗室測試與真實場景驗證,避免 “硬件參與即安全提升” 的表面判斷。以下
    的頭像 發(fā)表于 08-27 10:16 ?1193次閱讀
    如何驗證<b class='flag-5'>硬件加速</b>是否真正提升了通信協(xié)議的安全性?

    有哪些方法可以確保硬件加速與通信協(xié)議的兼容性?

    ? 確保硬件加速與通信協(xié)議的兼容性,核心是從 硬件選型、協(xié)議標準匹配、軟硬件接口適配、全場景測試驗證 四個維度建立閉環(huán),避免因硬件功能缺失、接口不兼容或協(xié)議特性支持不全導(dǎo)致的性能損耗、
    的頭像 發(fā)表于 08-27 10:07 ?1138次閱讀

    如何利用硬件加速提升通信協(xié)議的安全性?

    產(chǎn)品實拍圖 利用硬件加速提升通信協(xié)議安全性,核心是通過 專用硬件模塊或可編程硬件 ,承接軟件層面難以高效處理的安全關(guān)鍵操作(如加密解密、認證、密鑰管理等),在提升性能的同時,通過硬件
    的頭像 發(fā)表于 08-27 09:59 ?1031次閱讀
    如何利用<b class='flag-5'>硬件加速</b>提升通信協(xié)議的安全性?

    創(chuàng)客總部加入MathWorks加速器計劃

    全球領(lǐng)先的數(shù)學計算軟件開發(fā)商 MathWorks 日前宣布,創(chuàng)客總部已加入 MathWorks 加速器計劃。作為中關(guān)村科創(chuàng)孵化,創(chuàng)客總部致力于為人工智能創(chuàng)業(yè)企業(yè)、高校院所技術(shù)精英搭建推動與實體經(jīng)濟
    的頭像 發(fā)表于 08-22 10:00 ?1185次閱讀

    粒子加速器?——?科技前沿的核心裝置

    粒子加速器全稱“荷電粒子加速器”,是一種利用電磁場在高真空環(huán)境中對帶電粒子(如電子、質(zhì)子、離子)進行加速和控制,使其獲得高能量的特種裝置。粒子加速器技術(shù)現(xiàn)已發(fā)展成為集高能物理、核物理、
    的頭像 發(fā)表于 06-19 12:05 ?3707次閱讀
    粒子<b class='flag-5'>加速器</b>?——?科技前沿的核心裝置

    TPU處理的特性和工作原理

    張量處理單元(TPU,Tensor Processing Unit)是一種專門為深度學習應(yīng)用設(shè)計的硬件加速器。它的開發(fā)源于對人工智能(AI)和機器學習應(yīng)用的需求,尤其是深度學習中的神經(jīng)網(wǎng)絡(luò)計算。
    的頭像 發(fā)表于 04-22 09:41 ?4480次閱讀
    TPU處理<b class='flag-5'>器</b>的特性和工作原理