91欧美超碰AV自拍|国产成年人性爱视频免费看|亚洲 日韩 欧美一厂二区入|人人看人人爽人人操aV|丝袜美腿视频一区二区在线看|人人操人人爽人人爱|婷婷五月天超碰|97色色欧美亚州A√|另类A√无码精品一级av|欧美特级日韩特级

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫(xiě)文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

如何在資源受限型應(yīng)用中使用 FPGA

海闊天空的專欄 ? 來(lái)源:Kenton Williston ? 作者:Kenton Williston ? 2025-10-03 17:31 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

作者:Kenton Williston

投稿人:DigiKey 北美編輯

資源受限的嵌入式系統(tǒng)對(duì)可配置邏輯的需求與日俱增。邊緣 AI機(jī)器視覺(jué)工業(yè)自動(dòng)化等應(yīng)用需要靈活的應(yīng)用特定邏輯,以滿足不斷變化的性能需求,同時(shí)在嚴(yán)格的功耗、尺寸和成本限制內(nèi)運(yùn)行?,F(xiàn)代現(xiàn)場(chǎng)可編程門(mén)陣列 (FPGA) 可以滿足這些相互競(jìng)爭(zhēng)的需求。

本文回顧了為資源受限型應(yīng)用選擇 FPGA 時(shí)需要考慮的關(guān)鍵設(shè)計(jì)標(biāo)準(zhǔn)。然后,以 [Altera] 經(jīng)過(guò)[功率和成本優(yōu)化的 FPGA] 產(chǎn)品組合為例,說(shuō)明不同產(chǎn)品線如何與應(yīng)用特定場(chǎng)景相匹配。最后重點(diǎn)介紹了可用于設(shè)計(jì)概念原型開(kāi)發(fā)和驗(yàn)證的開(kāi)發(fā)套件和評(píng)估板。

選擇 FPGA 時(shí)應(yīng)注意的事項(xiàng)

為資源受限型系統(tǒng)選擇 FPGA 需要考慮多種設(shè)計(jì)要求,并按照這些要求匹配正確的解決方案。有多個(gè)關(guān)鍵的 FPGA 特性需要考慮:

邏輯元件 (LE) 容量 :作為 FPGA 的基本構(gòu)件,邏輯元件的數(shù)量決定了可以實(shí)現(xiàn)多少定制邏輯。數(shù)量越高設(shè)計(jì)就越復(fù)雜:折衷的辦法是增加功率、成本和封裝尺寸。

I/O 和存儲(chǔ)器 :FPGA 通常用于連接系統(tǒng)中的不同組件,因此 I/O 引腳的數(shù)量是一個(gè)重要的考慮因素。為了提高 I/O 性能,許多 FPGA 為 PCI Express (PCIe)、高速存儲(chǔ)器和千兆位收發(fā)器接口集成了強(qiáng)化的固定邏輯塊。

此外,一些 FPGA 還集成了模數(shù)轉(zhuǎn)換器 (ADC) 和閃存等元件。這些增強(qiáng)元件可減少對(duì)配套芯片的需要,從而節(jié)省了電路板空間并提高了能效。

處理器集成: 可以在 FPGA 內(nèi)實(shí)現(xiàn)“軟”微處理器單元 (MPU),而不是使用外部處理器。這種方法可以減少系統(tǒng)的尺寸,但最適合對(duì) MPU 工作負(fù)載要求不高的應(yīng)用。

對(duì)于需要 MPU 具有更快速度、更高效率的應(yīng)用,設(shè)計(jì)人員可以考慮使用帶有硬核處理器系統(tǒng) (HPS) 的 FPGA,將 MPU 作為 FPGA 中的固定邏輯塊來(lái)實(shí)現(xiàn)。

硬件加速器: FPGA 通常包含專用數(shù)字信號(hào)處理 (DSP) 塊,可有效處理像運(yùn)動(dòng)控制這樣的計(jì)算密集型任務(wù)。高端設(shè)備可能會(huì)配備專門(mén)用于 AI 工作負(fù)載的張量塊。這些加速器塊的功能在不同的 FPGA 系列中差別很大,會(huì)極大地影響系統(tǒng)的整體性能。

封裝和功率優(yōu)化 :有些 FPGA 專門(mén)設(shè)計(jì)用于最大限度地減少物理和電氣占用空間。例如,它們可以提供低功耗睡眠模式。

工具 :創(chuàng)建自定義邏輯是一項(xiàng)艱巨的挑戰(zhàn),尤其是對(duì)于新手設(shè)計(jì)人員而言。Altera 的 [Quartus Prime] 設(shè)計(jì)軟件等工具的出現(xiàn)簡(jiǎn)化了這一過(guò)程。

Quartus Prime 提供了對(duì)開(kāi)發(fā)人員友好的體驗(yàn)、廣泛的預(yù)建邏輯塊目錄以及自動(dòng)將這些邏輯塊互連的能力,從而使 FPGA 設(shè)計(jì)更加易于實(shí)現(xiàn)。該工具集成了常用的 AI 和機(jī)器學(xué)習(xí) (ML) 工作流,能夠讓使開(kāi)發(fā)人員在 FPGA 上部署 Linux 和 Zephyr 等流行的操作系統(tǒng) (OS)。

上述功能可大大加快 FPGA 的設(shè)計(jì)速度,因此在選擇器件時(shí),工具功能也是一個(gè)重要的考慮因素。

面向高級(jí)嵌入式工作負(fù)載的高性能計(jì)算

為了說(shuō)明設(shè)計(jì)要求如何影響 FPGA 的選擇,不妨從需要超高計(jì)算密度、帶寬和集成度的高端應(yīng)用入手。下面我們以高級(jí)邊緣 AI 應(yīng)用和高性能工業(yè)網(wǎng)關(guān)為例作詳細(xì)分析。

[Agilex 3] FPGA(圖 1)專為滿足這些應(yīng)用需求而設(shè)計(jì),可提供最高 135K LE。這些芯片有純 FPGA 和片上系統(tǒng) (SoC) 兩種類型。SoC 器件集成了雙核 800 兆赫 (MHz) [Arm?] Cortex?-A55,能夠讓 FPGA 處理復(fù)雜的軟件堆棧,如人機(jī)界面 (HMI) 或網(wǎng)絡(luò)堆棧。

這種可編程結(jié)構(gòu)具有 AI 張量塊,能夠提供高達(dá)每秒 2.8 萬(wàn)億次 INT8 運(yùn)算 (TOPS)。這些張量塊支持各種計(jì)算格式,包括 FP16、FP19、FP32 和 BFLOAT16,并進(jìn)行了優(yōu)化,實(shí)現(xiàn)了對(duì) AI 工作負(fù)載的高效執(zhí)行。此外,還包括可變精度 DSP 塊,為通用信號(hào)處理提供高達(dá)每秒 180 千兆次浮點(diǎn)運(yùn)算 (GFLOPS) 的性能。

Altera Agilex 3 以其高性能 DSP 和 AI 張量模塊而著稱圖片圖 1:Agilex 3 以其高性能 DSP 和 AI 張量模塊而著稱。(圖片來(lái)源:Altera)

高速連接是 Agilex 3 架構(gòu)的另一個(gè)優(yōu)勢(shì)。收發(fā)器支持高達(dá)每秒 12.5 千兆比特 (Gb/s) 的數(shù)據(jù)傳輸速率,并提供用于 PCIe 3.0、萬(wàn)兆位以太網(wǎng) (GbE) 和 LPDDR4 存儲(chǔ)器接口的強(qiáng)化 I/O 塊。對(duì) IEEE 1588 精確時(shí)間同步的支持進(jìn)一步增強(qiáng)了其對(duì)實(shí)時(shí)工業(yè)網(wǎng)絡(luò)的適用性。

[A3CZ135BB18AE7S] 器件展示了該系列的功能。它包括 135K LE、184 個(gè) DSP 塊,并提供 2.54 TOPS。

復(fù)雜系統(tǒng)的高級(jí)集成

對(duì)于工業(yè)自動(dòng)化和中程視覺(jué)系統(tǒng)等應(yīng)用而言,原始計(jì)算能力的重要性可能不如對(duì)帶有大量定制邏輯和 I/O 的復(fù)雜配置的支持能力。[Cyclone V] FPGA 非常適合這些應(yīng)用場(chǎng)景,提供最高 300K LE 和廣泛的高速接口。與 Agilex 3 一樣,這些芯片也有純 FPGA 和 SoC 兩種變型。其中 SoC 器件集成了雙核 Arm Cortex-A9。

這些芯片中的可編程結(jié)構(gòu)包括可變精度 DSP 塊,支持三重 9 × 9 和雙重 18 × 18 定點(diǎn)乘法,以及 27 × 27 定點(diǎn)或浮點(diǎn)乘法。這些塊可用于高級(jí)信號(hào)處理和 AI。

廣泛的 I/O 組合支持多種電壓等級(jí)和接口類型。強(qiáng)化邏輯塊可實(shí)現(xiàn)先進(jìn)的高速連接,包括 PCIe 2.0、DDR3 控制器和收發(fā)器,運(yùn)行速度高達(dá) 6.144 Gb/s。

開(kāi)發(fā)人員可以使用 [DK-DEV-5CSXC6N-B 開(kāi)發(fā)套件] 評(píng)估 Cyclone V SoC 系列(圖 2)。該套件專為快速開(kāi)發(fā)復(fù)雜的高吞吐量系統(tǒng)原型而設(shè)計(jì)。

Altera DK-DEV-5CSXC6N-B Cyclone V 開(kāi)發(fā)套件圖片圖 2:DK-DEV-5CSXC6N-B Cyclone V 開(kāi)發(fā)套件支持高性能原型開(kāi)發(fā)。(圖片來(lái)源:Altera)

該套件有幾個(gè)顯著特性:

  • 雙以太網(wǎng)端口、PCIe x4 連接器和高速夾層卡 (HSMC),每個(gè)方向有 16 個(gè) LVDS 通道
  • USB 2.0 OTG、CANUART 和雙行文本 LCD 接口
  • FPGA 側(cè)和 HPS 側(cè)各 1 千兆字節(jié) (Gb) DDR3 SDRAM、128 兆字節(jié) (Mb) 四通道 SPI 閃存和 4 Gb microSD 卡

該電路板采用 [5CSXFC5D6F31C8N] 器件,包括一個(gè)運(yùn)行頻率為 600 MHz 的雙核 Arm Cortex-A9 處理器、85K LE、87 個(gè) DSP 塊和 288 個(gè) I/O 引腳,封裝為 31 mm × 31 mm 的 896-FBGA。

采用緊湊型封裝的高能效可配置邏輯器件

許多應(yīng)用都受到空間和功耗的嚴(yán)格限制。例如傳感器接口、電源定序和外設(shè)控制。[MAX 10] 系列等 FPGA 為這些情況提供了有效的解決方案。MAX 10 器件的配置從 2K LE 到 50K LE 不等,封裝尺寸小至 3 mm × 3 mm。

主要功能包括多達(dá)兩個(gè)集成式 12 位 ADC、一個(gè) DDR3 存儲(chǔ)器接口以及支持 18 × 18 和雙重 9 × 9 定點(diǎn)模式的乘法器模塊。支持雙圖像存儲(chǔ)的片上閃存允許 FPGA 在沒(méi)有外部存儲(chǔ)設(shè)備的情況下進(jìn)行自我配置。

省電功能是 MAX 10 系列最顯著的屬性之一。內(nèi)置睡眠模式可將動(dòng)態(tài)功耗降低 95% 。借助片上閃存,器件還可在 10 毫秒 (ms) 內(nèi)完全斷電并恢復(fù)運(yùn)行。

單電源選項(xiàng)進(jìn)一步簡(jiǎn)化了供電。這使得 MAX 10 器件特別適合用于功率域可能需要先于系統(tǒng)其他部分聯(lián)機(jī)的監(jiān)控場(chǎng)合。

對(duì) MAX 10 感興趣的開(kāi)發(fā)人員可以使用 [EK-10M08E144] MAX 10 FPGA 評(píng)估板(圖 3)對(duì)該系列進(jìn)行評(píng)估。該電路板可通過(guò) [Arduino] UNO R3 連接器和測(cè)試點(diǎn)訪問(wèn)外部信號(hào),其布局設(shè)計(jì)可支持對(duì) ADC 性能和整體電源行為的測(cè)量。

Altera EK-10M08E144 MAX 10 FPGA 評(píng)估板圖片圖 3:EK-10M08E144 MAX 10 FPGA 評(píng)估板可輕松訪問(wèn)關(guān)鍵 I/O。(圖片來(lái)源:Altera)

電路板采用 [10M08SAE144C8G] 器件,包括 8K LE 和一個(gè) ADC,封裝為 144 引腳 LQFP。除內(nèi)置硬件資源外,該 FPGA 還支持基于 RISC-V 的 Nios V 軟處理器,無(wú)需外部微控制器單元 (MCU),設(shè)計(jì)人員即可實(shí)現(xiàn)輕量級(jí)控制功能。

適合中程應(yīng)用的均衡性能

有些應(yīng)用需要更大的邏輯和 I/O 容量,而入門(mén)級(jí) FPGA 無(wú)法提供。例如傳感器融合、運(yùn)動(dòng)控制和芯片到芯片橋接。[Cyclone 10 LP] FPGA 為滿足這些要求,在器件中提供了多達(dá) 120K 的 LE 和 525 個(gè) I/O 引腳,并針對(duì)成本敏感型應(yīng)用中的功率和帶寬平衡進(jìn)行了優(yōu)化。

與 MAX 10 一樣,該系列包括適用于濾波、控制回路和基本 AI 推斷等工作負(fù)載的 DSP 塊。與 MAX 10 不同,Cyclone 10 LP 器件集成了真正的 LVDS 收發(fā)器和片上終端 (OCT),以支持高速數(shù)字接口。

對(duì) Cyclone 10 LP 感興趣的開(kāi)發(fā)人員可以使用 [EK-10CL025U256] Cyclone 10 評(píng)估套件(圖 4)對(duì)該系列進(jìn)行評(píng)估。該電路板提供 Arduino UNO R3 和 [Digilent] Pmod 連接器,擴(kuò)展方便簡(jiǎn)單。其他特性包括 GbE、USB 2.0、128 Mb SDRAM 和 64 Mb 閃存。

Altera EK-10CL025U256 Cyclone 10 評(píng)估套件示意圖(點(diǎn)擊放大)圖 4:EK-10CL025U256 Cyclone 10 評(píng)估套件支持輕松外設(shè)擴(kuò)展。(圖片來(lái)源:Altera)

該電路板采用 [10CL025YU256C8G] 器件,包括 25K LE、66 個(gè) DSP 塊和 150 個(gè) I/O 引腳,封裝尺寸為 14 mm × 14 mm。與 MAX 10 一樣,Cyclone 10 LP 系列也支持 Nios V 軟處理器。

結(jié)語(yǔ)

現(xiàn)在,設(shè)計(jì)人員在嵌入式系統(tǒng)中實(shí)現(xiàn)定制邏輯時(shí)要比以往任何時(shí)候都更加靈活。高性能應(yīng)用可從集成了 AI 加速器的 FPGA 中獲益。低功耗設(shè)計(jì)可以利用具有睡眠模式的器件。I/O 密集型系統(tǒng)可以利用具有大量引腳數(shù)和高速接口的芯片。重要的是,所有這些功能都可以通過(guò)易于使用的工具包,在資源受限型嵌入式系統(tǒng)的嚴(yán)格限制下實(shí)現(xiàn)。

聲明:本文內(nèi)容及配圖由入駐作者撰寫(xiě)或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問(wèn)題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • FPGA
    +關(guān)注

    關(guān)注

    1660

    文章

    22412

    瀏覽量

    636414
  • 嵌入式系統(tǒng)
    +關(guān)注

    關(guān)注

    41

    文章

    3747

    瀏覽量

    133644
收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評(píng)論

    相關(guān)推薦
    熱點(diǎn)推薦

    為什么在FPGA設(shè)計(jì)中使用MicroBlaze V處理器

    在各類行業(yè)與應(yīng)用中,經(jīng)常能看到許多 FPGA 設(shè)計(jì)。一個(gè)非常常見(jiàn)的現(xiàn)象是:設(shè)計(jì)者常常用復(fù)雜的有限狀態(tài)機(jī)(FSM)來(lái)實(shí)現(xiàn) I2C、SPI、GPIO 時(shí)序控制等功能。
    的頭像 發(fā)表于 12-19 15:29 ?8333次閱讀
    為什么在<b class='flag-5'>FPGA</b>設(shè)計(jì)<b class='flag-5'>中使</b>用MicroBlaze V處理器

    何在AMD Vitis Unified IDE中使用系統(tǒng)設(shè)備樹(shù)

    您將在這篇博客中了解系統(tǒng)設(shè)備樹(shù) (SDT) 以及如何在 AMD Vitis Unified IDE 中使用 SDT 維護(hù)來(lái)自 XSA 的硬件元數(shù)據(jù)。本文還講述了如何對(duì) SDT 進(jìn)行操作,以便在 Vitis Unified IDE 中實(shí)現(xiàn)更靈活的使用場(chǎng)景。
    的頭像 發(fā)表于 11-18 11:13 ?3123次閱讀
    如<b class='flag-5'>何在</b>AMD Vitis Unified IDE<b class='flag-5'>中使</b>用系統(tǒng)設(shè)備樹(shù)

    使用Xilinx 7系列FPGA的四位乘法器設(shè)計(jì)

    隨著 IoT、邊緣計(jì)算等應(yīng)用對(duì)低位寬、高并行、高效率算術(shù)運(yùn)算的需求攀升,基礎(chǔ)算術(shù)電路,如 4 位乘法,如何在 FPGA 上做到“資源最小化+速度極致”便成為一道新的挑戰(zhàn)。來(lái)自日本信州大學(xué)
    的頭像 發(fā)表于 11-17 09:49 ?3475次閱讀
    使用Xilinx 7系列<b class='flag-5'>FPGA</b>的四位乘法器設(shè)計(jì)

    Altera全新推出MAX 10 FPGA封裝新選擇

    Altera 全新推出 MAX 10 FPGA 封裝新選擇,采用可變間距球柵陣列 (VPBGA) 技術(shù)并已開(kāi)始批量出貨,可為空間受限及 I/O 密集應(yīng)用的設(shè)計(jì)人員帶來(lái)關(guān)鍵技術(shù)優(yōu)勢(shì)。
    的頭像 發(fā)表于 11-10 16:38 ?1852次閱讀
    Altera全新推出MAX 10 <b class='flag-5'>FPGA</b>封裝新選擇

    何在VS code中配置Zephyr集成開(kāi)發(fā)環(huán)境

    上一篇文章介紹了如何在VS code中使用瑞薩官方插件為RA芯片創(chuàng)建項(xiàng)目與項(xiàng)目調(diào)試,相信大家對(duì)RA在VS code中的開(kāi)發(fā)有了基礎(chǔ)的了解。
    的頭像 發(fā)表于 11-05 14:46 ?1516次閱讀
    如<b class='flag-5'>何在</b>VS code中配置Zephyr集成開(kāi)發(fā)環(huán)境

    如何調(diào)用FPGA板上的按鍵資源

    今天主要介紹一下我們團(tuán)隊(duì)是如何調(diào)用FPGA板上的按鍵資源的。 首先,初始化按鍵模塊: 具體初始化函數(shù)調(diào)用如下: 其次,定義按鍵掃描函數(shù): u8 KEY_Scan(u8 mode
    發(fā)表于 10-30 08:05

    何在vivadoHLS中使用.TLite模型

    本帖欲分享如何在vivadoHLS中使用.TLite模型。在Vivado HLS中導(dǎo)入模型后,需要設(shè)置其輸入和輸出接口以與您的設(shè)計(jì)進(jìn)行適配。 1. 在Vivado HLS項(xiàng)目中導(dǎo)入模型文件 可以
    發(fā)表于 10-22 06:29

    RTThread線程退出后rt_malloc動(dòng)態(tài)創(chuàng)建的資源沒(méi)有釋放怎么解決?

    。如何在線程被退出前釋放線程申請(qǐng)的資源?能否通過(guò)memtrace中的信息在線程退出前將線程申請(qǐng)的資源釋放掉?
    發(fā)表于 10-13 07:06

    何在FPGA部署AI模型

    如果你已經(jīng)在用 MATLAB 做深度學(xué)習(xí),那一定知道它的訓(xùn)練和仿真體驗(yàn)非常絲滑。但當(dāng)模型要真正落地到 FPGA 上時(shí),往往就會(huì)卡?。涸趺窗丫W(wǎng)絡(luò)結(jié)構(gòu)和權(quán)重優(yōu)雅地搬到硬件里?
    的頭像 發(fā)表于 09-24 10:00 ?4432次閱讀
    如<b class='flag-5'>何在</b><b class='flag-5'>FPGA</b>部署AI模型

    何在智多晶FPGA上使用MIPI接口

    大家好呀!今天我們來(lái)聊聊一個(gè)非常實(shí)用的話題——如何在智多晶FPGA上使用MIPI接口。不管是做攝像頭圖像采集還是屏幕顯示控制,MIPI都是非常常見(jiàn)的接口標(biāo)準(zhǔn)。掌握了它,你的視頻項(xiàng)目開(kāi)發(fā)效率將大大提升!
    的頭像 發(fā)表于 09-11 09:37 ?1186次閱讀

    聊聊FPGA中的TDC原理

    今天我們不談高大上的物理學(xué),只聊聊如何在 FPGA 中,用一串加法器和 D 觸發(fā)器,“數(shù)清楚時(shí)間”——這就是時(shí)間數(shù)字轉(zhuǎn)換器(TDC)的魅力。
    的頭像 發(fā)表于 09-02 15:15 ?2133次閱讀
    聊聊<b class='flag-5'>FPGA</b>中的TDC原理

    請(qǐng)問(wèn)如何在 Keil μVision 或 IAR EWARM 中使用觀察點(diǎn)進(jìn)行調(diào)試?

    何在 Keil μVision 或 IAR EWARM 中使用觀察點(diǎn)進(jìn)行調(diào)試?
    發(fā)表于 08-20 06:29

    基于FPGA的壓縮算法加速實(shí)現(xiàn)

    本設(shè)計(jì)中,計(jì)劃實(shí)現(xiàn)對(duì)文件的壓縮及解壓,同時(shí)優(yōu)化壓縮中所涉及的信號(hào)處理和計(jì)算密集功能,實(shí)現(xiàn)對(duì)其的加速處理。本設(shè)計(jì)的最終目標(biāo)是證明在充分并行化的硬件體系結(jié)構(gòu) FPGA 上實(shí)現(xiàn)該算法時(shí),可以大大提高該算
    的頭像 發(fā)表于 07-10 11:09 ?2398次閱讀
    基于<b class='flag-5'>FPGA</b>的壓縮算法加速實(shí)現(xiàn)

    請(qǐng)問(wèn)如何在C++中使用NPU上的模型緩存?

    無(wú)法確定如何在 C++ 中的 NPU 上使用模型緩存
    發(fā)表于 06-24 07:25

    Xilinx Ultrascale系列FPGA的時(shí)鐘資源與架構(gòu)解析

    Ultrascale是賽靈思開(kāi)發(fā)的支持包含步進(jìn)功能的增強(qiáng)FPGA架構(gòu),相比7系列的28nm工藝,Ultrascale采用20nm的工藝,主要有2個(gè)系列:Kintex和Virtex
    的頭像 發(fā)表于 04-24 11:29 ?2624次閱讀
    Xilinx Ultrascale系列<b class='flag-5'>FPGA</b>的時(shí)鐘<b class='flag-5'>資源</b>與架構(gòu)解析