91欧美超碰AV自拍|国产成年人性爱视频免费看|亚洲 日韩 欧美一厂二区入|人人看人人爽人人操aV|丝袜美腿视频一区二区在线看|人人操人人爽人人爱|婷婷五月天超碰|97色色欧美亚州A√|另类A√无码精品一级av|欧美特级日韩特级

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

使用粗粒度可重構(gòu)陣列加速處理

星星科技指導(dǎo)員 ? 來源:嵌入式計(jì)算設(shè)計(jì) ? 作者:Monique DeVoe ? 2022-06-14 10:05 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

隨著性能需求的增加和對低功耗設(shè)計(jì)的推動,需要更有效的方法來執(zhí)行處理任務(wù),因?yàn)橛捎诠β氏拗?,將更?a target="_blank">處理器投入性能問題不再可行。加速器旨在以更快的速度和更低的功耗進(jìn)行計(jì)算,但今天的加速器在功耗和性能方面存在缺陷。

加速器陣容

亞利桑那州立大學(xué)計(jì)算、信息學(xué)和決策系統(tǒng)工程學(xué)院副教授 Aviral Shrivastava 正在對可編程加速器進(jìn)行研究,以增強(qiáng)當(dāng)今的加速技術(shù)。Shrivastava 列出了當(dāng)今使用的三種常見類型的加速器:硬件加速器、FPGAGPU。硬件加速器將特定的計(jì)算元素專用于處理計(jì)算,而不是在 CPU 上運(yùn)行它們。它們速度快、功耗低,但不適合當(dāng)今快速變化的技術(shù)迭代,因?yàn)樗鼈儾豢删幊?。FPGA 是可編程的——開發(fā)人員可以在其上編寫任何邏輯并且它們可以充當(dāng)加速器——但 Shrivastava 說它們通常過于通用并且消耗太多功率。GPU 是當(dāng)今流行的加速器,

粗粒度可重構(gòu)陣列

Shrivastava 正在開發(fā)粗??芍貥?gòu)陣列 (CGRA),它可以加速非并行循環(huán),并在 GPU 的并行循環(huán)優(yōu)勢之上實(shí)現(xiàn)更多加速功能。CGRA 由一個由算術(shù)邏輯單元 (ALU) 和寄存器組成的二維網(wǎng)格組成,這些單元接收輸入和指令,計(jì)算指令的算術(shù)或邏輯運(yùn)算,并將輸出發(fā)送給它的四個鄰居以計(jì)算下一個步驟(圖 1)。

圖 1:粗粒度可重構(gòu)陣列。

pYYBAGKn7RuAfDpEAATcUI-H07s228.png

CGRA 的潛力來自于他們能夠在消耗很少的電力的情況下執(zhí)行操作。在常規(guī)處理器中執(zhí)行加法運(yùn)算需要很大的功率:它必須經(jīng)過 20 多個流水線階段。在 CGRA 中,只需要從鄰居那里獲取操作數(shù)并執(zhí)行加法運(yùn)算。CGRA 可以通過流水線加速——循環(huán)的操作被布置在 CGRA 的 PE 上,數(shù)據(jù)在它們之間流動。

CGRA 本身并不新鮮,但開發(fā)人員對現(xiàn)有的 CGRA 進(jìn)行編程以僅執(zhí)行一種類型的計(jì)算。Shrivastava 說,挑戰(zhàn)在于映射,因?yàn)檠h(huán)內(nèi)核需要映射到 CGRA,操作映射到節(jié)點(diǎn),數(shù)據(jù)依賴關(guān)系映射到 CGRA 的路徑。Shrivastava 的目標(biāo)是消除耗時(shí)的手動編碼,并使任何類型的循環(huán)或計(jì)算能夠通過編譯器映射到 CGRA,這是一種相對較新的方法。他正在開發(fā)一個生成映射代碼的編譯器工具鏈。

Shrivastava 說 CGRA 的研究引起了 IBM 的興趣,IBM 希望將這種方法應(yīng)用于并行循環(huán)輕型服務(wù)器應(yīng)用程序。用于科學(xué)研究和多媒體擴(kuò)展的圖形和高性能計(jì)算也可以從使用 CGRA 中獲益。

解決分支分歧問題

所有現(xiàn)有加速技術(shù)面臨的一個挑戰(zhàn)是“分支分歧”。當(dāng)執(zhí)行具有“if-then-else”結(jié)構(gòu)的循環(huán)時(shí),加速器分配資源以執(zhí)行來自分支的兩條路徑(真路徑和假路徑)的指令,然后丟棄假路徑指令的影響。FPGA 將兩個路徑的功能映射到計(jì)算資源上,GPU 執(zhí)行來自兩個分支路徑的指令并丟棄錯誤路徑指令的結(jié)果。加速器必須這樣做,因?yàn)樵诜峙浞种窂劫Y源時(shí),分支的結(jié)果在編譯時(shí)是未知的(分支的結(jié)果是在運(yùn)行時(shí)計(jì)算的,當(dāng)執(zhí)行分支時(shí))。這種冗余執(zhí)行會導(dǎo)致分支花費(fèi)雙倍的性能時(shí)間和執(zhí)行能力。

Shrivastava 和他的團(tuán)隊(duì)提出了通過智能硬件-軟件協(xié)同設(shè)計(jì)解決分支分歧問題的方法。不是為真路徑分配一些PE,而為假路徑分配一些PE,而是分配相同的PE來執(zhí)行來自兩條路徑的指令。來自真路徑和來自假路徑的指令都發(fā)給PE。在運(yùn)行時(shí),PE 只選擇正確的一個來執(zhí)行。

審核編輯:郭婷

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報(bào)投訴
  • 處理器
    +關(guān)注

    關(guān)注

    68

    文章

    20282

    瀏覽量

    253101
  • gpu
    gpu
    +關(guān)注

    關(guān)注

    28

    文章

    5218

    瀏覽量

    135664
  • 編譯器
    +關(guān)注

    關(guān)注

    1

    文章

    1672

    瀏覽量

    51753
收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關(guān)推薦
    熱點(diǎn)推薦

    復(fù)合機(jī)器人重構(gòu)柔性裝配 賦能智能制造產(chǎn)線全面升級

    一、智能制造升級浪潮下 重構(gòu)柔性裝配成工業(yè)核心剛需 在工業(yè) 4.0 深度推進(jìn)與中國制造 2025國家戰(zhàn)略落地的背景下,制造業(yè)正從傳統(tǒng)規(guī)模化批量生產(chǎn)向多品種、小批量、定制化生產(chǎn)模式轉(zhuǎn)型,這一
    的頭像 發(fā)表于 03-05 17:58 ?1076次閱讀
    復(fù)合機(jī)器人<b class='flag-5'>可</b><b class='flag-5'>重構(gòu)</b>柔性裝配 賦能智能制造產(chǎn)線全面升級

    10AX022C3U19I2SG現(xiàn)場可編程門陣列(FPGA)芯片

    :13,752,320位,支持高速數(shù)據(jù)緩存與處理性能特點(diǎn)高性能邏輯處理能力l 基于220,000個邏輯單元,實(shí)現(xiàn)復(fù)雜數(shù)字信號處理(DSP)、算法
    發(fā)表于 02-27 09:31

    高壓放大器在激勵低頻重構(gòu)磁電天線中的應(yīng)用

    根據(jù)磁電天線的機(jī)械振蕩原理,本研究提出了一種基于機(jī)械調(diào)節(jié)方法的超低頻重構(gòu)磁電天線。該磁電天線的多維性能,如工作頻率、帶寬和品質(zhì)因數(shù)(Q),可以在不破壞天線結(jié)構(gòu)的情況下在很大的動態(tài)范圍內(nèi)進(jìn)行調(diào)整
    的頭像 發(fā)表于 01-16 16:32 ?147次閱讀
    高壓放大器在激勵低頻<b class='flag-5'>可</b><b class='flag-5'>重構(gòu)</b>磁電天線中的應(yīng)用

    AMD利用重構(gòu)FPGA設(shè)備Moku實(shí)現(xiàn)自定義激光探測解決方案

    摘要本文介紹了AdvancedMicroDevices,AMD公司如何基于重構(gòu)FPGA設(shè)備自定義激光探測解決方案,替代傳統(tǒng)的儀器配置,通過靈活且定制的FPGA設(shè)備Moku提供更高效和靈活的激光
    的頭像 發(fā)表于 11-20 17:28 ?1765次閱讀
    AMD利用<b class='flag-5'>可</b><b class='flag-5'>重構(gòu)</b>FPGA設(shè)備Moku實(shí)現(xiàn)自定義激光探測解決方案

    AES和SM4算法的重構(gòu)分析

    一、AES和SM4算法特點(diǎn)分析 基于前面幾篇分享,我們對AES和SM4的算法流程有了較為清晰的認(rèn)識,接下來對AES和SM4算法的共同點(diǎn)進(jìn)行分析,得出二者的重構(gòu)設(shè)計(jì)思路。 首先,這里把AES
    發(fā)表于 10-23 07:26

    工業(yè)AI智能體重構(gòu)人機(jī)結(jié)合邊界

    從“設(shè)備管人”到“數(shù)據(jù)賦能人”,從“經(jīng)驗(yàn)驅(qū)動”到“智能決策,工業(yè)自動化的演進(jìn),本質(zhì)是生產(chǎn)關(guān)系與生產(chǎn)力的持續(xù)重構(gòu)。隨著自動化技術(shù)的顛覆性突破,人工智能的加速發(fā)展使得“人機(jī)結(jié)合”的制造環(huán)境正逐步變?yōu)楝F(xiàn)實(shí)
    的頭像 發(fā)表于 10-15 09:50 ?1199次閱讀

    瑞薩電子RZ/V系列微處理器助力邊緣AI開發(fā)

    邊緣AI越來越多地應(yīng)用于諸如工業(yè)攝像頭和公共設(shè)施攝像頭等嵌入式設(shè)備中,并要求嵌入式產(chǎn)品小型化且具有低功耗。瑞薩電子RZ/V系列微處理器(MPU)內(nèi)置AI加速器,即動態(tài)重構(gòu)
    的頭像 發(fā)表于 09-23 10:31 ?948次閱讀
    瑞薩電子RZ/V系列微<b class='flag-5'>處理</b>器助力邊緣AI開發(fā)

    FlashDB 的TSDB不支持寫粒度為128,是出于什么考慮有這樣的限制?

    FlashDB 的TSDB不支持寫粒度為128,是出于什么考慮有這樣的限制? 如果我希望把這個數(shù)據(jù)庫移植到這樣的一個mcu上,我們應(yīng)該怎么做,有些建議嗎。 感謝各位大佬指點(diǎn)。
    發(fā)表于 09-23 08:19

    陣列式雷達(dá)流量監(jiān)測站-案例分享

    (水位)和水面流速,進(jìn)而計(jì)算出流量。一、工作原理陣列雷達(dá)技術(shù):采用多天線陣列,同時(shí)發(fā)射多個雷達(dá)波束,覆蓋更廣的水面區(qū)域。非接觸式測量:安裝在水面上方(如橋梁、支架)
    的頭像 發(fā)表于 09-11 16:31 ?1395次閱讀
    <b class='flag-5'>陣列</b>式雷達(dá)流量監(jiān)測站-案例分享

    ATA-7010高壓放大器:開啟低頻重構(gòu)磁電天線激勵的新篇章

    根據(jù)磁電天線的機(jī)械振蕩原理,本研究提出了一種基于機(jī)械調(diào)節(jié)方法的超低頻重構(gòu)磁電天線。該磁電天線的多維性能,如工作頻率、帶寬和品質(zhì)因數(shù)(Q),可以在不破壞天線結(jié)構(gòu)的情況下在很大的動態(tài)范圍內(nèi)進(jìn)行調(diào)整
    的頭像 發(fā)表于 08-30 10:43 ?664次閱讀
    ATA-7010高壓放大器:開啟低頻<b class='flag-5'>可</b><b class='flag-5'>重構(gòu)</b>磁電天線激勵的新篇章

    AI 智能重構(gòu)測試測量平臺,Moku:Delta集成業(yè)內(nèi)首創(chuàng)“生成式儀器”

    ?;凇败浖x+硬件重構(gòu)”的平臺架構(gòu),LiquidInstruments最新發(fā)布業(yè)內(nèi)首創(chuàng)的“生成式儀器技術(shù)(GenerativeInstrumentation)”集
    的頭像 發(fā)表于 07-15 11:34 ?633次閱讀
    AI 智能<b class='flag-5'>重構(gòu)</b>測試測量平臺,Moku:Delta集成業(yè)內(nèi)首創(chuàng)“生成式儀器”

    重構(gòu)測試 智變升級|全新一代智能測控平臺Moku:Delta發(fā)布!

    LiquidInstruments推出第四代智能測控平臺#Moku:Delta,延續(xù)并升級了Moku系列一貫的“軟件定義+硬件重構(gòu)”設(shè)計(jì)理念,結(jié)合2GHz瞬時(shí)帶寬、超低噪聲和高分辨率前端設(shè)計(jì),實(shí)現(xiàn)
    的頭像 發(fā)表于 06-25 17:04 ?1062次閱讀
    <b class='flag-5'>重構(gòu)</b>測試 智變升級|全新一代智能測控平臺Moku:Delta發(fā)布!

    清微智能官宣:國產(chǎn)重構(gòu)芯片全球出貨量突破2000萬顆

    近日,由北京智源人工智能研究院主辦的第7屆北京智源大會成功舉辦。作為國產(chǎn)原創(chuàng)重構(gòu)芯片架構(gòu)領(lǐng)導(dǎo)者,清微智能受邀出席,向大眾展示了前沿高階國產(chǎn)算力技術(shù)成果。 在本次大會上,清微智能首次官宣,公司
    的頭像 發(fā)表于 06-12 17:15 ?1708次閱讀
    清微智能官宣:國產(chǎn)<b class='flag-5'>可</b><b class='flag-5'>重構(gòu)</b>芯片全球出貨量突破2000萬顆

    中科億海微重構(gòu)智能超表面電磁單元控制方案:多維調(diào)控電磁波,助力6G無線中繼

    重構(gòu)智能超表面(RIS)技術(shù)是一種新興的人工電磁表面技術(shù),它通過可編程的方式對電磁波進(jìn)行智能調(diào)控,具有低成本、低能耗、可編程、易部署等特點(diǎn)。通過構(gòu)建智能可控?zé)o線環(huán)境,有機(jī)會突破傳統(tǒng)無線通信的約束
    的頭像 發(fā)表于 06-12 11:06 ?938次閱讀
    中科億海微<b class='flag-5'>可</b><b class='flag-5'>重構(gòu)</b>智能超表面電磁單元控制方案:多維調(diào)控電磁波,助力6G無線中繼

    ?數(shù)字孿生熱管理:NTC熱敏電阻陣列與熱場重構(gòu)算法的動態(tài)適配

    本文以東莞市平尚電子科技有限公司(平尚科技)的NTC熱敏電阻陣列與熱場重構(gòu)算法為核心,探討其在車載數(shù)字孿生熱管理系統(tǒng)中的動態(tài)適配技術(shù)。通過高精度NTC陣列、多物理場耦合模型及實(shí)時(shí)反饋控制算法,實(shí)現(xiàn)熱
    的頭像 發(fā)表于 06-06 17:59 ?883次閱讀
    ?數(shù)字孿生熱管理:NTC熱敏電阻<b class='flag-5'>陣列</b>與熱場<b class='flag-5'>重構(gòu)</b>算法的動態(tài)適配