91欧美超碰AV自拍|国产成年人性爱视频免费看|亚洲 日韩 欧美一厂二区入|人人看人人爽人人操aV|丝袜美腿视频一区二区在线看|人人操人人爽人人爱|婷婷五月天超碰|97色色欧美亚州A√|另类A√无码精品一级av|欧美特级日韩特级

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫(xiě)文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

FPGA與GPU類(lèi)比一下就明白了

Q4MP_gh_c472c21 ? 來(lái)源:嵌入式AR ? 2019-12-03 15:28 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

FPGA 是一堆晶體管,你可以把它們連接(wire up)起來(lái)做出任何你想要的電路。它就像一個(gè)納米級(jí)面包板。使用 FPGA 就像芯片流片,但是你只需要買(mǎi)這一張芯片就可以搭建不一樣的設(shè)計(jì),作為交換,你需要付出一些效率上的代價(jià)。

從字面上講這種說(shuō)法并不對(duì),因?yàn)槟悴⒉恍枰剡B(rewire)FPGA,它實(shí)際上是一個(gè)通過(guò)路由網(wǎng)絡(luò)(routing network)連接的查找表 2D 網(wǎng)格,以及一些算術(shù)單元和內(nèi)存。FPGA 可以模擬任意電路,但它們實(shí)際上只是在模仿,就像軟件電路仿真器模擬電路一樣。這個(gè)答案不恰當(dāng)?shù)牡胤皆谟?,它過(guò)分簡(jiǎn)化了人們實(shí)際使用 FPGA 的方式。接下來(lái)的兩個(gè)定義能更好地描述 FPGA。

電路模擬是 FPGA 的經(jīng)典主流用例,這也是 FPGA 最早出現(xiàn)的原因。FPGA 的關(guān)鍵在于硬件設(shè)計(jì)是用 HDL 形式編碼的,而且買(mǎi)一些便宜的硬件就可以得到和 ASIC 相同的效果。當(dāng)然,你不可能在 FPGA 和真正的芯片上使用完全相同的 Verilog 代碼,但至少它們的抽象范圍是一樣的。

這是與 ASIC 原型設(shè)計(jì)不同的一個(gè)用例。和電路仿真不同,計(jì)算加速是 FPGA 的新興用例。這也是微軟最近成功加速搜索和深度神經(jīng)網(wǎng)絡(luò)的原因。而且關(guān)鍵的是,計(jì)算實(shí)例并不依賴于 FPGA 和真正 ASIC 之間的關(guān)系:開(kāi)發(fā)人員針對(duì)基于 FPGA 的加速編寫(xiě)的 Verilog 代碼不需要與用來(lái)流片的 Verilog 代碼有任何的相似性。

這兩種實(shí)例在編程、編譯器和抽象方面存在巨大差異。我比較關(guān)注后者,我將其稱為「計(jì)算 FPGA 編程」(computaTIonal FPGA programming)。我的論點(diǎn)是,目前計(jì)算 FPGA 的編程方法都借鑒了傳統(tǒng)的電路仿真編程模型,這是不對(duì)的。如果你想開(kāi)發(fā) ASIC 原型的話,Verilog 和 VHDL 都是正確的選擇。但如果目標(biāo)是計(jì)算的話,我們可以也應(yīng)該重新思考整個(gè)堆棧。
讓我們開(kāi)門(mén)見(jiàn)山地說(shuō)吧。FPGA 是一類(lèi)很特殊的硬件,它用來(lái)高效執(zhí)行模擬電路描述的特殊軟件。FPGA 配置需要一些底層軟件——它是為了 ISA 編寫(xiě)的程序。 這里可以用 GPU 做類(lèi)比。 在深度學(xué)習(xí)區(qū)塊鏈盛行之前,有一段時(shí)間 GPU 是用來(lái)處理圖形的。在 21 世紀(jì)初,人們意識(shí)到他們?cè)谔幚頉](méi)有圖形數(shù)據(jù)的計(jì)算密集型任務(wù)時(shí),也會(huì)大量使用 GPU 作為加速器:GPU 設(shè)計(jì)師們已經(jīng)構(gòu)建了更通用的機(jī)器,3D 渲染只是其中一個(gè)應(yīng)用而已。
FPGA的定義以及和GPU的類(lèi)比
計(jì)算 FPGA 遵循了相同的軌跡。我們的想法是要多多使用這一時(shí)興的硬件,當(dāng)然不是為了電路仿真,而是利用適合電路執(zhí)行的計(jì)算模式,用類(lèi)比的形式來(lái)看 GPU 和 FPGA。
為了讓 GPU 發(fā)展成今天的數(shù)據(jù)并行加速器,人們不得不重新定義 GPU 輸入的概念。我們過(guò)去常常認(rèn)為 GPU 接受奇特的、強(qiáng)烈的、特定領(lǐng)域的視覺(jué)效果描述。我們實(shí)現(xiàn)了 GPU 執(zhí)行程序,從而解鎖了它們真正的潛力。這樣的實(shí)現(xiàn)讓 GPU 的目標(biāo)從單個(gè)應(yīng)用域發(fā)展為整個(gè)計(jì)算域。 我認(rèn)為計(jì)算 FPGA 正處于類(lèi)似的轉(zhuǎn)變中,現(xiàn)在還沒(méi)有針對(duì) FPGA 擅長(zhǎng)的基本計(jì)算模式的簡(jiǎn)潔描述。但它和潛在的不規(guī)則并行性、數(shù)據(jù)重用以及大多數(shù)靜態(tài)的數(shù)據(jù)流有關(guān)。 和 GPU 一樣,F(xiàn)PGA 也需要能夠體現(xiàn)這種計(jì)算模式的硬件抽象,Verilog 用于計(jì)算 FPGA 的問(wèn)題在于它在低級(jí)硬件抽象中效果不好,在高級(jí)編程抽象中的效果也不好。讓我們通過(guò)反證法想象一下,如果用 RTL(寄存器傳輸級(jí))取代這些角色會(huì)是什么樣。 甚至 RTL 專家可能也無(wú)法相信 Verilog 是可以高效開(kāi)發(fā)主流 FPGA 的方式。它不會(huì)把編程邏輯推向主流。對(duì)于經(jīng)驗(yàn)豐富的硬件黑客來(lái)說(shuō),RTL 設(shè)計(jì)似乎是友好而熟悉的,但它與軟件語(yǔ)言之間的生產(chǎn)力差距是不可估量的。
事實(shí)上,對(duì)現(xiàn)在的計(jì)算 FPGA 來(lái)說(shuō),Verilog 實(shí)際上就是 ISA。主要的 FPGA 供應(yīng)商工具鏈會(huì)將 Verilog 作為輸入,而高級(jí)語(yǔ)言的編譯器則將 Verilog 作為輸出。供應(yīng)商一般會(huì)對(duì)比特流格式保密,因此 Verilog 在抽象層次結(jié)構(gòu)中會(huì)處于盡可能低的位置。
把 Verilog 當(dāng)做 ISA 的問(wèn)題是它和硬件之間的距離太遠(yuǎn)了。RTL 和 FPGA 硬件之間的抽象差距是巨大的,從傳統(tǒng)角度講它至少要包含合成、技術(shù)映射以及布局布線——每一個(gè)都是復(fù)雜而緩慢的過(guò)程。因此,F(xiàn)PGA 上 RTL 編程的編譯/編輯/運(yùn)行周期需要數(shù)小時(shí)或數(shù)天,更糟糕的是,這是一個(gè)無(wú)法預(yù)測(cè)的過(guò)程,工具鏈的深層堆棧可能會(huì)掩蓋 RTL 中的改變,這可能會(huì)影響設(shè)計(jì)性能和能源特性。
好的 ISA 應(yīng)該直接展示底層硬件未經(jīng)修飾的真實(shí)情況。像匯編語(yǔ)言一樣,它其實(shí)不需要很方便編程。但也像匯編語(yǔ)言一樣,它的編譯速度需要非??欤医Y(jié)果可預(yù)測(cè)。如果想要構(gòu)建更高級(jí)的抽象和編譯器,就需要一個(gè)不會(huì)出現(xiàn)意外的低級(jí)目標(biāo)。而 RTL 不是這樣的目標(biāo)。
如果計(jì)算 FPGA 是特定類(lèi)算法模式的加速器,那當(dāng)前的 FPGA 并不能理想地實(shí)現(xiàn)這一目標(biāo)。在這個(gè)游戲規(guī)則下能夠擊敗 FPGA 的新硬件類(lèi)型,才可能帶來(lái)全新的抽象層次結(jié)構(gòu)。新的軟件棧應(yīng)該摒棄 FPGA 在電路仿真方面的遺留問(wèn)題,以及 RTL 抽象。
-END-

聲明:本文內(nèi)容及配圖由入駐作者撰寫(xiě)或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問(wèn)題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • FPGA
    +關(guān)注

    關(guān)注

    1660

    文章

    22423

    瀏覽量

    636696
  • 晶體管
    +關(guān)注

    關(guān)注

    78

    文章

    10396

    瀏覽量

    147882
  • 編譯器
    +關(guān)注

    關(guān)注

    1

    文章

    1672

    瀏覽量

    51682

原文標(biāo)題:FPGA難懂?與GPU類(lèi)比一下就明白了

文章出處:【微信號(hào):gh_c472c2199c88,微信公眾號(hào):嵌入式微處理器】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評(píng)論

    相關(guān)推薦
    熱點(diǎn)推薦

    FPGA+GPU異構(gòu)混合部署方案設(shè)計(jì)

    為滿足對(duì) “納秒級(jí)實(shí)時(shí)響應(yīng)” 與 “復(fù)雜數(shù)據(jù)深度運(yùn)算” 的雙重需求,“FPGA+GPU”異構(gòu)混合部署方案通過(guò)硬件功能精準(zhǔn)拆分與高速協(xié)同,突破單硬件的性能瓶頸 ——FPGA聚焦低延遲實(shí)時(shí)交易鏈路,
    的頭像 發(fā)表于 01-13 15:20 ?373次閱讀

    咨詢一下工業(yè)設(shè)計(jì)中批量生產(chǎn)FPGA時(shí),程序是如何批量下載

    是否成功,自動(dòng)掃描待燒寫(xiě)的程序,并顯示燒寫(xiě)程序是否成功等信息。這樣來(lái),即使是外行人也能夠輕松實(shí)現(xiàn)批量燒寫(xiě)程序。 在此,想咨詢一下目前業(yè)內(nèi)針對(duì)批量燒寫(xiě) FPGA 程序都有哪些成熟的方案?這些方案各自具有怎樣的特點(diǎn)和適用場(chǎng)景?
    發(fā)表于 12-24 22:40

    【雷達(dá)模組】久坐提醒設(shè)備,“起來(lái)走動(dòng)一下

    。之前申請(qǐng)的Rd-03 _ V2剛好滿足,所以就通過(guò)Rd-03 _ V2實(shí)現(xiàn)感知人體存在。 由于主要考慮PC提醒所以這次上位機(jī)沒(méi)有使用單片機(jī),而是使用 USB轉(zhuǎn)串口連接Rd-03 _ V2,使用上報(bào)模式來(lái)實(shí)現(xiàn)較為細(xì)致的行為檢測(cè)。 之前做的都是方方正正的,這次想著美化一下。弄
    的頭像 發(fā)表于 12-16 09:20 ?393次閱讀
    【雷達(dá)模組】久坐提醒設(shè)備,“起來(lái)走動(dòng)<b class='flag-5'>一下</b>”

    支付寶“碰一下”的革新背后:國(guó)民技術(shù)MCU的隱形力量

    近日,全球頂尖金融科技盛會(huì)Money20/20公布首屆創(chuàng)新大獎(jiǎng)TheMoneyAwards結(jié)果,“支付寶碰一下”從眾多參賽企業(yè)中脫穎而出,憑借創(chuàng)新的解決方案和極致的用戶體驗(yàn)摘得“支付”類(lèi)別大獎(jiǎng),成為
    的頭像 發(fā)表于 11-21 19:15 ?1356次閱讀
    支付寶“碰<b class='flag-5'>一下</b>”的革新背后:國(guó)民技術(shù)MCU的隱形力量

    瑞蘇盈科:FPGA領(lǐng)域的創(chuàng)新者,以技術(shù)實(shí)力賦能FPGA設(shè)計(jì)服務(wù)和解決方案

    我們今天,小編向大家詳細(xì)的介紹一下——瑞蘇盈科,個(gè)FPGA界的寶藏選手,您想了解的全在這里
    的頭像 發(fā)表于 11-21 08:32 ?458次閱讀
    瑞蘇盈科:<b class='flag-5'>FPGA</b>領(lǐng)域的創(chuàng)新者,以技術(shù)實(shí)力賦能<b class='flag-5'>FPGA</b>設(shè)計(jì)服務(wù)和解決方案

    如何看懂GPU架構(gòu)?分鐘帶你了解GPU參數(shù)指標(biāo)

    分析GPU核心參數(shù)體系:算力、顯存大小、顯存帶寬、熱門(mén)架構(gòu)特性等關(guān)鍵指標(biāo),旨在幫您理解不同應(yīng)用場(chǎng)景,如何選擇最合適的GPU算力解決方案。1、算力GPU執(zhí)行浮點(diǎn)運(yùn)算
    的頭像 發(fā)表于 10-09 09:28 ?1153次閱讀
    如何看懂<b class='flag-5'>GPU</b>架構(gòu)?<b class='flag-5'>一</b>分鐘帶你了解<b class='flag-5'>GPU</b>參數(shù)指標(biāo)

    奧比中光助力支付寶碰一下落地電梯場(chǎng)景

    近日,支付寶與分眾傳媒宣布聯(lián)合推出“碰一下搶紅包”服務(wù)。作為創(chuàng)新交互方式,“支付寶碰一下”首次被引入至電梯場(chǎng)景,并已在全國(guó)20余個(gè)城市的電梯鋪設(shè)。奧比中光作為“支付寶碰一下”業(yè)務(wù)的核心供應(yīng)商,為這
    的頭像 發(fā)表于 08-12 11:32 ?1245次閱讀

    AI狂飆, FPGA會(huì)掉隊(duì)嗎? ()

    ;新工藝新接口:視頻接口,測(cè)試測(cè)量等。有那么多的機(jī)會(huì),FPGA怎么不上天呢?其實(shí)FPGA真上天,在每臺(tái)火星車(chē)上,幾乎都有宇航級(jí)FPGA
    的頭像 發(fā)表于 08-11 09:25 ?3920次閱讀
    AI狂飆, <b class='flag-5'>FPGA</b>會(huì)掉隊(duì)嗎? (<b class='flag-5'>下</b>)

    aicube的n卡gpu索引該如何添加?

    請(qǐng)問(wèn)有人知道aicube怎樣才能讀取n卡的gpu索引呢,我已經(jīng)安裝了cuda和cudnn,在全局的py里添加了torch,能夠調(diào)用gpu,當(dāng)還是只能看到默認(rèn)的gpu0,顯示不了gpu1
    發(fā)表于 07-25 08:18

    “碰一下”支付終端應(yīng)用在酒店:智能無(wú)卡入住與客房控制

    “碰一下”支付終端和“碰一下”支付機(jī)具今年已在各種餐飲零售門(mén)店推廣應(yīng)用。就連天波小編家附近的村口小超市也用上了“碰一下”支付終端。近日,鹵味龍頭企業(yè)絕味食品宣布,全國(guó)門(mén)店將接入“支付寶碰一下
    的頭像 發(fā)表于 07-04 09:57 ?844次閱讀
    “碰<b class='flag-5'>一下</b>”支付終端應(yīng)用在酒店:智能無(wú)卡入住與客房控制

    類(lèi)比半導(dǎo)體推出全新第二代高邊開(kāi)關(guān)芯片HD80012

    致力于提供高品質(zhì)汽車(chē)驅(qū)動(dòng)芯片和高品質(zhì)工業(yè)模擬芯片供應(yīng)商上海類(lèi)比半導(dǎo)體技術(shù)有限公司(稱“類(lèi)比半導(dǎo)體”或“類(lèi)比”)宣布推出全新第二代高邊開(kāi)關(guān)芯片HD80012,單通道低內(nèi)阻1.2mΩ產(chǎn)品
    的頭像 發(fā)表于 07-02 15:19 ?1342次閱讀
    <b class='flag-5'>類(lèi)比</b>半導(dǎo)體推出全新第二代高邊開(kāi)關(guān)芯片HD80012

    一下終端,讓自助售貨機(jī)秒變 “家里的冰箱”

    繼刷臉支付后,支付寶近日又推出了新的支付方式——碰一下支付。只需將手機(jī)輕輕靠近支付寶“碰一下”支付終端,即可完成支付,比以往要先解鎖手機(jī),調(diào)出APP的付款碼再支付的操作環(huán)節(jié)要便捷和省時(shí)許多?!芭?b class='flag-5'>一下
    的頭像 發(fā)表于 06-18 10:49 ?1817次閱讀
    碰<b class='flag-5'>一下</b>終端,讓自助售貨機(jī)秒變 “家里的冰箱”

    類(lèi)比半導(dǎo)體推出全新第二代高邊開(kāi)關(guān)芯片HD8004

    致力于提供高品質(zhì)汽車(chē)驅(qū)動(dòng)芯片和高品質(zhì)工業(yè)模擬芯片供應(yīng)商上海類(lèi)比半導(dǎo)體技術(shù)有限公司(稱“類(lèi)比半導(dǎo)體”或“類(lèi)比”)宣布推出全新第二代高邊開(kāi)關(guān)芯片HD8004,單通道低內(nèi)阻4.3mΩ產(chǎn)品。
    的頭像 發(fā)表于 05-21 18:04 ?1357次閱讀
    <b class='flag-5'>類(lèi)比</b>半導(dǎo)體推出全新第二代高邊開(kāi)關(guān)芯片HD8004

    可以手動(dòng)構(gòu)建imx-gpu-viv嗎?

    在 debian 10 上使用 imx gpu 交叉編譯 Qt,以便它與我的應(yīng)用程序起工作。但是 imx-gpu-viv-6.4.3.p4.2.aarch64.bin(libGAL.so、libEGL.so
    發(fā)表于 03-28 06:35

    個(gè)過(guò)零檢測(cè)電路,但有部分電路沒(méi)看明白,有大神可以詳細(xì)解釋一下

    個(gè)過(guò)零檢測(cè)電路,但是沒(méi)明白粉色框部分有什么作用,有大神可以詳細(xì)解釋一下
    發(fā)表于 03-20 00:40