91欧美超碰AV自拍|国产成年人性爱视频免费看|亚洲 日韩 欧美一厂二区入|人人看人人爽人人操aV|丝袜美腿视频一区二区在线看|人人操人人爽人人爱|婷婷五月天超碰|97色色欧美亚州A√|另类A√无码精品一级av|欧美特级日韩特级

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

如何設計更智能的Edge AI

星星科技指導員 ? 來源:嵌入式計算設計 ? 作者:Tony King-Smith ? 2022-07-10 11:30 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

作為一名擁有 40 多年半導體業(yè)務研發(fā)總監(jiān)和 CMO 經驗的工程師,我認為我自己和我的同行是合乎邏輯的。然而,我們當中有多少人可以誠實地說我們沒有被諸如“我的小部件比你的快?”這樣的說法所誘惑??峙逻@只是人性,尤其是當我們對你的專業(yè)知識沒有信心來調查這些說法時。

問題始終是一個定義:我如何定義“更快”或“更低功率”或“更便宜”?這是基準試圖解決的問題——它是關于具有一致的上下文和外部標準,以確保您將同類與同類進行比較。任何使用基準測試的人都非常清楚這一點(aiMotive 誕生于一家領先的 GPU 基準測試公司)。

在嘗試比較汽車 AI 應用的硬件平臺時,解決這種轟炸式索賠的需求從未像現(xiàn)在這樣緊迫。

10 TOPS 什么時候不是 10 TOPS?

無論是否有專用的 NPU,大多數(shù) SoC 都將其執(zhí)行 NN 工作負載的能力稱為 TOPS:每秒 Tera 操作。這只是 NPU(或整個 SoC)原則上每秒可以執(zhí)行的算術運算總數(shù),無論全部集中在專用 NPU 中還是分布在多個計算引擎中,例如 GPU、CPU 矢量協(xié)處理器、或其他加速器。

但是,沒有任何硬件執(zhí)行引擎能以 100% 的效率執(zhí)行任何工作負載的各個方面。對于神經網絡推理,某些層(例如池化或激活)在數(shù)學上與卷積非常不同。在卷積本身(或其他層,如池化)可以開始之前,數(shù)據(jù)必須重新排列或從一個地方移動到另一個地方。其他時候,NPU 可能需要等待來自控制它的主機 CPU 的新指令或數(shù)據(jù),每個層甚至每個數(shù)據(jù)塊。這些都導致完成的計算更少,從而限制了理論上的最大容量。

硬件利用率——不是它看起來的樣子

許多 NPU 供應商會引用硬件利用率來表明他們的 NPU 執(zhí)行給定 NN 工作負載的情況。這基本上是說,“這就是我的 NPU 的理論容量有多少被用于執(zhí)行 NN 工作負載。” 當然,這告訴我我需要知道什么。

不幸的是沒有。硬件利用率的問題是定義之一:數(shù)量完全取決于 NPU 供應商選擇如何定義它。事實上,硬件利用率和 TOPS 的問題在于它們只告訴你硬件引擎理論上能夠實現(xiàn)什么,而不是它實現(xiàn)的程度。

這可能會導致一些誤導性信息。下面的圖 1 顯示了我們在額定 4 TOPS 的 aiWare3P NPU 與另一個額定為 8 TOPS 的知名 NPU 之間進行的比較。

poYBAGLKR_eAck4HAACgiX1heSI601.png

圖 1:兩個汽車推理 NPU 的利用率與效率比較

對于兩個不同的知名基準,競爭對手 X NPU 聲稱 8 TOPS 容量,而 aiWare3P 的 4 TOPS。這應該意味著它將提供大約 2 倍于 aiWare3P 的 fps 性能。然而,實際上,情況正好相反:aiWare3P 的性能提高了 2 到 5 倍,盡管它只是聲稱的 TOPS 的一半!

結論:TOPS 是衡量 AI 硬件能力的一種非常糟糕的方法;硬件利用率幾乎與 TOPS 一樣具有誤導性。

NPU 效率和自主性:優(yōu)化 PPA 的關鍵

這就是為什么我認為您必須根據(jù)執(zhí)行一組代表性工作負載時的效率而不是原始理論硬件容量來評估 NPU 能力。效率定義為為一幀執(zhí)行特定 CNN 需要多少操作,占聲稱的 TOPS 總數(shù)的百分比。該數(shù)字僅基于定義任何 CNN 的基礎數(shù)學算法計算得出,無論 NPU 實際如何評估它。它比較了實際與聲稱的性能,這才是真正重要的。

展示出高效率的 NPU 意味著它將充分利用用于實現(xiàn)它的每平方毫米硅片,這意味著更低的芯片成本和更低的功耗。效率可為汽車 SoC 或 ASIC 提供最佳 PPA(性能、功率和面積)。

NPU 的自治性是另一個重要因素。NPU 在主機 CPU 上放置多少 CPU 負載才能達到最高性能?這與內存子系統(tǒng)有什么關系?NPU 必須被視為任何 SoC 或 ASIC 中的大塊——它對芯片和子系統(tǒng)其余部分的影響不容忽視。

結論

在設計任何 SoC 或 ASIC 汽車時,AI 工程師必須專注于構建能夠可靠執(zhí)行其算法的生產平臺,同時實現(xiàn)卓越的 PPA:最低功耗、最低成本、更高性能。他們還必須在設計周期的早期就選擇硬件平臺,通常是在開發(fā)最終算法之前。

效率是實現(xiàn)這一目標的最佳方式;TOPS 和硬件利用率都不是好的衡量標準。如果要滿足苛刻的生產目標,評估 NPU 的自主性也至關重要。

審核編輯:郭婷

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • cpu
    cpu
    +關注

    關注

    68

    文章

    11295

    瀏覽量

    225395
  • soc
    soc
    +關注

    關注

    40

    文章

    4581

    瀏覽量

    229448
  • AI
    AI
    +關注

    關注

    91

    文章

    40201

    瀏覽量

    301831
收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關推薦
    熱點推薦

    使用NORDIC AI的好處

    × 在 CPU 上運行時可快 10×、省電,平均模型體積 <5 KB。[Edge AI 軟件頁] Axon NPU 對同一 TensorFlow Lite 模型:* 推理速度最高可比
    發(fā)表于 01-31 23:16

    IBM Rhapsody AI 助手:讓系統(tǒng)工程智能

    IBM Rhapsody AI 能力的加入,標志著系統(tǒng)工程正逐步邁入智能化新階段。它讓模型不再只是“被動表達設計意圖”的工具,而成為能理解、能推理、能生成的智能伙伴。在 AI 時代,系
    的頭像 發(fā)表于 01-06 11:34 ?341次閱讀
    IBM Rhapsody <b class='flag-5'>AI</b> 助手:讓系統(tǒng)工程<b class='flag-5'>更</b><b class='flag-5'>智能</b>

    聯(lián)想集團想幫幫服務智能體榮膺2025 EDGE AWARDS最佳AI創(chuàng)新應用

    2025年12月21日,鈦媒體2025 EDGE AWARDS全球創(chuàng)新評選正式收官,想幫幫服務智能體憑借其卓越的創(chuàng)新技術和應用實力,成功入選年度創(chuàng)新AI榜,并榮膺「最佳AI創(chuàng)新應用獎項
    的頭像 發(fā)表于 12-30 11:26 ?668次閱讀

    探索PSOC Edge E84 AI Kit:開啟下一代機器學習邊緣設備設計之旅

    Edge E84 AI Kit概述 PSOC Edge E84 AI Kit旨在助力機器學習(ML)和人工智能
    的頭像 發(fā)表于 12-18 14:45 ?696次閱讀

    AI賦能6G與衛(wèi)星通信:開啟智能天網新時代

    連接到6G網絡,AI確保了即使在信號較弱的情況下,也能提供高質量的通信服務。 AI讓\"天網\"智能 隨著技術的不斷進步,AI在6G和衛(wèi)星
    發(fā)表于 10-11 16:01

    【今晚7點半】正點原子 x STM32:智能加速邊緣AI應用開發(fā)!今晚正點原子B站直播間等你

    【聯(lián)合直播】正點原子 x STM32:智能加速邊緣AI應用開發(fā)! 一、直播介紹 隨著人工智能技術在邊緣計算領域的快速發(fā)展,STM32系列芯片憑借其卓越的性能與豐富的生態(tài),成為眾多智能
    發(fā)表于 09-25 14:14

    最新人工智能硬件培訓AI基礎入門學習課程參考2025版(離線AI語音視覺識別篇)

    端側離線 AI 智能硬件作為 AI 技術的重要載體之一,憑借其無需依賴網絡即可實現(xiàn)智能功能的特性,在一些網絡條件受限或對數(shù)據(jù)隱私有較高要求的場景中,發(fā)揮著不可或缺的作用。本章基于CSK
    發(fā)表于 07-04 11:14

    2.0.0版本的ST Edge AI Core在linux平臺上可以把量化后的onnx模型轉換為.nb,但是運行報錯,缺少文件,為什么?

    2.0.0版本的ST Edge AI Core工具在linux平臺上應該是可以把量化后的onnx模型轉換為.nb,但是運行報錯,缺少文件。
    發(fā)表于 06-17 06:29

    AMD第二代Versal AI Edge和Versal Prime系列加速量產 為嵌入式系統(tǒng)實現(xiàn)單芯片智能

    我們推出了 AMD 第二代 Versal AI Edge 系列和第二代 Versal Prime 系列,這兩款產品是對 Versal 產品組合的擴展,可為嵌入式系統(tǒng)實現(xiàn)單芯片智能。
    的頭像 發(fā)表于 06-11 09:59 ?1923次閱讀

    2025研華嵌入式設計論壇上海站:聚焦Edge Computing &amp;amp; Edge AI,共探技術創(chuàng)新與生態(tài)融合

    Computing與Edge AI領域的最新技術進展、創(chuàng)新應用及生態(tài)構建。 ? 一、引領前沿技術,洞見未來趨勢 論壇在研華科技嵌入式物聯(lián)網事業(yè)群(中國)總經理許杰弘先生的致辭中拉開序幕。他以“邊緣智能聚勢未來,生態(tài)鏈接驅動創(chuàng)新
    發(fā)表于 05-30 11:56 ?1219次閱讀
    2025研華嵌入式設計論壇上海站:聚焦<b class='flag-5'>Edge</b> Computing &amp;amp; <b class='flag-5'>Edge</b> <b class='flag-5'>AI</b>,共探技術創(chuàng)新與生態(tài)融合

    首創(chuàng)開源架構,天璣AI開發(fā)套件讓端側AI模型接入得心應手

    正式提出“智能體化用戶體驗”方向,并啟動“天璣智能體化體驗領航計劃”。值得注意的是,其三大AI工具鏈的發(fā)布——天璣開發(fā)工具集、AI開發(fā)套件
    發(fā)表于 04-13 19:52

    面向AI與機器學習應用的開發(fā)平臺 AMD/Xilinx Versal? AI Edge VEK280

    AMD/Xilinx Versal? AI Edge VEK280評估套件是一款面向AI與機器學習應用的開發(fā)平臺,專為邊緣計算場景優(yōu)化設計。以下從核心配置、技術特性、應用場景及開發(fā)支持等方面進行詳細
    的頭像 發(fā)表于 04-11 18:33 ?2586次閱讀
    面向<b class='flag-5'>AI</b>與機器學習應用的開發(fā)平臺 AMD/Xilinx Versal? <b class='flag-5'>AI</b> <b class='flag-5'>Edge</b> VEK280

    在線研討會 | 4/22 Microchip 助力AI智能

    隨著人工智能AI)技術向邊緣計算、實時響應和低功耗場景加速滲透,高性能、高能效的方案成為推動AI創(chuàng)新的核心驅動力。本次研討會聚焦"Microchip如何賦能AI
    的頭像 發(fā)表于 04-08 16:33 ?675次閱讀
    在線研討會 | 4/22 Microchip 助力<b class='flag-5'>AI</b><b class='flag-5'>更</b><b class='flag-5'>智能</b>

    Edge AI+儲能——能源新方向 2025研華儲能合伙伙伴會議圓滿落幕!

    及合作伙伴參與,共同探討儲能技術創(chuàng)新與產業(yè)智能化升級路徑。 ? 聚焦前沿技術,共話產業(yè)未來 會議開場,研華以《 Edge AI創(chuàng)新方案:加速光儲充產業(yè)智能化應用與高效部署 》為題,分享
    發(fā)表于 04-02 11:32 ?406次閱讀
    <b class='flag-5'>Edge</b> <b class='flag-5'>AI</b>+儲能——能源新方向 2025研華儲能合伙伙伴會議圓滿落幕!

    研華科技全棧式Edge AI產品助力工業(yè)智能化升級

    在2025慕尼黑上海電子設備展上,研華展示了其全棧式Edge AI產品,助力工業(yè)智能化升級。通過邊緣計算與AI技術的深度融合,研華賦能智能
    的頭像 發(fā)表于 03-28 17:23 ?1469次閱讀