91欧美超碰AV自拍|国产成年人性爱视频免费看|亚洲 日韩 欧美一厂二区入|人人看人人爽人人操aV|丝袜美腿视频一区二区在线看|人人操人人爽人人爱|婷婷五月天超碰|97色色欧美亚州A√|另类A√无码精品一级av|欧美特级日韩特级

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

開發(fā)嵌入式神經網絡的現(xiàn)實

石飛鵬 ? 來源:CZM陳先生123 ? 作者:CZM陳先生123 ? 2022-07-15 16:50 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

關于將人工智能用于越來越智能的車輛的文章已經很多。但是,您如何將在服務器場上開發(fā)的神經網絡 (NN) 壓縮到量產汽車中資源受限的嵌入式硬件中呢?本文探討了我們應該如何授權汽車生產 AI 研發(fā)工程師在將 NN 從原型到生產的整個過程中改進 NN,而不是像今天過早地將 NN 移交給嵌入式軟件團隊的過程。

“如果我們要充分利用嵌入式硬件資源,我們需要讓生產 AI 團隊在軟件移植過程中利用他們對 NN 的知識”(來源:Marton Feher,SVP 硬件工程,AImotive)

嵌入式人工智能:嵌入式軟件——但不是我們所知道的

對于任何注定要在批量生產中部署的嵌入式軟件,一旦完成并驗證了其核心功能的實現(xiàn),就會在代碼中投入大量精力。這個優(yōu)化階段是關于最小化所需的內存、CPU 和其他資源,以便盡可能多地保留軟件功能,同時將執(zhí)行它所需的資源減少到絕對最低限度。

這種從基于實驗室的算法創(chuàng)建嵌入式軟件的過程使生產工程師能夠將軟件功能成本工程化為可量產的形式,與用于開發(fā)它的海量計算數據中心相比,所需的芯片和硬件更便宜、功能更差。但是,它通常需要從一開始就凍結功能,只進行代碼修改以改進算法本身的執(zhí)行方式。對于大多數軟件來說,這很好:確實,它可以使用嚴格的驗證方法來確保嵌入過程保留所需的所有功能。

然而,當嵌入基于 NN 的 AI 算法時,這可能是一個主要問題。為什么?因為從一開始就凍結功能,您正在刪除可以優(yōu)化執(zhí)行的主要方法之一。

問題是什么?

有兩種根本不同的方法可以解決將復雜的 NN 從實驗室中不受約束、資源豐富的 NN 訓練環(huán)境移植到受嚴格約束的嵌入式硬件平臺的任務:

優(yōu)化執(zhí)行NN的代碼

優(yōu)化神經網絡本身

當嵌入式軟件工程師發(fā)現(xiàn)性能問題,例如內存帶寬瓶頸或底層嵌入式硬件平臺利用率低下時,傳統(tǒng)的嵌入式軟件技術會鼓勵您深入挖掘底層代碼并找出問題所在。

這反映在當今可用于嵌入式MCUDSP的許多先進而復雜的工具中。它們使您能夠了解軟件中正在發(fā)生的事情的最低水平,并識別和改進軟件本身的執(zhí)行——希望不會改變其功能。

對于神經網絡來說,優(yōu)化與傳統(tǒng)的嵌入式軟件完全不同——至少如果你想用可用的硬件資源實現(xiàn)盡可能最佳的結果。對于神經網絡,通過改變拓撲神經網絡本身(神經網絡的各個層如何連接,以及每個層做什么)和使用更新的約束和輸入重新訓練來實現(xiàn)改進。這是因為功能不是由神經網絡“軟件”定義的,而是在訓練期間應用的目標和約束,以創(chuàng)建定義神經網絡最終行為的權重。

因此,在執(zhí)行神經網絡的嵌入過程時,需要凍結神經網絡的目標性能,而不是如何實現(xiàn)它。如果您從嵌入過程開始就約束神經網絡拓撲,那么您就是在刪除生產工程師需要的提高性能的工具。

這意味著您需要新的不同工具來完成將NNs從實驗室移植到嵌入式平臺的任務。低級軟件工程師無法完成這項工作——你需要人工智能工程師根據工具提供的性能信息來調整神經網絡及其訓練。這是新的:當研發(fā)工程師將經過培訓的神經網絡交給生產工程師時,他們再也不能說“工作完成了”!

不同的方法

通過采用將 AI 研發(fā)工程師置于嵌入式軟件移植任務中心的開發(fā)工作流程,任何芯片都可以實現(xiàn)卓越的結果。使用以層為中心的分析,輔以從編譯改進的卷積神經網絡 (CNN) 到查看目標神經處理器單元 (NPU) 的準確性能結果的幾分鐘內快速周轉,開發(fā)人員可以使用相同的底層硬件實現(xiàn) 100% 或更多的增益. 這是因為修改 CNN 本身,而不是只修改用于執(zhí)行相同 CNN 的代碼,為 AI 工程師提供了更大的靈活性來識別和實施性能改進。

在開發(fā)我們的 aiWare NPU 時,AImotive 使用了我們自己的 AI 工程師將移植過程移植到具有廣泛 NPU 功能的多個不同芯片的經驗。我們希望找到更好的方法來幫助我們自己的 AI 工程師完成這項任務,因此在開發(fā)我們對 aiWare NPU 本身和支持它的 aiWare Studio 工具的要求時,我們確定了我們在過去的:

高度確定性的 NPU 架構,使時序非??深A測

準確的基于層(不是基于時序或低級代碼)的性能估計,以便任何 AI 研發(fā)工程師都可以看到更改其訓練標準(例如添加或更改使用的場景,或修改目標 KPI)的影響; / 或 NN 拓撲快速

準確的離線性能估計,以便在第一個硬件可用之前執(zhí)行所有 NN 優(yōu)化(因為第一個原型總是稀缺的?。?/p>

點擊查看完整大小的圖片

poYBAGG3EIKAVGprABB3v6LafIM851.png


圖 1:aiWare Studio 使用戶能夠優(yōu)化他們的 NN,而不是用于執(zhí)行它們的代碼。這為 AI 設計人員提供了更大的靈活性,可以更快地實現(xiàn)出色的結果。(來源:AImotive)

結果是一組工具使 AI 研發(fā)工程師能夠在實驗室環(huán)境中對目標硬件進行幾乎所有優(yōu)化,并在最終目標硬件的 5% 范圍內展示性能——這一切都在任何人看到硬件之前完成。

最終檢查

當然,在芯片和硬件原型可用時測量最終硬件至關重要。這種開發(fā)環(huán)境中實時硬件分析功能的可用性使工程師能夠訪問由此類工具支持的 NPU 內的一系列深度嵌入式硬件寄存器和計數器。雖然芯片開銷很小(因為許多 NPU 主要由內存而非邏輯控制),但這些功能可以在執(zhí)行期間實現(xiàn)前所未有的、非侵入式的實時性能測量。然后可以將其用于直接與離線性能估計器結果進行比較,以確認準確性。

點擊查看完整大小的圖片

poYBAGG3EIWAUiOjABWWAeWEhuU271.png


圖 2:使用嵌入式寄存器和計數器,aiWare Studio 可以準確測量最終芯片性能,與離線估計結果相比,通常在 1%-5% 以內。(來源:AImotive 和 Nextchip Co. Ltd)

結論

這種新方法為汽車行業(yè)提供了一種新的、更好的方式來開發(fā)、優(yōu)化和在生產車輛中部署人工智能。使用協(xié)同 NPU 硬件和工具,人工智能工程師可以為汽車應用設計、實施和優(yōu)化更好的 CNN。

審核編輯 黃昊宇

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • 嵌入式
    +關注

    關注

    5200

    文章

    20470

    瀏覽量

    334417
  • 神經網絡
    +關注

    關注

    42

    文章

    4838

    瀏覽量

    107869
  • AI
    AI
    +關注

    關注

    91

    文章

    39911

    瀏覽量

    301545
收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關推薦
    熱點推薦

    面向嵌入式部署的神經網絡優(yōu)化:模型壓縮深度解析

    1.為什么需要神經網絡模型壓縮? 神經網絡已經成為解決復雜機器學習問題的強大工具。然而,這種能力往往伴隨著模型規(guī)模和計算復雜度的增加。當輸入維度較大(例如長時序窗口、高分辨率特征空間)時,模型需要
    的頭像 發(fā)表于 02-24 15:37 ?5083次閱讀
    面向<b class='flag-5'>嵌入式</b>部署的<b class='flag-5'>神經網絡</b>優(yōu)化:模型壓縮深度解析

    什么是嵌入式應用開發(fā)

    概述 所謂的嵌入式應用開發(fā)就是在嵌入式操作系統(tǒng)下進行開發(fā)、軟硬件綜合開發(fā) ?嵌入式應用
    發(fā)表于 01-12 16:13

    神經網絡的初步認識

    日常生活中的智能應用都離不開深度學習,而深度學習則依賴于神經網絡的實現(xiàn)。什么是神經網絡?神經網絡的核心思想是模仿生物神經系統(tǒng)的結構,特別是大腦中神經
    的頭像 發(fā)表于 12-17 15:05 ?339次閱讀
    <b class='flag-5'>神經網絡</b>的初步認識

    嵌入式開發(fā)的關鍵點介紹

    設備和移動設備。因此,嵌入式開發(fā)需要考慮系統(tǒng)的功耗,并編寫節(jié)能的代碼以延長系統(tǒng)的使用壽命。 4. 軟件集成: 嵌入式系統(tǒng)通常需要與其他設備和系統(tǒng)進行集成,例如傳感器、網絡和云服務。因此,嵌入式
    發(fā)表于 11-13 08:12

    NMSIS神經網絡庫使用介紹

    NMSIS NN 軟件庫是一組高效的神經網絡內核,旨在最大限度地提高 Nuclei N 處理器內核上的神經網絡的性能并最??大限度地減少其內存占用。 該庫分為多個功能,每個功能涵蓋特定類別
    發(fā)表于 10-29 06:08

    在Ubuntu20.04系統(tǒng)中訓練神經網絡模型的一些經驗

    本帖欲分享在Ubuntu20.04系統(tǒng)中訓練神經網絡模型的一些經驗。我們采用jupyter notebook作為開發(fā)IDE,以TensorFlow2為訓練框架,目標是訓練一個手寫數字識別的神經網絡
    發(fā)表于 10-22 07:03

    液態(tài)神經網絡(LNN):時間連續(xù)性與動態(tài)適應性的神經網絡

    1.算法簡介液態(tài)神經網絡(LiquidNeuralNetworks,LNN)是一種新型的神經網絡架構,其設計理念借鑒自生物神經系統(tǒng),特別是秀麗隱桿線蟲的神經結構,盡管這種微生物的
    的頭像 發(fā)表于 09-28 10:03 ?1254次閱讀
    液態(tài)<b class='flag-5'>神經網絡</b>(LNN):時間連續(xù)性與動態(tài)適應性的<b class='flag-5'>神經網絡</b>

    神經網絡的并行計算與加速技術

    隨著人工智能技術的飛速發(fā)展,神經網絡在眾多領域展現(xiàn)出了巨大的潛力和廣泛的應用前景。然而,神經網絡模型的復雜度和規(guī)模也在不斷增加,這使得傳統(tǒng)的串行計算方式面臨著巨大的挑戰(zhàn),如計算速度慢、訓練時間長等
    的頭像 發(fā)表于 09-17 13:31 ?1145次閱讀
    <b class='flag-5'>神經網絡</b>的并行計算與加速技術

    無刷電機小波神經網絡轉子位置檢測方法的研究

    摘要:論文通過對無刷電機數學模型的推導,得出轉角:與三相相電壓之間存在映射關系,因此構建了一個以三相相電壓為輸人,轉角為輸出的小波神經網絡來實現(xiàn)轉角預測,并采用改進遺傳算法來訓練網絡結構與參數,借助
    發(fā)表于 06-25 13:06

    神經網絡專家系統(tǒng)在電機故障診斷中的應用

    摘要:針對傳統(tǒng)專家系統(tǒng)不能進行自學習、自適應的問題,本文提出了基于種經網絡專家系統(tǒng)的并步電機故障診斷方法。本文將小波神經網絡和專家系統(tǒng)相結合,充分發(fā)揮了二者故障診斷的優(yōu)點,很大程度上降低了對電機
    發(fā)表于 06-16 22:09

    神經網絡RAS在異步電機轉速估計中的仿真研究

    眾多方法中,由于其結構簡單,穩(wěn)定性好廣泛受到人們的重視,且已被用于產品開發(fā)。但是MRAS仍存在在低速區(qū)速度估計精度下降和對電動機參數變化非常敏感的問題。本文利用神經網絡的特點,使估計更為簡單、快速
    發(fā)表于 06-16 21:54

    基于FPGA搭建神經網絡的步驟解析

    本文的目的是在一個神經網絡已經通過python或者MATLAB訓練好的神經網絡模型,將訓練好的模型的權重和偏置文件以TXT文件格式導出,然后通過python程序將txt文件轉化為coe文件,(coe
    的頭像 發(fā)表于 06-03 15:51 ?1245次閱讀
    基于FPGA搭建<b class='flag-5'>神經網絡</b>的步驟解析

    嵌入式開發(fā)入門指南:從零開始學習嵌入式

    隨著物聯(lián)網、智能硬件的發(fā)展,嵌入式開發(fā)成為熱門技能之一。以下將為初學者提供一份詳細的嵌入式開發(fā)入門指南,涵蓋學習路徑、必備工具、推薦資源等內容。 1. 嵌入式系統(tǒng)的定義與應用嵌入式系統(tǒng)
    發(fā)表于 05-15 09:29

    ETAS全新的嵌入式AI解決方案

    “將訓練后的AI神經網絡模型,自動化生成安全且高效的C代碼,用于嵌入式系統(tǒng)” ,近日ETAS攜全新的智能化工具Embedded AI Coder亮相2025上海國際車展。
    的頭像 發(fā)表于 05-07 11:43 ?2077次閱讀
    ETAS全新的<b class='flag-5'>嵌入式</b>AI解決方案

    NVIDIA實現(xiàn)神經網絡渲染技術的突破性增強功能

    近日,NVIDIA 宣布了 NVIDIA RTX 神經網絡渲染技術的突破性增強功能。NVIDIA 與微軟合作,將在 4 月的 Microsoft DirectX 預覽版中增加神經網絡著色技術,讓開發(fā)
    的頭像 發(fā)表于 04-07 11:33 ?1206次閱讀