91欧美超碰AV自拍|国产成年人性爱视频免费看|亚洲 日韩 欧美一厂二区入|人人看人人爽人人操aV|丝袜美腿视频一区二区在线看|人人操人人爽人人爱|婷婷五月天超碰|97色色欧美亚州A√|另类A√无码精品一级av|欧美特级日韩特级

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫(xiě)文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

AI編譯器如何在傳統(tǒng)開(kāi)源框架中的工作中受益

星星科技指導(dǎo)員 ? 來(lái)源:嵌入式計(jì)算設(shè)計(jì) ? 作者:Brandon Lewis ? 2022-06-02 11:51 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

TensorFlow/TensorFlow Lite 相比,Glow 編譯的輸入表現(xiàn)出 3 倍幀/秒的性能提升,而該圖顯示了 AOT 編譯與 JIT 編譯器相比的效率。

創(chuàng)造智能需要大量數(shù)據(jù)。所有這些數(shù)據(jù)都需要能夠支持它的技術(shù)。

人工智能AI) 而言,這些技術(shù)包括大量直接訪問(wèn)的高速內(nèi)存;能夠同時(shí)處理同一數(shù)據(jù)集的不同部分的并行計(jì)算架構(gòu);并且有點(diǎn)令人驚訝的是,與許多其他應(yīng)用程序相比,計(jì)算精度更低。數(shù)據(jù)中心可以提供幾乎無(wú)窮無(wú)盡的這種技術(shù)組合。

因此,人工智能開(kāi)發(fā)工具是為互聯(lián)網(wǎng)查詢、語(yǔ)音搜索和在線面部識(shí)別等應(yīng)用程序背后的數(shù)據(jù)中心基礎(chǔ)設(shè)施而設(shè)計(jì)的。但隨著人工智能技術(shù)的進(jìn)步,在各種用例中利用它的愿望也在增加——包括那些在小型、資源受限、基于 MCU 的邊緣平臺(tái)上運(yùn)行的用例。因此,例如,編譯器等工具還必須能夠針對(duì)占用空間更小的設(shè)備優(yōu)化 AI 數(shù)據(jù)和算法,而不是僅僅關(guān)注運(yùn)行基于云的推薦系統(tǒng)的高端硬件加速器。

Facebook 的開(kāi)源機(jī)器學(xué)習(xí)編譯器 Glow 就是這種工具演變的一個(gè)例子。它使用兩階段中間表示 (IR) “降低”神經(jīng)網(wǎng)絡(luò)圖,該中間表示生成針對(duì)各種嵌入式和服務(wù)器級(jí)硬件目標(biāo)的特性和內(nèi)存進(jìn)行專門(mén)調(diào)整的機(jī)器代碼(圖 1)。它還執(zhí)行提前 (AOT) 編譯,最大限度地減少運(yùn)行時(shí)開(kāi)銷(xiāo),以節(jié)省磁盤(pán)空間、內(nèi)存、啟動(dòng)時(shí)間等。

pYYBAGKYNaKADG4lAAEW_YkElmY357.png

圖 1. Glow 高級(jí)中間表示中的降低計(jì)算圖表示 A 的回歸,該回歸由 Glow 自動(dòng)區(qū)分。

“我們擁有這個(gè)非常高性能的運(yùn)行時(shí),但很多項(xiàng)目并不關(guān)心,因?yàn)樗鼈儾辉跀?shù)據(jù)中心內(nèi),”Facebook 的研究科學(xué)家 Jordan Fix 解釋道?!八麄冃枰?AOT 編譯,盡可能地縮小,使用量化和并行化,并且沒(méi)有太多的依賴關(guān)系。

“AOT 編譯在數(shù)據(jù)中心并不那么重要,但我們可以將 LLVM 后端連接到 Glow 并針對(duì) x86、Arm、RISC-V 和專用架構(gòu),”Fix 繼續(xù)說(shuō)道?!癎low 的工作方式是你有幾個(gè)級(jí)別的 IR,它們使用高級(jí)優(yōu)化和量化來(lái)限制內(nèi)存。那時(shí),編譯器后端可以接受基于指令的 IR,并根據(jù)需要對(duì)其進(jìn)行優(yōu)化和編譯?!?/p>

Glow 的另一大優(yōu)勢(shì),特別是在多樣化的嵌入式技術(shù)領(lǐng)域,是能夠在簡(jiǎn)單的 C 包裝器中編譯模型。這意味著嵌入式 AI 工程師可以針對(duì)他們選擇的編譯器后端和架構(gòu)優(yōu)化 Glow。它本機(jī)支持來(lái)自流行 AI 框架和庫(kù)(如 PyTorch 和 Arm 的 CMSIS-NN)的輸入,還可以通過(guò) ONNX 神經(jīng)網(wǎng)絡(luò)交換接受來(lái)自 TensorFlow 等環(huán)境的圖形。

AI 編譯器的競(jìng)爭(zhēng)

當(dāng)然,Glow 并不是唯一可用的神經(jīng)網(wǎng)絡(luò)編譯器。Google 的多級(jí)中間表示 (MLIR) 是一種編譯器基礎(chǔ)架構(gòu),專注于張量處理器,已被 LLVM 吸收。Microsoft 的嵌入式學(xué)習(xí)庫(kù) (ELL) 是另一個(gè)用于資源受限的 AI 設(shè)備的交叉編譯工具鏈。

然而,Glow 比任何一個(gè)都更成熟,已于 2018 年開(kāi)源。它也比許多現(xiàn)有的 AI 編譯器選項(xiàng)更高效。

在發(fā)布的 i.MX 跨界 MCU 的性能測(cè)試中,NXP 系統(tǒng)工程師使用 TensorFlow Lite 和 Glow 編譯了 32 x 32 CIFAR-10 數(shù)據(jù)集,并將它們輸入 RT1060、RT1170 和 RT685 設(shè)備。Glow 編譯的輸入表現(xiàn)出至少 3 倍幀/秒的性能提升,而圖 2 讓您了解 AOT 編譯與 TensorFlow/TensorFlow Lite 框架中使用的即時(shí) (JIT) 編譯相比的效率如何。

poYBAGKYNayAWAp9AAB212uxoCo615.png

pYYBAGKYNbKAU1lmAAClOgEERas827.png

圖 2a 和 2b。與 TensorFlow Lite 等即時(shí) (JIT) 編譯器相比,Glow 的提前 (AOT) 編譯器可節(jié)省大量 RAM 和閃存,同時(shí)還具有顯著的每秒幀數(shù)性能優(yōu)勢(shì)。

請(qǐng)記住,i.MX1060 具有高達(dá) 1 MB 的片上 RAM。NXP 的 eIQ 軟件開(kāi)發(fā)環(huán)境支持 Glow。

開(kāi)源人工智能:看不到終點(diǎn)線

人工智能技術(shù)市場(chǎng)瞬息萬(wàn)變,這使得開(kāi)發(fā)組織很難致力于任何技術(shù)。這可能是 Glow 最引人注目的方面之一,它甚至與技術(shù)沒(méi)有直接關(guān)系。

作為一個(gè)擁有 130 多個(gè)活躍貢獻(xiàn)者的開(kāi)源項(xiàng)目,F(xiàn)acebook、英特爾等大型組織繼續(xù)對(duì) Glow 主線做出承諾,因?yàn)樗鼈儸F(xiàn)在依賴于其通用基礎(chǔ)設(shè)施來(lái)訪問(wèn)指令、操作符、內(nèi)核等。

然后,很明顯,開(kāi)源具有內(nèi)在價(jià)值。

“我們經(jīng)常看到我們關(guān)心的外部用戶的貢獻(xiàn),比如更通用的并行化框架,我們有很多他們正在運(yùn)行的機(jī)器學(xué)習(xí)模型,”Fix 說(shuō)?!八砸苍S它可以讓他們?cè)谖覀儫o(wú)需做任何事情的情況下獲得對(duì)運(yùn)營(yíng)商的支持?!拔艺J(rèn)為您正在研究這個(gè)特定的計(jì)算機(jī)視覺(jué)模型”或者,“我認(rèn)為這是您所說(shuō)的操作員?!?他們只是審查它并移植它并登陸它。

“我們都可以從彼此在傳統(tǒng)開(kāi)源框架中的工作中受益,”他補(bǔ)充道。

審核編輯:郭婷

聲明:本文內(nèi)容及配圖由入駐作者撰寫(xiě)或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問(wèn)題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • NXP
    NXP
    +關(guān)注

    關(guān)注

    61

    文章

    1399

    瀏覽量

    198079
  • 人工智能
    +關(guān)注

    關(guān)注

    1819

    文章

    50139

    瀏覽量

    265800
  • 編譯器
    +關(guān)注

    關(guān)注

    1

    文章

    1672

    瀏覽量

    51726
收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評(píng)論

    相關(guān)推薦
    熱點(diǎn)推薦

    單片機(jī)開(kāi)發(fā)功能安全編譯器

    期間顯示的防御代碼。僅僅因?yàn)樵趩卧獪y(cè)試期間已經(jīng)實(shí)現(xiàn)了防御性代碼的覆蓋范圍,因此并不能保證其已存在于完整的系統(tǒng)。 在功能安全這個(gè)陌生的領(lǐng)域,編譯器可能超出了其要素。這就是為什么目標(biāo)代碼驗(yàn)證(OCV
    發(fā)表于 12-01 06:44

    開(kāi)源鴻蒙技術(shù)大會(huì)2025丨編譯器與編程語(yǔ)言分論壇:語(yǔ)言驅(qū)動(dòng)系統(tǒng)創(chuàng)新,編譯賦能生態(tài)繁榮

    在萬(wàn)物智聯(lián)的時(shí)代背景下,操作系統(tǒng)底層能力的構(gòu)建離不開(kāi)編程語(yǔ)言與編譯器的關(guān)鍵支撐。作為開(kāi)源鴻蒙生態(tài)的核心技術(shù),語(yǔ)言設(shè)計(jì)與編譯器、虛擬機(jī)實(shí)現(xiàn)的進(jìn)步直接關(guān)系到開(kāi)發(fā)效率、運(yùn)行性能與系統(tǒng)安全。本次分論壇聚焦
    的頭像 發(fā)表于 11-20 17:24 ?969次閱讀
    <b class='flag-5'>開(kāi)源</b>鴻蒙技術(shù)大會(huì)2025丨<b class='flag-5'>編譯器</b>與編程語(yǔ)言分論壇:語(yǔ)言驅(qū)動(dòng)系統(tǒng)創(chuàng)新,<b class='flag-5'>編譯</b>賦能生態(tài)繁榮

    取之于開(kāi)源,貢獻(xiàn)于開(kāi)源:進(jìn)迭時(shí)空AI計(jì)算生態(tài)開(kāi)源貢獻(xiàn)

    開(kāi)放創(chuàng)新是進(jìn)迭時(shí)空的企業(yè)價(jià)值觀之一,公司的軟硬件技術(shù)棧構(gòu)建在開(kāi)源之上,同時(shí)也積極在操作系統(tǒng)、編譯器、AI計(jì)算生態(tài)等領(lǐng)域?yàn)?b class='flag-5'>開(kāi)源做貢獻(xiàn)。opencvopencv是最具影響力的機(jī)器視覺(jué)
    的頭像 發(fā)表于 10-21 09:03 ?5845次閱讀
    取之于<b class='flag-5'>開(kāi)源</b>,貢獻(xiàn)于<b class='flag-5'>開(kāi)源</b>:進(jìn)迭時(shí)空<b class='flag-5'>AI</b>計(jì)算生態(tài)<b class='flag-5'>開(kāi)源</b>貢獻(xiàn)

    GCC編譯器,怎么才能實(shí)現(xiàn)c文件未被調(diào)用的函數(shù),不會(huì)被編譯呢?

    GCC編譯器,怎么才能實(shí)現(xiàn)c文件未被調(diào)用的函數(shù),不會(huì)被編譯?有什么編譯選項(xiàng)可以設(shè)置嗎? 移植代碼,有些函數(shù)沒(méi)被調(diào)用的函數(shù)想留在代碼里,但不想被編譯
    發(fā)表于 09-28 12:25

    開(kāi)源鴻蒙MNN AI應(yīng)用開(kāi)發(fā)與MNN移植經(jīng)驗(yàn)

    本期內(nèi)容由AI Model SIG提供,介紹了在開(kāi)源鴻蒙,利用MNN開(kāi)源框架開(kāi)發(fā)AI應(yīng)用以及基
    的頭像 發(fā)表于 09-04 11:31 ?4650次閱讀
    <b class='flag-5'>開(kāi)源</b>鴻蒙MNN <b class='flag-5'>AI</b>應(yīng)用開(kāi)發(fā)與MNN移植經(jīng)驗(yàn)

    請(qǐng)問(wèn)如何在keil μVision 5上進(jìn)行ARM編譯器的代碼優(yōu)化?

    何在keil μVision 5上進(jìn)行ARM編譯器的代碼優(yōu)化?
    發(fā)表于 08-20 07:37

    何在Keil中將NuMicro BSP從Arm編譯器5遷移到編譯器6?

    在Keil中將NuMicro BSP從Arm編譯器5遷移到編譯器6!
    發(fā)表于 08-20 06:29

    何在裸機(jī)環(huán)境運(yùn)行KleidiAI微內(nèi)核

    探索如何在裸機(jī)環(huán)境運(yùn)行 KleidiAI 內(nèi)核,并通過(guò)測(cè)試多款 C/C++ 編譯器,以確定如何能更高效地生成代碼。
    的頭像 發(fā)表于 08-08 15:16 ?3865次閱讀
    如<b class='flag-5'>何在</b>裸機(jī)環(huán)境<b class='flag-5'>中</b>運(yùn)行KleidiAI微內(nèi)核

    求助,關(guān)于NanoEdge AI Studio生成的庫(kù)交叉編譯器版本疑問(wèn)求解

    我使用的是NanoEdge AI Studio v4.3.1,跟著官方交教程生成了庫(kù)libneai.a,我通過(guò)metadata.json文件得知生成這個(gè)庫(kù)的交叉編譯器版本是\"
    發(fā)表于 08-08 07:25

    進(jìn)迭時(shí)空同構(gòu)融合RISC-V AI CPU的Triton算子編譯器實(shí)踐

    Triton是由OpenAI開(kāi)發(fā)的一個(gè)開(kāi)源編程語(yǔ)言和編譯器,旨在簡(jiǎn)化高性能GPU內(nèi)核的編寫(xiě)。它提供了類似Python的語(yǔ)法,并通過(guò)高級(jí)抽象降低了GPU編程的復(fù)雜性,同時(shí)保持了高性能。目前
    的頭像 發(fā)表于 07-15 09:04 ?1976次閱讀
    進(jìn)迭時(shí)空同構(gòu)融合RISC-V <b class='flag-5'>AI</b> CPU的Triton算子<b class='flag-5'>編譯器</b>實(shí)踐

    邊緣設(shè)備AI部署:編譯器如何實(shí)現(xiàn)輕量化與高性能?

    、ASIC等)上高效執(zhí)行的機(jī)器代碼。AI編譯器AI模型的部署和優(yōu)化扮演著關(guān)鍵角色,能夠顯著提升模型的運(yùn)行效率和性能。 ? AI
    的頭像 發(fā)表于 07-06 05:49 ?6727次閱讀

    編譯器功能安全驗(yàn)證的關(guān)鍵要素

    在汽車(chē)、工業(yè)、醫(yī)療等安全關(guān)鍵型應(yīng)用,確保功能安全合規(guī)性需要嚴(yán)格的工具鏈驗(yàn)證。開(kāi)發(fā)安全關(guān)鍵型軟件的企業(yè)必須遵守ISO 26262、IEC 61508、ISO 62304等國(guó)際標(biāo)準(zhǔn)對(duì)編譯器工具鏈進(jìn)行全面的驗(yàn)證。
    的頭像 發(fā)表于 07-05 13:37 ?1599次閱讀

    RISC-V架構(gòu)下的編譯器自動(dòng)向量化

    進(jìn)迭時(shí)空專注于研發(fā)基于RISC-V的高性能新AICPU,對(duì)于充分發(fā)揮CPU核的性能而言,編譯器是不可或缺的一環(huán),而在AI時(shí)代,毫無(wú)疑問(wèn)向量算力將發(fā)揮越來(lái)越重要的作用。進(jìn)迭時(shí)空非常重視RISC-V
    的頭像 發(fā)表于 06-06 16:59 ?1279次閱讀
    RISC-V架構(gòu)下的<b class='flag-5'>編譯器</b>自動(dòng)向量化

    滾珠絲桿在工作中損耗會(huì)影響什么?

    滾珠絲桿在工作中的損耗會(huì)對(duì)設(shè)備的性能、精度、壽命和運(yùn)行穩(wěn)定性產(chǎn)生多方面的影響。
    的頭像 發(fā)表于 05-10 17:54 ?554次閱讀
    滾珠絲桿在<b class='flag-5'>工作中</b>損耗會(huì)影響什么?

    RVCT編譯器是否比GNU的編譯器的代碼執(zhí)行速度更快?

    使用FX3S遇到了RVCT編譯器的問(wèn)題。 1、在SDK的release note中有支持RVCT的描述, 但是在EZ USB Suite的設(shè)置沒(méi)有找到RVCT的選項(xiàng), 請(qǐng)問(wèn)支持的具體版本
    發(fā)表于 05-08 07:49