91欧美超碰AV自拍|国产成年人性爱视频免费看|亚洲 日韩 欧美一厂二区入|人人看人人爽人人操aV|丝袜美腿视频一区二区在线看|人人操人人爽人人爱|婷婷五月天超碰|97色色欧美亚州A√|另类A√无码精品一级av|欧美特级日韩特级

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

為什么Chimera GPNPU如此充滿想象力和令人眼花繚亂呢

SSDFans ? 來源:SSDFans ? 2023-01-08 15:09 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

希臘神話中,Chimera是一種巨大的噴火混血動物,由不同的動物部位組成;現(xiàn)在它被用來描述任何想象力豐富、難以置信或令人眼花繚亂的東西。

筆者最近從Quadric那里接觸到Chimera GPNPU(通用神經(jīng)處理器),真是“產(chǎn)品”如其名。

Quadric公司成立于2017年,最初計劃基于其新創(chuàng)Chimera GPNPU架構(gòu)提供推理邊緣芯片 (針對物聯(lián)網(wǎng)“邊緣”推理應(yīng)用的芯片)。

他們的第一塊芯片被快速驗證,一些早期用戶已經(jīng)在進行試驗。但最近,Quadric公司決定將Chimera GPNPU授權(quán)為IP,向更廣泛的客戶群體展示他們的技術(shù)。

下圖是利用Chimera GPNPU實現(xiàn)面部識別和認證的簡化示意圖,我們就以此作為切入點看下為什么Chimera GPNPU如此“充滿想象力”和“令人眼花繚亂”。

954d2626-8def-11ed-bfe3-dac502259ad0.png

假設(shè)所有這些功能都在智能相機SoC中實現(xiàn),一個攝像機/傳感器為左邊的第一個功能塊提供視頻流。這個應(yīng)用很可能會用于未來幾代的門鈴攝像頭中。

觀察兩個粉紅色的“Face Detect”和“Face Authentication”功能塊,它們是通過人工智能/機器學習(AI/ML)推理實現(xiàn)的。

在過去幾年中,這種類型的推理發(fā)展極為迅速,從學術(shù)研究到早期部署,現(xiàn)在幾乎成為軟件開發(fā)中的一個必不可少的元素。

將推理(基于視覺、聲音等形式)作為創(chuàng)建應(yīng)用程序的構(gòu)建塊之一,這種想法我們可以認為是“軟件2.0”。

但這實現(xiàn)起來并不容易,SoC傳統(tǒng)應(yīng)對軟件2.0挑戰(zhàn)的方式如下(a)所示。

95576e88-8def-11ed-bfe3-dac502259ad0.png

從(a)圖中可以看到,神經(jīng)處理器單元(NPU)、矢量數(shù)字信號處理器(DSP)和實時中央處理器(CPU)為三個獨立的核心。

要實現(xiàn)前面的面部識別和認證流程,使用常規(guī)方法,前兩個功能塊(Resize和Channel unpack)相關(guān)的處理將在DSP核心上執(zhí)行。

然后,DSP生成的數(shù)據(jù)將被送到NPU核心上運行神經(jīng)網(wǎng)絡(luò)“Face Detect”模型;NPU的輸出再送給CPU核心,CPU將運行一個“NMS”算法來決定使用哪個算法效果最好。

然后,DSP將使用CPU識別的邊界框在圖像上執(zhí)行更多的任務(wù),如“Crop + Gray Scale”和“Resize”。最后,這些數(shù)據(jù)將送到NPU核心上運行“Face Authenticate”模型。

用上述方法實現(xiàn)后,我們可能會發(fā)現(xiàn)沒有達到想要的吞吐率。如何找出性能瓶頸在哪里?另外,三個核心之間交換數(shù)據(jù)產(chǎn)生了多少功耗?

真正的潛在問題是,擁有三個獨立的處理器核心會使整個設(shè)計過程變得繁瑣。

例如,硬件設(shè)計人員必須決定要為每個核心分配多少內(nèi)存,以及在功能塊之間需要多大的緩沖區(qū)。同時,軟件開發(fā)人員需要決定如何在內(nèi)核之間劃分算法。這很痛苦,因為程序員不愿意花大量時間考慮所運行目標平臺的硬件細節(jié)。

另一個問題是ML模型正在迅速發(fā)展,誰都不知道未來幾年會有怎樣的ML模型。

所有這些問題都會導致ML部署無法盡可能快地加速,因為針對這種類型的常規(guī)目標平臺進行開發(fā),對于編程、調(diào)試和性能調(diào)優(yōu)等方面來說,都是一件非常痛苦的事情。

再回到Chimera GPNPU,它由前面圖(b)部分的粉色區(qū)域表示。

GPNPU將DSP、CPU和NPU的屬性結(jié)合在單個核心中,作為一個傳統(tǒng)的CPU/DSP的組合,它可以運行C/ C++代碼,具有完整的32位標量+向量指令集架構(gòu)(ISA),同時可以用作一個NN圖處理器,運行8位推理優(yōu)化的ML代碼。這種方法通過在同一個引擎上運行兩種類型的代碼,獨特地解決了信號傳輸?shù)奶魬?zhàn)。

我們可以認為Chimera GPNPU是經(jīng)典的馮·諾依曼RISC機和收縮陣列/2D矩陣架構(gòu)的混合體。

Chimera GPNPU的一個關(guān)鍵優(yōu)勢是它能夠適應(yīng)不斷發(fā)展和日益復雜的ML網(wǎng)絡(luò)?,F(xiàn)在東西變得越來越復雜,需要在NN的體系結(jié)構(gòu)中做更多的條件控制流,可以是CNN, RNN, DNN等等。

傳統(tǒng)的NPU通常是硬連接的加速器,不能條件執(zhí)行。例如有一個專用加速器,用戶不能在第14層的某個地方停下來檢查條件或中間結(jié)果,然后分支判斷并做各種面向控制流的事情。

在這些情況下,必須在NPU和CPU之間來回移動數(shù)據(jù),這將對性能和功耗產(chǎn)生沖擊。而使用一個Chimera GPNPU,我們可以在NN和控制代碼之間在時鐘基礎(chǔ)上來回切換。

這里還有很多需要討論,比如Chimera GPNPU在執(zhí)行卷積層(這是CNN的核心)方面的出色表現(xiàn),以及它們的TOPS(每秒萬億次操作)評分,都令筆者非常興奮。這里不再詳細闡述,有需要的讀者可以咨詢Quadric公司。

最后,筆者想快速概述一下Quadric軟件開發(fā)工具包(SDK),如下所示。

95615308-8def-11ed-bfe3-dac502259ad0.png

歸根結(jié)底,一切都是由軟件驅(qū)動的。使用TensorFlow、PyTorch、Caffe等框架生成的經(jīng)過訓練的神經(jīng)網(wǎng)絡(luò)圖/模型被送入Apache TVM(一個用于CPU、GPU和ML加速器的開源機器學習編譯器框架),生成一個Relay輸出(Relay是TVM框架的高級中間表示)。

中繼表示的轉(zhuǎn)換和優(yōu)化由Chimera CGC執(zhí)行,它將轉(zhuǎn)換和優(yōu)化后的神經(jīng)網(wǎng)絡(luò)輸出為C++代碼。Chimera LLVM C++ Compiler將這些代碼與開發(fā)人員的C++應(yīng)用程序代碼合并,所有這些輸出為一個可執(zhí)行文件,運行在目標硅/SoC中的Chimera GPNPU上。

注意,Quadric SDK是作為預打包的Docker映像交付的,用戶可以下載并在自己的系統(tǒng)上運行。Quadric很快將把這個SDK托管在Amazon Web Services (AWS)上,從而允許用戶通過他們的Web瀏覽器訪問它。

讓筆者特別感興趣的是,Quadric的工作人員正在開發(fā)一個圖形用戶界面(GUI),它可以讓開發(fā)人員拖放包含CPU/DSP代碼和NPU模型的管道構(gòu)建塊,將它們拼接在一起,并將所有內(nèi)容編譯成一個ChimeraGPNPU image。這種無代碼開發(fā)方法將使大量開發(fā)人員能夠創(chuàng)建含有Chimera GPNPU的芯片。






審核編輯:劉清

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學習之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • SoC系統(tǒng)
    +關(guān)注

    關(guān)注

    0

    文章

    52

    瀏覽量

    11194
  • 機器學習
    +關(guān)注

    關(guān)注

    66

    文章

    8556

    瀏覽量

    137000
  • 數(shù)字信號處理器

    關(guān)注

    5

    文章

    519

    瀏覽量

    28431
  • NPU
    NPU
    +關(guān)注

    關(guān)注

    2

    文章

    376

    瀏覽量

    21120

原文標題:結(jié)合CPU、DSP、NPU功能為一體的新型混合處理器——Chimera GPNPU

文章出處:【微信號:SSDFans,微信公眾號:SSDFans】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關(guān)推薦
    熱點推薦

    展會直擊:無人機眼花繚亂,芯片卡位低空經(jīng)濟大爆發(fā)

    展會直擊:無人機眼花繚亂,芯片卡位低空經(jīng)濟大爆發(fā) ? 電子發(fā)燒友網(wǎng)報道(文/黃晶晶)5月23日第9屆世界無人機大會在深圳會展中心隆重開幕。本屆大會展示低空智能制造、無人機、eVTOL、人工智能機器人
    的頭像 發(fā)表于 05-25 02:35 ?8036次閱讀
    展會直擊:無人機<b class='flag-5'>眼花繚亂</b>,芯片卡位低空經(jīng)濟大爆發(fā)

    別再亂買讀寫器了!2026年選購RFID手持機,認準這三個“硬指標”

    芯片選E710 、續(xù)航看11700mAh 、防護認準IP67。本文帶你深度對比基于ImpinjE710芯片UHF超高頻rfid讀寫器的各項一手數(shù)據(jù),教你如何在眼花繚亂的市場中選出性價比之王。
    的頭像 發(fā)表于 03-03 15:19 ?100次閱讀
    別再亂買讀寫器了!2026年選購RFID手持機,認準這三個“硬指標”

    請問在哪里可以找到 VisionFive 2 上的 VPU?

    /building_starfive_debian_image, VPU驅(qū)動程序是要建造的。但是,它不應(yīng)該帶有相應(yīng)的物理硬件嗎? 在這個VisionFive 2 規(guī)范,沒有任何地方提到VPU,但只有一個JH7110 處理器 + 想象力GPU. 誰能在黑板上突出顯示,在哪里VPU單元?
    發(fā)表于 02-11 08:17

    無線充電器原理及制作方法

    在這個快節(jié)奏的時代,無線充電技術(shù)以其便捷性逐漸成為人們生活中的新寵。想象一下,早晨醒來,手機已自動充滿電,無需插拔充電線,這種便捷性令人難以抗拒
    的頭像 發(fā)表于 02-04 08:15 ?543次閱讀
    無線充電器原理及制作方法

    功率放大器如何重塑高校實驗室的想象力邊界

    從地震模擬臺到微納加工平臺,從飛行器風洞實驗到柔性機器人研發(fā),功率放大器——這個電子工程領(lǐng)域的經(jīng)典器件,正成為現(xiàn)代機械學院實驗室里不可或缺的“力量轉(zhuǎn)換中樞”。 從控制信號到物理運動:功率放大器的“機電視角” 現(xiàn)代機械工程早已超越傳統(tǒng)的齒輪與杠桿,進入了機電深度融合的時代。無論是智能裝備的精準驅(qū)動,還是復雜振動環(huán)境的模擬,抑或是新材料力學性能的測試,都需要將微弱的控制信號(毫瓦級)轉(zhuǎn)化為能夠驅(qū)動物理運動
    的頭像 發(fā)表于 02-02 11:58 ?191次閱讀
    功率放大器如何重塑高校實驗室的<b class='flag-5'>想象力</b>邊界

    UPS電源怎么選?5大核心指標,教您一眼看穿性能優(yōu)劣!

    關(guān)鍵業(yè)務(wù)連續(xù)性的“生命線”。然而,市場上UPS品牌型號繁多,參數(shù)令人眼花繚亂。如何穿透營銷話術(shù),準確判斷一臺UPS電源的性能優(yōu)劣?作為專業(yè)的電源解決方案提供商,優(yōu)比
    的頭像 發(fā)表于 01-13 09:56 ?244次閱讀
    UPS電源怎么選?5大核心指標,教您一眼看穿性能優(yōu)劣!

    廣州郵科逆變電源:解決工程人最頭疼的5大用電難題

    在工地摸爬滾打的工程師們都懂,電源設(shè)備選不好,輕則設(shè)備罷工,重則全線停工。面對市場上眼花繚亂的產(chǎn)品,廣州郵科逆變電源到底有什么獨到之處,能解決哪些實際痛點?今天咱們就聊聊這個實在話題。
    的頭像 發(fā)表于 01-06 09:56 ?157次閱讀
    廣州郵科逆變電源:解決工程人最頭疼的5大用電難題

    選可調(diào)電源別再盲從!品牌推薦依據(jù)有哪些?廣州郵科符合標準嗎?

    搞研發(fā)、做維修、玩電子的朋友,是不是經(jīng)常為選一臺靠譜的可調(diào)電源頭疼?市面上品牌這么多,參數(shù)看得眼花繚亂,到底可調(diào)電源品牌推薦依據(jù)有哪些?今天咱就拋開廣告,聊聊那些老師傅們真正看重的選擇標準。
    的頭像 發(fā)表于 12-30 09:45 ?211次閱讀
    選可調(diào)電源別再盲從!品牌推薦依據(jù)有哪些?廣州郵科符合標準嗎?

    積木+3D堆疊!GPNPU架構(gòu)創(chuàng)新,應(yīng)對AI推理需求

    落地的關(guān)鍵瓶頸。在此背景下,云天勵飛推出其第五代芯片架構(gòu)——GPNPU(General-Purpose Neural Processing Unit,通用神經(jīng)網(wǎng)絡(luò)處理單元),以一場底層架構(gòu)的革命,試圖重塑AI算格局,推動大模型推理走向極致性價比時代。 ?
    的頭像 發(fā)表于 12-11 08:57 ?7852次閱讀

    湘軍,讓算變成生產(chǎn)?

    腦極體
    發(fā)布于 :2025年11月25日 22:56:58

    廣州唯創(chuàng)電子WT588F(C013)語音芯片:賦能智能玩具的“聲”動未來

    開啟充滿想象力的聲音世界。一、核心優(yōu)勢:強大功能,奠定互動基石WT588F(C013)芯片專為智能玩具的語音需求深度優(yōu)化,集多項核心功能于一身:高保真語音播放:支持
    的頭像 發(fā)表于 08-08 08:09 ?728次閱讀
    廣州唯創(chuàng)電子WT588F(C013)語音芯片:賦能智能玩具的“聲”動未來

    Samtec技術(shù)漫談 | 開放式Pin針區(qū)域的多功能應(yīng)用邏輯

    摘要前言 世界上有著各種各樣的連接器,其中的大多數(shù),很多人可能從未見過。它們存在于手機、電腦、洗衣機和汽車等設(shè)備中。 這些連接器的功能和設(shè)計種類多得令人眼花繚亂。這讓工程師感到困惑,也讓那些負責購買
    的頭像 發(fā)表于 07-23 17:36 ?1978次閱讀
    Samtec技術(shù)漫談 | 開放式Pin針區(qū)域的多功能應(yīng)用邏輯

    Momenta MNP記憶領(lǐng)航輔助駕駛系統(tǒng)輕松應(yīng)對城市復雜路況

    城市通勤是無數(shù)司機每天的“必修課”。路口眼花繚亂的紅綠燈、隨處可見的臨時停車、突然闖入視野的行人或車輛,以及夜晚有限的視線和各種意外狀況……這些日常駕駛中的瑣碎現(xiàn)象,總在不經(jīng)意間消耗著駕駛者的精力。
    的頭像 發(fā)表于 07-07 16:33 ?4232次閱讀

    人工智能重塑電子產(chǎn)業(yè)鏈未來

    AI大模型下半場,應(yīng)用端的想象力爆炸,有望真正改變一個時代的用戶行為的“殺手級應(yīng)用”初現(xiàn)江湖。
    的頭像 發(fā)表于 06-23 11:37 ?1126次閱讀

    支持智能家居設(shè)備的常見無線通信技術(shù)

    市面上已經(jīng)出現(xiàn)許多智能家居設(shè)備,隨著其價格越來越親民,產(chǎn)品的接受度也越來越高。但是,支持設(shè)備之間通信和設(shè)備與智能手機通信的各種無線技術(shù)則令人眼花繚亂。此類技術(shù)采用的協(xié)議或標準形式,均各具特色
    的頭像 發(fā)表于 04-18 11:18 ?2146次閱讀
    支持智能家居設(shè)備的常見無線通信技術(shù)