91欧美超碰AV自拍|国产成年人性爱视频免费看|亚洲 日韩 欧美一厂二区入|人人看人人爽人人操aV|丝袜美腿视频一区二区在线看|人人操人人爽人人爱|婷婷五月天超碰|97色色欧美亚州A√|另类A√无码精品一级av|欧美特级日韩特级

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內(nèi)不再提示

CEVA NeuPro-M異構(gòu)和安全處理器架構(gòu)

星星科技指導員 ? 來源:嵌入式計算設計 ? 作者:Tiera Oliver ? 2022-07-11 09:25 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

CEVA, Inc.推出的適用于人工智能機器學習AI/ML) 推理工作負載的最新一代處理器架構(gòu) NeuPro-M。

NeuPro-M針對 Edge AI 和 Edge Compute 的廣闊市場, 是一個自包含的異構(gòu)架構(gòu),由多個專用協(xié)處理器和可配置的硬件加速器組成,可無縫同時處理深度神經(jīng)網(wǎng)絡的各種工作負載,將性能提升 5 -15X 與其前身相比。

作為業(yè)界首創(chuàng),NeuPro-M 支持片上系統(tǒng) (SoC) 和異構(gòu) SoC (HSoC) 可擴展性,可實現(xiàn)高達 1,200 TOPS,并提供可選的穩(wěn)健安全啟動和端到端數(shù)據(jù)隱私。

NeuPro–M 兼容處理器最初包括以下預配置內(nèi)核:

NPM11 – 單個 NeuPro-M 引擎,在 1.25GHz 時高達 20 TOPS

NPM18 – 8 個 NeuPro-M 引擎,在 1.25GHz 時高達 160 TOPS

據(jù)該公司稱,在處理 ResNet50 卷積神經(jīng)網(wǎng)絡時,單個 NPM11 內(nèi)核實現(xiàn)了 5 倍的性能提升和 6 倍的內(nèi)存帶寬減少,從而實現(xiàn)了高達每瓦 24 TOPS 的合適功率效率。

NeuPro-M 能夠處理所有已知的神經(jīng)網(wǎng)絡架構(gòu),以及對下一代網(wǎng)絡(如轉(zhuǎn)換器、3D 卷積、自注意力和所有類型的遞歸神經(jīng)網(wǎng)絡)的集成原生支持。NeuPro-M 經(jīng)過優(yōu)化,可處理 250 多個神經(jīng)網(wǎng)絡、450 多個 AI 內(nèi)核和 50 多個算法。嵌入式矢量處理單元 (VPU) 確保基于未來的軟件支持新的神經(jīng)網(wǎng)絡拓撲和 AI 工作負載的新進展。此外,CDNN 離線壓縮工具可以將 NeuPro-M 的 FPS/Watt 提高 5-10 倍,用于常見基準測試,而對準確性的影響最小。

NeuPro-M 異構(gòu)架構(gòu)由特定功能的協(xié)處理器和負載平衡機制組成,與前代產(chǎn)品相比,它們是性能和效率飛躍的主要貢獻者。通過將控制功能分配給本地控制器并以分層方式實現(xiàn)本地內(nèi)存資源,NeuPro-M 實現(xiàn)了數(shù)據(jù)流的靈活性,可實現(xiàn) 90% 以上的利用率,并在任何給定時間防止不同協(xié)處理器和加速器的數(shù)據(jù)不足。 CDNN 框架通過實踐針對特定網(wǎng)絡、所需帶寬、可用內(nèi)存和目標性能所采用的各種數(shù)據(jù)流方案來獲得最佳負載平衡。

NeuPro-M 架構(gòu)亮點包括:

由 4K MAC(乘加)組成的主網(wǎng)格陣列,混合精度為 2-16 位。

用于權(quán)重和激活的 Winograd 變換引擎,將卷積時間減少 2 倍,并允許 8 位卷積處理,精度下降 《0.5%。

稀疏引擎可避免每層使用零值權(quán)重或激活的操作,從而獲得高達 4 倍的性能提升,同時降低內(nèi)存帶寬和功耗。

完全可編程的向量處理單元,用于處理具有所有數(shù)據(jù)類型的新的不受支持的神經(jīng)網(wǎng)絡架構(gòu),從 32 位浮點到 2 位二進制神經(jīng)網(wǎng)絡 (BNN)。

可配置的權(quán)重和數(shù)據(jù)壓縮到 2 位,同時存儲到內(nèi)存中,并在讀取時實時解壓縮,以減少內(nèi)存帶寬。

動態(tài)配置的兩級存儲器架構(gòu)可最大限度地減少因與外部 SDRAM 之間的數(shù)據(jù)傳輸而導致的功耗。

為了說明這些功能在 NeuPro-M 架構(gòu)中的優(yōu)勢,同時使用 Winograd 變換、稀疏引擎和低分辨率 4x4 位激活的正交機制,可將 Resnet50 等網(wǎng)絡的循環(huán)計數(shù)減少 3 倍以上和 Yolo V3。

由于神經(jīng)網(wǎng)絡權(quán)重和偏差、數(shù)據(jù)集和網(wǎng)絡拓撲成為所有者的關鍵知識產(chǎn)權(quán),因此需要保護它們免遭未經(jīng)授權(quán)的使用。NeuPro-M 架構(gòu)以可選的信任根、身份驗證和加密加速器的形式支持安全訪問。

對于汽車市場,NeuPro-M 內(nèi)核及其 CEVA 深度神經(jīng)網(wǎng)絡 (CDNN) 深度學習編譯器和軟件工具包符合汽車 ISO26262 ASIL-B 功能安全標準,并符合嚴格的質(zhì)量保證標準 IATF16949 和 A-Spice。

結(jié)合 CEVA 的神經(jīng)網(wǎng)絡編譯器 CDNN 及其強大的軟件開發(fā)環(huán)境,NeuPro-M 為客戶提供了一個完全可編程的硬件/軟件 AI 開發(fā)環(huán)境,以最大限度地提高他們的 AI 性能。CDNN 包含的軟件可以充分利用客戶的 NeuPro-M 定制硬件來優(yōu)化功率、性能和帶寬。CDNN 軟件還包括一個內(nèi)存管理器,用于減少內(nèi)存和優(yōu)化負載平衡算法,并廣泛支持各種網(wǎng)絡格式,包括 ONNX、Caffe、TensorFlow、TensorFlow Lite、Pytorch 等。CDNN 與常見的開源框架兼容,包括 Glow、tvm、Halide 和 TensorFlow,并在使用精度守恒方法的同時包括“層融合”和“訓練后量化”等模型優(yōu)化功能。

NeuPro-M 可用于今天的主要客戶許可和今年第二季度的一般許可。NeuPro-M 客戶還可以從 CEVA 的異構(gòu) SoC 設計服務中受益,以幫助集成和支持系統(tǒng)設計和小芯片開發(fā)。

審核編輯:郭婷

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學習之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • 存儲器
    +關注

    關注

    39

    文章

    7744

    瀏覽量

    171942
  • AI
    AI
    +關注

    關注

    91

    文章

    40365

    瀏覽量

    301945
  • 編譯器
    +關注

    關注

    1

    文章

    1672

    瀏覽量

    51772
收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關推薦
    熱點推薦

    探秘DS5002FP安全處理器芯片:安全與性能的完美融合

    探秘DS5002FP安全處理器芯片:安全與性能的完美融合 在當今數(shù)字化時代,數(shù)據(jù)安全處理性能是電子設備設計中至關重要的兩個方面。DS50
    的頭像 發(fā)表于 03-24 16:05 ?59次閱讀

    ADSP - 2185M數(shù)字信號處理器深度剖析:特性、架構(gòu)與應用指南

    ADSP-2185M數(shù)字信號處理器深度剖析:特性、架構(gòu)與應用指南 在數(shù)字信號處理(DSP)領域,ADSP - 2185M這款單芯片微計算機憑
    的頭像 發(fā)表于 03-23 16:20 ?47次閱讀

    Ceva NeuPro-Nano NPU 在 2026 年嵌入式世界大會上 榮獲人工智能獎

    超高效NPU IP在資源受限設備中推進邊緣AI,因而獲得認可 領先的智能邊緣芯片和軟件 IP 授權(quán)商 Ceva 公司(納斯達克股票代碼:CEVA)宣布其 Ceva-NeuPro-Nano 神經(jīng)
    的頭像 發(fā)表于 03-16 10:22 ?251次閱讀
    <b class='flag-5'>Ceva</b> <b class='flag-5'>NeuPro</b>-Nano NPU 在 2026 年嵌入式世界大會上 榮獲人工智能獎

    XC7Z020-2CLG484I 雙核異構(gòu)架構(gòu) 全能型 SoC

    Zynq-7000 系列的核心型號,創(chuàng)新性地將雙核 ARM Cortex-A9 處理器與 7 系列 FPGA 可編程邏輯深度集成,構(gòu)建起 “軟件可編程 + 硬件可定制” 的異構(gòu)計算架構(gòu),為多領域智能設備提供了一體化
    發(fā)表于 02-28 23:37

    Cortex-M0 處理器介紹

    功耗的32位處理器。 Cortex-M0是Cortex-M家族中的M0系列。最大特點是低功耗的設計。Cortex-M0為32位、3級流水線R
    發(fā)表于 01-16 08:04

    Ceva 添加 Sensory 的 TrulyHandsfree 語音激活功能, 增強 NeuPro-Nano NPU 生態(tài)系統(tǒng)

    體驗的需求激增,Ceva公司(納斯達克股票代碼:CEVA)擴展其針對NeuPro-Nano NPU的廣泛人工智能生態(tài)系統(tǒng),以滿足這一需求。今天,Ceva和Sensory公司宣布合作,將
    的頭像 發(fā)表于 01-09 11:22 ?572次閱讀
    <b class='flag-5'>Ceva</b> 添加 Sensory 的 TrulyHandsfree 語音激活功能, 增強 <b class='flag-5'>NeuPro</b>-Nano NPU 生態(tài)系統(tǒng)

    Ceva在恩智浦的軟件定義車輛處理器上實現(xiàn) 實時人工智能加速

    恩智浦 * S32Z2 和 S32E2 實時處理器集成 Ceva**的* * AI DSP* ,為軟件定義車輛提供預測分析、能量管理和智能控制功能 隨著車輛向軟件定義平臺演進,對實時處理、安全
    的頭像 發(fā)表于 01-09 11:14 ?584次閱讀
    <b class='flag-5'>Ceva</b>在恩智浦的軟件定義車輛<b class='flag-5'>處理器</b>上實現(xiàn) 實時人工智能加速

    Cortex-M產(chǎn)品的特色

    低功耗設計:Cortex-M系列處理器核心被設計為低功耗架構(gòu),適用于移動電源和電池供電的嵌入式系統(tǒng)。 高性能處理:Cortex-M
    發(fā)表于 11-26 07:22

    Cortex-M0+處理器的HardFault錯誤介紹

    在ARM處理器中,如果一個程序產(chǎn)生了錯誤并且被處理器檢測到,就會產(chǎn)生錯誤異常。Cortex-M0+處理器只有一種異常用以處理錯誤:HardF
    的頭像 發(fā)表于 10-14 10:50 ?3464次閱讀
    Cortex-<b class='flag-5'>M</b>0+<b class='flag-5'>處理器</b>的HardFault錯誤介紹

    【老法師】多核異構(gòu)處理器M核程序的啟動、編寫和仿真

    文章,小編就將以飛凌嵌入式的OKMX8MP-C開發(fā)板為例,為大家介紹多核異構(gòu)處理器M核程序的啟動配置、程序編寫和實時仿真的過程。
    的頭像 發(fā)表于 08-13 09:05 ?4057次閱讀
    【老法師】多核<b class='flag-5'>異構(gòu)</b><b class='flag-5'>處理器</b>中<b class='flag-5'>M</b>核程序的啟動、編寫和仿真

    T113-i芯片技術解析:高性能嵌入式處理器的創(chuàng)新設計

    性能與功耗之間實現(xiàn)了出色的平衡。 ?核心架構(gòu) T113-i采用異構(gòu)多核設計,搭載雙核ARM Cortex-A7主處理器,主頻可達1.2GHz,處理能力達到4000DMIPS。同時配備一
    的頭像 發(fā)表于 07-17 14:15 ?1399次閱讀

    PTR54H20核心架構(gòu)與特性

    PTR54H20是一款基于Nordic nRF54H20芯片的超低功耗藍牙6.0模塊,采用22nm制程工藝,集成五核異構(gòu)計算架構(gòu):雙Arm Cortex-M33處理器(主頻320MHz
    發(fā)表于 06-25 09:57

    異構(gòu)計算解決方案(兼容不同硬件架構(gòu)

    異構(gòu)計算解決方案通過整合不同類型處理器(如CPU、GPU、NPU、FPGA等),實現(xiàn)硬件資源的高效協(xié)同與兼容,滿足多樣化計算需求。其核心技術與實踐方案如下: 一、硬件架構(gòu)設計 異構(gòu)
    的頭像 發(fā)表于 06-23 07:40 ?940次閱讀

    紫光展銳4G旗艦性能之王智能穿戴平臺W527登場 一大核三小核異構(gòu)處理器架構(gòu)

    W527產(chǎn)品亮點: 1、業(yè)界領先的一大核三小核異構(gòu)處理器架構(gòu),性能體驗凌駕同類產(chǎn)品; 2、12nm工藝制程,超微高集成3D SiP技術,PCB布局更加靈活; 3、強勁續(xù)航,智能應用覆蓋多樣化場景
    的頭像 發(fā)表于 06-03 16:44 ?9557次閱讀
    紫光展銳4G旗艦性能之王智能穿戴平臺W527登場 一大核三小核<b class='flag-5'>異構(gòu)</b><b class='flag-5'>處理器</b><b class='flag-5'>架構(gòu)</b>

    技術分享 | 如何在2k0300(LoongArch架構(gòu)處理器上跑通qt開發(fā)流程

    技術分享 | 如何在2k0300開發(fā)板(LoongArch架構(gòu)處理器上跑通qt開發(fā)流程
    的頭像 發(fā)表于 05-20 11:05 ?953次閱讀
    技術分享 | 如何在2k0300(LoongArch<b class='flag-5'>架構(gòu)</b>)<b class='flag-5'>處理器</b>上跑通qt開發(fā)流程