91欧美超碰AV自拍|国产成年人性爱视频免费看|亚洲 日韩 欧美一厂二区入|人人看人人爽人人操aV|丝袜美腿视频一区二区在线看|人人操人人爽人人爱|婷婷五月天超碰|97色色欧美亚州A√|另类A√无码精品一级av|欧美特级日韩特级

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

超越CPU/GPU:NPU如何讓AI“輕裝上陣”?

Carol Li ? 來源:電子發(fā)燒友 ? 作者:李彎彎 ? 2025-04-18 00:05 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

電子發(fā)燒友網(wǎng)報(bào)道(文/李彎彎)NPU是一種專門為人工智能AI)計(jì)算設(shè)計(jì)的處理器,主要用于高效執(zhí)行神經(jīng)網(wǎng)絡(luò)相關(guān)的運(yùn)算(如矩陣乘法、卷積、激活函數(shù)等)。相較于傳統(tǒng)CPU/GPU,NPU在能效比和計(jì)算速度上更具優(yōu)勢(shì),尤其適合移動(dòng)設(shè)備、邊緣計(jì)算和嵌入式AI場(chǎng)景。

NPU有幾大核心特點(diǎn):其一是專用架構(gòu),針對(duì)神經(jīng)網(wǎng)絡(luò)計(jì)算優(yōu)化,支持并行處理大量矩陣運(yùn)算(如INT8/FP16低精度計(jì)算),典型操作包括卷積、池化、注意力機(jī)制(Transformer)等;其二是高能效比,相比GPU,NPU的功耗更低,適合手機(jī)、IoT設(shè)備等對(duì)續(xù)航要求高的場(chǎng)景;其三是低延遲,專為AI推理(Inference)和訓(xùn)練(Training)優(yōu)化,減少數(shù)據(jù)搬運(yùn)開銷;其四是異構(gòu)計(jì)算,常與CPU、GPU、DSP等協(xié)同工作(如手機(jī)SoC中的“AI引擎”)。

NPU廣泛應(yīng)用于各類AI驅(qū)動(dòng)的設(shè)備與系統(tǒng),典型場(chǎng)景包括:智能手機(jī),實(shí)現(xiàn)實(shí)時(shí)圖像增強(qiáng)(如華為麒麟芯片的AI拍照)、語音助手、AR/VR交互等;可穿戴設(shè)備,支持低功耗的本地化AI計(jì)算(如智能手表的健康監(jiān)測(cè))。

自動(dòng)駕駛,處理傳感器數(shù)據(jù),實(shí)現(xiàn)實(shí)時(shí)物體檢測(cè)、路徑規(guī)劃和決策(如特斯拉FSD芯片)。典算力需求方面,L4級(jí)自動(dòng)駕駛車輛NPU算力超1000 TOPS。

邊緣計(jì)算,如智能攝像頭,人臉識(shí)別、異常行為檢測(cè)。物聯(lián)網(wǎng)設(shè)備,本地化語音助手(如智能音箱的喚醒詞識(shí)別)。

數(shù)據(jù)中心,加速AI模型訓(xùn)練和推理,典型應(yīng)用如谷歌TPU(張量處理單元)。工業(yè)質(zhì)檢,推理時(shí)延壓縮至20ms內(nèi),部署量年增120%。

典型NPU芯片有,如在移動(dòng)端有華為麒麟芯片(達(dá)芬奇NPU),用于手機(jī)AI拍照、語音識(shí)別等;高通Hexagon DSP+NPU(驍龍平臺(tái)),支持AI降噪、影像增強(qiáng);蘋果神經(jīng)網(wǎng)絡(luò)引擎(A/M系列芯片),F(xiàn)ace ID、Siri等功能的底層支持。

在邊緣計(jì)算和自動(dòng)駕駛側(cè)有特斯拉FSD芯片,內(nèi)置NPU處理自動(dòng)駕駛視覺模型;地平線征程芯片(BPU架構(gòu)),用于智能駕駛感知計(jì)算。

在云端,有寒武紀(jì)MLU系列,云端AI訓(xùn)練/推理加速;英偉達(dá)Grace Hopper(集成NPU模塊),大模型推理。

NPU的關(guān)鍵技術(shù)包括量化壓縮,支持INT4/INT8低精度計(jì)算,提升能效;稀疏計(jì)算,跳過零值計(jì)算,加速稀疏模型(如Pruning后的網(wǎng)絡(luò));編譯器優(yōu)化,專用工具鏈(如華為Ascend CANN、高通AI Engine)將框架(TensorFlow/PyTorch)模型轉(zhuǎn)換為NPU指令。

從趨勢(shì)上來看,NPU有幾個(gè)明顯的發(fā)展方向:光電融合計(jì)算,結(jié)合光子學(xué)技術(shù),進(jìn)一步提升算力和能效;神經(jīng)形態(tài)芯片,模仿生物神經(jīng)元結(jié)構(gòu),實(shí)現(xiàn)更低功耗的AI計(jì)算;Chiplet技術(shù),通過多NPU互聯(lián)提升算力(如Cerebras的Wafer級(jí)芯片)。

總的來看,NPU作為AI計(jì)算的核心硬件,正深刻改變著人工智能技術(shù)的落地方式。其高并行性、低功耗和硬件加速能力,使其成為移動(dòng)設(shè)備、自動(dòng)駕駛、邊緣計(jì)算等領(lǐng)域的首選解決方案。隨著技術(shù)演進(jìn)和市場(chǎng)需求的爆發(fā),NPU將在未來AI生態(tài)中扮演更加重要的角色。

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • gpu
    gpu
    +關(guān)注

    關(guān)注

    28

    文章

    5196

    瀏覽量

    135519
  • AI
    AI
    +關(guān)注

    關(guān)注

    91

    文章

    39866

    瀏覽量

    301523
  • NPU
    NPU
    +關(guān)注

    關(guān)注

    2

    文章

    376

    瀏覽量

    21114
收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評(píng)論

    相關(guān)推薦
    熱點(diǎn)推薦

    合規(guī)利器:AM6-PW助力工商業(yè)光伏“輕裝上陣

    在光伏、儲(chǔ)能、風(fēng)電等分布式能源快速崛起的今天,箱變作為能源傳輸與轉(zhuǎn)換的核心樞紐,其安全穩(wěn)定運(yùn)行直接決定了整個(gè)能源系統(tǒng)的效率與可靠性。從工業(yè)廠區(qū)的配電保障到光伏電站的升壓并網(wǎng),從野外儲(chǔ)能站點(diǎn)的全天候值守到商業(yè)綜合體的電力調(diào)控,箱變的每一次穩(wěn)定運(yùn)轉(zhuǎn),都是能源高效利用的重要基石。而安科瑞AM6-PW系列箱變保護(hù)測(cè)控裝置,以“保護(hù)、測(cè)控、通訊一體化”的創(chuàng)新設(shè)計(jì),打破傳統(tǒng)運(yùn)維壁壘,為各類場(chǎng)景箱變安全保駕護(hù)航,賦能綠電
    的頭像 發(fā)表于 02-12 14:33 ?468次閱讀

    使用NORDIC AI的好處

    × 在 CPU 上運(yùn)行時(shí)可快 10×、更省電,平均模型體積 <5 KB。[Edge AI 軟件頁] Axon NPU 對(duì)同一 TensorFlow Lite 模型:* 推理速度最高可比
    發(fā)表于 01-31 23:16

    GPU 利用率<30%?這款開源智算云平臺(tái)算力不浪費(fèi) 1%

    作為 AI 開發(fā)者,你是否早已受夠這些困境:花數(shù)百萬采購(gòu)的 GPU 集群,利用率常年低于 30%,算力閑置如同燒錢;跨 CPU/GPU/NPU
    的頭像 發(fā)表于 01-26 14:20 ?191次閱讀

    瑞芯微SOC智能視覺AI處理器

    需要連接多種外設(shè)的產(chǎn)品。顯示: 支持雙屏異顯,最高4K@60fps輸出。 RK1126B: 一款集成自研NPU的智能視覺AI處理器,專注于視頻輸入端的AI分析與處理。CPU: 雙核A5
    發(fā)表于 12-19 13:44

    AI硬件全景解析:CPU、GPU、NPU、TPU的差異化之路,一文看懂!?

    CPU作為“通用基石”,支撐所有設(shè)備的基礎(chǔ)運(yùn)行;GPU憑借并行算力,成為AI訓(xùn)練與圖形處理的“主力”;TPU在Google生態(tài)中深耕云端大模型訓(xùn)練;NPU
    的頭像 發(fā)表于 12-17 17:13 ?1793次閱讀
    <b class='flag-5'>AI</b>硬件全景解析:<b class='flag-5'>CPU</b>、<b class='flag-5'>GPU</b>、<b class='flag-5'>NPU</b>、TPU的差異化之路,一文看懂!?

    中小企業(yè)別慌:輕量化設(shè)備系統(tǒng)成新寵,低成本落地

    它不用企業(yè)遷就技術(shù),而是技術(shù)服務(wù)企業(yè);不用投巨資,卻能減停機(jī)損失、降維護(hù)成本、提效率。當(dāng)設(shè)備故障不再半夜驚魂,當(dāng)維修不靠 “老師傅經(jīng)驗(yàn)”,中小企業(yè)才能輕裝上陣,專注核心業(yè)務(wù)。
    的頭像 發(fā)表于 10-23 14:04 ?829次閱讀
    中小企業(yè)別慌:輕量化設(shè)備系統(tǒng)成新寵,低成本落地

    簡(jiǎn)化定位,從exgnss擴(kuò)展庫(kù)開始:GNSS開發(fā)從此“輕裝上陣

    面對(duì)GNSS定位開發(fā)的重重挑戰(zhàn),exgnss擴(kuò)展庫(kù)為你減負(fù)!它整合了核心算法與硬件適配,開發(fā)者無需重復(fù)造輪子,即可快速構(gòu)建穩(wěn)定、低功耗的定位應(yīng)用。
    的頭像 發(fā)表于 09-16 17:43 ?828次閱讀
    簡(jiǎn)化定位,從exgnss擴(kuò)展庫(kù)開始:GNSS開發(fā)從此“<b class='flag-5'>輕裝上陣</b>”

    小微企業(yè)怕 “智能難用”?這套系統(tǒng)自動(dòng)適配需求,上手不用懂技術(shù)

    當(dāng)設(shè)備管理系統(tǒng)像智能手機(jī)般易用,每臺(tái)設(shè)備都有 “健康管家”,小微企業(yè)才能真正享智能化紅利,在競(jìng)爭(zhēng)中輕裝上陣
    的頭像 發(fā)表于 09-12 10:47 ?482次閱讀
    小微企業(yè)怕 “智能難用”?這套系統(tǒng)自動(dòng)適配需求,上手不用懂技術(shù)

    JBD蜂鳥Ⅱ:輕裝上陣、全彩出擊,輕量化AR解鎖全彩視覺體驗(yàn)

    顯示體驗(yàn),更深度釋放了AI+AR視覺交互的潛力。 JBD“蜂鳥Ⅱ”彩色光引擎 極致小巧,釋放產(chǎn)品設(shè)計(jì)自由度 隨著AI大模型和智能體的快速迭代,AR智能眼鏡正逐步發(fā)展為全天候AI助理,它不僅需要輕便舒適,還要在多模態(tài)交互中提供高質(zhì)
    的頭像 發(fā)表于 09-10 14:17 ?1.4w次閱讀
    JBD蜂鳥Ⅱ:<b class='flag-5'>輕裝上陣</b>、全彩出擊,輕量化AR解鎖全彩視覺體驗(yàn)

    輕裝上陣,效率不減,職場(chǎng)打工人首選#戴睿 #戴睿筆記本

    筆記本
    jf_69630214
    發(fā)布于 :2025年08月21日 15:51:11

    【「算力芯片 | 高性能 CPU/GPU/NPU 微架構(gòu)分析」閱讀體驗(yàn)】+NVlink技術(shù)從應(yīng)用到原理

    前言 【「算力芯片 | 高性能 CPU/GPU/NPU 微架構(gòu)分析」書中的芯片知識(shí)是比較接近當(dāng)前的頂尖芯片水平的,同時(shí)包含了芯片架構(gòu)的基礎(chǔ)知識(shí),但該部分知識(shí)比較晦澀難懂,或許是由于我一直從事的事芯片
    發(fā)表于 06-18 19:31

    低功耗+高集成:紅外熱成像機(jī)芯如何助力消防設(shè)備輕裝上陣?

    在消防安全領(lǐng)域,快速、精準(zhǔn)的溫度監(jiān)測(cè)是預(yù)防火災(zāi)、減少損失的關(guān)鍵。KC-2R02U-15工業(yè)測(cè)溫機(jī)芯憑借其小型化設(shè)計(jì)、低功耗特性與高精度測(cè)溫能力,成為消防集成設(shè)備的理想核心組件,助力構(gòu)建智能化、高效化的安全防護(hù)體系。 體積小巧,靈活適配消防場(chǎng)景 消防設(shè)備需適應(yīng)復(fù)雜環(huán)境,如狹窄空間、高空吊艙或移動(dòng)機(jī)器人等。KC-2R02U-15機(jī)芯尺寸僅32.09mm×20mm×20mm,重量不超過22克,可輕松嵌入消防巡檢機(jī)器人、無人機(jī)吊艙或固定式監(jiān)控設(shè)備中,無需額外占用
    的頭像 發(fā)表于 06-18 15:38 ?585次閱讀

    iTOP-3588S開發(fā)板四核心架構(gòu)GPU內(nèi)置GPU可以完全兼容0penGLES1.1、2.0和3.2。

    ,8GB內(nèi)存,32GBEMMC。 四核心架構(gòu)GPU內(nèi)置GPU可以完全兼容0penGLES1.1、2.0和3.2。 內(nèi)置NPU RK3588S內(nèi)置NPU,支持INT4/INT8/INT1
    發(fā)表于 05-15 10:36

    迅為iTOP-RK3588S開發(fā)板/核心板瑞芯微RK3588S處理器6TOPS算力內(nèi)置NPU

    ,8GB內(nèi)存,32GBEMMC。 四核心架構(gòu)GPU內(nèi)置GPU可以完全兼容0penGLES1.1、2.0和3.2。 內(nèi)置NPU RK3588S內(nèi)置NPU,支持INT4/INT8/INT1
    發(fā)表于 04-10 11:13

    iTOP-3588開發(fā)板采用瑞芯微RK3588處理器四核心架構(gòu)GPU內(nèi)置獨(dú)立NPU強(qiáng)大的視頻編解碼

    硬件引擎將最大 限度地提高顯示性能,并提供非常平穩(wěn)的操作。 內(nèi)置獨(dú)立NPU RK3588集成了瑞芯微第四代具有完全自主知識(shí)產(chǎn)權(quán)的人工智能 運(yùn)算引擎,6TOPs的NPU算力,賦能各類AI場(chǎng)景。 強(qiáng)大
    發(fā)表于 04-09 16:09