91欧美超碰AV自拍|国产成年人性爱视频免费看|亚洲 日韩 欧美一厂二区入|人人看人人爽人人操aV|丝袜美腿视频一区二区在线看|人人操人人爽人人爱|婷婷五月天超碰|97色色欧美亚州A√|另类A√无码精品一级av|欧美特级日韩特级

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫(xiě)文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

端側(cè)推理:FPGA正崛起為“非GPU”陣營(yíng)的中堅(jiān)力量

中科億海微 ? 2026-01-23 17:17 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

隨著AI應(yīng)用的迅猛發(fā)展,端側(cè)推理正受到前所未有的關(guān)注。與數(shù)據(jù)中心對(duì)極致吞吐的追求不同,端側(cè)推理更聚焦于低延遲、低功耗與高可靠性,其應(yīng)用場(chǎng)景呈現(xiàn)出高度分散、類型多樣的特征。從工業(yè)現(xiàn)場(chǎng)到車載系統(tǒng),再到通信邊緣節(jié)點(diǎn),推理任務(wù)正沿著“靠近數(shù)據(jù)源、貼近業(yè)務(wù)閉環(huán)”的路徑持續(xù)下沉,推動(dòng)端側(cè)推理從單一通用形態(tài)向多元化方向演進(jìn)。這一進(jìn)程中,GPU并非在所有場(chǎng)景中都具備最優(yōu)解;而以FPGA為代表的可重構(gòu)計(jì)算,憑借其在硬件定制與系統(tǒng)級(jí)能效方面的顯著優(yōu)勢(shì),正逐步成為端側(cè)推理落地的重要承載形態(tài),并邁向規(guī)?;瘧?yīng)用的新階段。

一、端側(cè)推理的“GPU困境”:剛需場(chǎng)景下的效能天花板

目前,AI推理能力從數(shù)據(jù)中心進(jìn)一步下沉至工業(yè)設(shè)備、車載終端與嵌入式通信節(jié)點(diǎn)等端側(cè)系統(tǒng),算力需求的評(píng)價(jià)標(biāo)準(zhǔn)正在發(fā)生根本性變化。相比云端與服務(wù)器場(chǎng)景以“吞吐率”為核心的設(shè)計(jì)邏輯,端側(cè)推理更關(guān)注確定性時(shí)延、功耗上限與系統(tǒng)可控性。這一轉(zhuǎn)變,使以通用并行計(jì)算和高吞吐為核心目標(biāo)的GPU架構(gòu),在端側(cè)應(yīng)用中逐步顯現(xiàn)出結(jié)構(gòu)性不適配。

在工業(yè)視覺(jué)控制、車載感知閉環(huán)以及設(shè)備級(jí)通信處理等典型端側(cè)場(chǎng)景中,計(jì)算系統(tǒng)通常直接嵌入設(shè)備本體,受制于嚴(yán)格的功耗、體積與散熱條件,同時(shí)對(duì)端到端響應(yīng)時(shí)延的穩(wěn)定性提出硬性要求。受限于其多級(jí)存儲(chǔ)體系、復(fù)雜調(diào)度機(jī)制及批量并行的執(zhí)行模型,GPU在此類場(chǎng)景中往往難以在功耗、時(shí)延與系統(tǒng)復(fù)雜度之間實(shí)現(xiàn)綜合最優(yōu),其架構(gòu)優(yōu)勢(shì)更適用于資源相對(duì)充裕、任務(wù)調(diào)度彈性較大的集中式計(jì)算環(huán)境。

從行業(yè)維度看,端側(cè)推理任務(wù)往往要求亞毫秒至毫秒級(jí)響應(yīng),同時(shí)對(duì)單節(jié)點(diǎn)功耗設(shè)定嚴(yán)格上限。相比之下,GPU在典型推理負(fù)載下更適合功耗與散熱條件充裕的集中式環(huán)境,在大量端側(cè)非通用計(jì)算場(chǎng)景中難以實(shí)現(xiàn)性能、功耗與成本的綜合最優(yōu)。這種由端側(cè)應(yīng)用特性與架構(gòu)定位差異帶來(lái)的“能力錯(cuò)配”,正在削弱GPU在端側(cè)推理領(lǐng)域的適用性,也為以FPGA為代表的可編程邏輯器件打開(kāi)了新的發(fā)展空間。

二、FPGA的技術(shù)突圍:為什么是端側(cè)推理的“最優(yōu)解”

FPGA(現(xiàn)場(chǎng)可編程門(mén)陣列)的硬件可編程性與細(xì)粒度并行架構(gòu),在端側(cè)AI推理場(chǎng)景中展現(xiàn)出與GPU截然不同的技術(shù)適配性,其優(yōu)勢(shì)體現(xiàn)在三個(gè)關(guān)鍵維度:

1.極致能效比:在功耗約束下釋放確定性性能

在固定模型、低精度推理等典型端側(cè)場(chǎng)景中,F(xiàn)PGA可在相同功耗約束下實(shí)現(xiàn)更高的有效算力,或在滿足既定性能目標(biāo)的前提下,將系統(tǒng)功耗降低至GPU的約1/3~1/5。不同于GPU以指令級(jí)并行為核心的多核執(zhí)行模式,F(xiàn)PGA通過(guò)定制化邏輯電路實(shí)現(xiàn)任務(wù)級(jí)、流水線級(jí)與數(shù)據(jù)級(jí)并行,在算法結(jié)構(gòu)穩(wěn)定、數(shù)據(jù)流明確的推理負(fù)載中具備顯著優(yōu)勢(shì)。

通過(guò)對(duì)卷積、池化等關(guān)鍵算子的硬件化并行處理,以及片上數(shù)據(jù)復(fù)用與深流水線設(shè)計(jì),F(xiàn)PGA能夠顯著降低端到端推理時(shí)延,尤其適用于對(duì)確定性響應(yīng)敏感的應(yīng)用。在工業(yè)視覺(jué)實(shí)踐中,基于FPGA的YOLO類模型推理通常可在個(gè)位數(shù)毫秒內(nèi)完成,功耗維持在個(gè)位數(shù)至十瓦級(jí)區(qū)間;同時(shí),其像素級(jí)并行架構(gòu)在4K圖像處理等高帶寬場(chǎng)景下有效緩解外部存儲(chǔ)瓶頸,體現(xiàn)出明顯的系統(tǒng)級(jí)能效優(yōu)勢(shì)。

2.場(chǎng)景定制化:面向端側(cè)推理的硬件級(jí)重構(gòu)能力

端側(cè)推理任務(wù)通常具備模型固定、數(shù)據(jù)路徑穩(wěn)定、運(yùn)行周期長(zhǎng)等特征。FPGA的硬件可編程特性,使其能夠圍繞具體模型結(jié)構(gòu)與數(shù)據(jù)流模式,對(duì)計(jì)算架構(gòu)進(jìn)行深度定制。例如,在工業(yè)檢測(cè)場(chǎng)景中,可針對(duì)特定缺陷識(shí)別模型構(gòu)建專用推理流水線;在車載感知系統(tǒng)中,可將多傳感器數(shù)據(jù)融合、前處理與推理邏輯整合為統(tǒng)一的數(shù)據(jù)流架構(gòu),在保證實(shí)時(shí)性的同時(shí)降低系統(tǒng)復(fù)雜度。

在車規(guī)級(jí)應(yīng)用中,F(xiàn)PGA還可支持–40℃~125℃的寬溫工作區(qū)間,并通過(guò)硬件級(jí)并行與簡(jiǎn)化的軟件棧提升系統(tǒng)可靠性與可預(yù)測(cè)性。這種以“硬件重構(gòu)”為核心的定制能力,使FPGA在強(qiáng)實(shí)時(shí)、強(qiáng)確定性與高可靠性要求下具備不可替代性,而GPU更適合計(jì)算資源充裕、調(diào)度彈性較大的通用推理環(huán)境。

3.國(guó)產(chǎn)化技術(shù)突破:縮小差距的關(guān)鍵十年

國(guó)產(chǎn)FPGA廠商已在核心技術(shù)上實(shí)現(xiàn)全鏈路突破,在28nm及以上成熟制程節(jié)點(diǎn)、中低密度器件及行業(yè)級(jí)應(yīng)用領(lǐng)域,國(guó)產(chǎn)FPGA已明顯縮小與國(guó)際頭部廠商的差距,部分細(xì)分場(chǎng)景具備工程可替代能力;在先進(jìn)制程與高端生態(tài)方面,國(guó)產(chǎn)廠商仍處于穩(wěn)步追趕階段,并已推進(jìn)更先進(jìn)節(jié)點(diǎn)的工程驗(yàn)證與小規(guī)模量產(chǎn)探索,為后續(xù)性能與集成度提升奠定基礎(chǔ)。

三、國(guó)產(chǎn)化FPGA的落地實(shí)踐:從實(shí)驗(yàn)室到產(chǎn)業(yè)規(guī)模

在政策扶持與市場(chǎng)需求的雙重驅(qū)動(dòng)下,國(guó)產(chǎn)FPGA已在多個(gè)端側(cè)推理應(yīng)用場(chǎng)景實(shí)現(xiàn)規(guī)?;瘧?yīng)用,成為“非GPU”推理場(chǎng)景的核心力量:

1.工業(yè)智能:質(zhì)檢產(chǎn)線的端側(cè)實(shí)時(shí)算力引擎

在高端裝備制造與工業(yè)視覺(jué)檢測(cè)領(lǐng)域,國(guó)產(chǎn)FPGA已廣泛部署于產(chǎn)線設(shè)備端,承擔(dān)高速、強(qiáng)實(shí)時(shí)的推理與圖像處理任務(wù)。通過(guò)將關(guān)鍵推理算子與圖像處理流程在設(shè)備端進(jìn)行硬件化實(shí)現(xiàn),系統(tǒng)整體推理時(shí)延與功耗顯著下降,能夠在高速運(yùn)行設(shè)備條件下,穩(wěn)定支撐實(shí)時(shí)缺陷檢測(cè)與質(zhì)量判定需求。在3C電子與精密制造等典型場(chǎng)景中,基于國(guó)產(chǎn)FPGA的端側(cè)視覺(jué)處理方案可實(shí)現(xiàn)4K級(jí)圖像的高速無(wú)壓縮本地處理,在保障檢測(cè)精度的同時(shí),支持算法在設(shè)備端的快速切換與產(chǎn)線柔性調(diào)整,顯著提升系統(tǒng)適應(yīng)性與運(yùn)行效率。

2.自動(dòng)駕駛與車載系統(tǒng):端側(cè)感知鏈路的低時(shí)延核心

在自動(dòng)駕駛與高級(jí)輔助駕駛系統(tǒng)中,國(guó)產(chǎn)FPGA正逐步成為車載端感知鏈路中的關(guān)鍵算力單元,承擔(dān)多傳感器數(shù)據(jù)的本地預(yù)處理與融合計(jì)算任務(wù)。其硬件級(jí)并行處理與確定性時(shí)延特性,使激光雷達(dá)、攝像頭等多源數(shù)據(jù)能夠在車載功耗與散熱約束下實(shí)現(xiàn)高效協(xié)同處理,滿足車輛對(duì)低時(shí)延與高可靠性的雙重要求。隨著國(guó)產(chǎn)車規(guī)級(jí)FPGA在功能安全、可靠性與長(zhǎng)期供貨能力等方面持續(xù)成熟,相關(guān)產(chǎn)品已進(jìn)入主流車載供應(yīng)鏈體系,并在車載感知與控制等端側(cè)系統(tǒng)中實(shí)現(xiàn)規(guī)?;瘧?yīng)用。

四、產(chǎn)業(yè)生態(tài)加速:國(guó)產(chǎn)化FPGA的黃金增長(zhǎng)期

國(guó)產(chǎn)FPGA的崛起并非源于單點(diǎn)技術(shù)突破,而是政策、市場(chǎng)與生態(tài)協(xié)同演進(jìn)的結(jié)果。在政策層面,隨著新一輪信創(chuàng)體系持續(xù)深化,關(guān)鍵行業(yè)對(duì)可編程邏輯器件的國(guó)產(chǎn)化比例提出更高要求,國(guó)家集成電路產(chǎn)業(yè)投資基金及地方產(chǎn)業(yè)資本亦持續(xù)加大對(duì)先進(jìn)制程、核心IP與EDA工具鏈的支持力度,為國(guó)產(chǎn)FPGA長(zhǎng)期發(fā)展提供了穩(wěn)定的制度與資金環(huán)境。

在市場(chǎng)層面,中國(guó)FPGA市場(chǎng)規(guī)模正保持快速增長(zhǎng),應(yīng)用重心加速向端側(cè)推理、工業(yè)控制與通信設(shè)備等領(lǐng)域轉(zhuǎn)移。隨著端側(cè)智能需求釋放,F(xiàn)PGA在端側(cè)推理模塊中的滲透率不斷提升,成為帶動(dòng)行業(yè)增長(zhǎng)的重要增量來(lái)源。疊加國(guó)產(chǎn)替代趨勢(shì),中端及行業(yè)級(jí)FPGA市場(chǎng)正逐步打開(kāi),釋放出可觀的結(jié)構(gòu)性替代空間。

在生態(tài)層面,國(guó)產(chǎn)FPGA的開(kāi)發(fā)環(huán)境與應(yīng)用基礎(chǔ)正在顯著改善。一方面,圍繞國(guó)產(chǎn)器件的開(kāi)發(fā)板、參考設(shè)計(jì)與行業(yè)解決方案持續(xù)豐富,覆蓋工業(yè)、通信、能源、汽車等多個(gè)垂直領(lǐng)域;另一方面,高層次設(shè)計(jì)工具與算法-硬件協(xié)同優(yōu)化技術(shù)逐步成熟,通過(guò)Python、C/C++等高級(jí)語(yǔ)言自動(dòng)生成硬件描述代碼,大幅降低FPGA的開(kāi)發(fā)門(mén)檻,為規(guī)?;瘧?yīng)用掃清障礙。

盡管高端通用FPGA市場(chǎng)仍由國(guó)際廠商主導(dǎo),但在中端及專用場(chǎng)景中,本土廠商的市場(chǎng)份額正在穩(wěn)步提升。隨著產(chǎn)品可靠性、工具鏈成熟度與行業(yè)適配能力的不斷增強(qiáng),國(guó)產(chǎn)FPGA在工業(yè)級(jí)與車規(guī)級(jí)等應(yīng)用中的競(jìng)爭(zhēng)力日益凸顯,國(guó)產(chǎn)替代進(jìn)入由“可用”向“規(guī)?;瘧?yīng)用”轉(zhuǎn)變的關(guān)鍵階段。

在這一背景下,中科億海微作為國(guó)內(nèi)較早深耕FPGA領(lǐng)域的高新技術(shù)企業(yè)之一,長(zhǎng)期堅(jiān)持完全自主正向研發(fā)路線,逐步構(gòu)建起覆蓋可編程邏輯IP、FPGA芯片及EDA設(shè)計(jì)工具的完整技術(shù)體系。中科億海微產(chǎn)品已形成涵蓋工業(yè)級(jí)、車規(guī)級(jí)與宇航級(jí)的多層次布局,多系列FPGA芯片實(shí)現(xiàn)規(guī)?;瘧?yīng)用,具備較強(qiáng)的工程落地能力和行業(yè)適配經(jīng)驗(yàn)。在既有產(chǎn)品基礎(chǔ)上,中科億海微新一代9系“億海龍珠”高端FPGA芯片及配套自主IP核完成研發(fā),進(jìn)一步補(bǔ)齊了在高可靠、高集成度FPGA方向的產(chǎn)品布局。面向多源感知融合、伺服控制、視頻分析等端側(cè)智能任務(wù),相關(guān)產(chǎn)品已在智能控制、高速通信、具身智能及端側(cè)推理加速等高價(jià)值場(chǎng)景中發(fā)揮了重要作用。

從全球視角看,F(xiàn)PGA市場(chǎng)仍處于穩(wěn)步擴(kuò)張階段。隨著通信、AI推理、汽車電子及國(guó)防航天等領(lǐng)域應(yīng)用持續(xù)深化,F(xiàn)PGA在多元算力體系中的戰(zhàn)略地位不斷強(qiáng)化。這一趨勢(shì)不僅驗(yàn)證了FPGA作為重要基礎(chǔ)算力形態(tài)的長(zhǎng)期價(jià)值,也為具備自主技術(shù)體系與行業(yè)深耕能力的國(guó)產(chǎn)FPGA企業(yè),提供了持續(xù)擴(kuò)展的市場(chǎng)空間。

五、結(jié)語(yǔ):邊緣算力重構(gòu)中的國(guó)產(chǎn)化機(jī)遇

端側(cè)推理正在推動(dòng)算力體系從“GPU中心化”走向多架構(gòu)并行的新階段。在設(shè)備級(jí)、強(qiáng)實(shí)時(shí)與強(qiáng)功耗約束的應(yīng)用場(chǎng)景中,通用GPU難以同時(shí)兼顧時(shí)延確定性、能效與系統(tǒng)復(fù)雜度,F(xiàn)PGA憑借硬件級(jí)并行、可按任務(wù)重構(gòu)的數(shù)據(jù)流架構(gòu)以及成熟的工程落地能力,正率先確立其在端側(cè)推理中的中堅(jiān)地位。對(duì)國(guó)產(chǎn)FPGA而言,端側(cè)推理所帶來(lái)的并非簡(jiǎn)單的“進(jìn)口替代”機(jī)會(huì),而是一次在非GPU技術(shù)路徑上重塑算力供給結(jié)構(gòu)的窗口期:其競(jìng)爭(zhēng)焦點(diǎn)正從單點(diǎn)性能對(duì)標(biāo),轉(zhuǎn)向?qū)Χ藗?cè)應(yīng)用范式、系統(tǒng)架構(gòu)與產(chǎn)業(yè)生態(tài)的深度綁定,逐步成長(zhǎng)為具備長(zhǎng)期戰(zhàn)略價(jià)值的關(guān)鍵算力基礎(chǔ)設(shè)施。

聲明:本文內(nèi)容及配圖由入駐作者撰寫(xiě)或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問(wèn)題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • FPGA
    +關(guān)注

    關(guān)注

    1660

    文章

    22406

    瀏覽量

    636065
  • gpu
    gpu
    +關(guān)注

    關(guān)注

    28

    文章

    5191

    瀏覽量

    135407
  • 中科億海微
    +關(guān)注

    關(guān)注

    0

    文章

    122

    瀏覽量

    2148
收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評(píng)論

    相關(guān)推薦
    熱點(diǎn)推薦

    利用ExecuTorch和Arm SME2加速側(cè)機(jī)器學(xué)習(xí)推理

    貼紙、分離主體以替換背景,或是對(duì)圖像局部進(jìn)行選擇性增強(qiáng)。這些效果背后,是輕量級(jí)分割模型在運(yùn)行,這些模型通過(guò) ExecuTorch(PyTorch 的開(kāi)源側(cè)推理運(yùn)行時(shí))以及第二代 Arm 可伸縮矩陣擴(kuò)展技術(shù) (Arm SME2)
    的頭像 發(fā)表于 03-03 10:27 ?266次閱讀
    利用ExecuTorch和Arm SME2加速<b class='flag-5'>端</b><b class='flag-5'>側(cè)</b>機(jī)器學(xué)習(xí)<b class='flag-5'>推理</b>

    軟通動(dòng)力基于OpenClaw開(kāi)源框架深度自研側(cè)智能體平臺(tái)

    隨著人工智能加速?gòu)脑贫讼鲁林两K端、從被動(dòng)交互邁向主動(dòng)執(zhí)行,側(cè)智能體成為定義智能硬件體驗(yàn)的核心引擎。軟通動(dòng)力基于OpenClaw開(kāi)源框架深度自研
    的頭像 發(fā)表于 02-27 11:48 ?425次閱讀

    Imagination中國(guó)區(qū)董事長(zhǎng)兼亞太區(qū)總裁白農(nóng):通用計(jì)算GPU驅(qū)動(dòng)側(cè)AI發(fā)展

    ,通用計(jì)算GPU成為驅(qū)動(dòng)側(cè)AI發(fā)展的重要引擎。當(dāng)前,側(cè)AI算力迎來(lái)爆發(fā)式增長(zhǎng),
    的頭像 發(fā)表于 11-26 13:56 ?578次閱讀
    Imagination中國(guó)區(qū)董事長(zhǎng)兼亞太區(qū)總裁白農(nóng):通用計(jì)算<b class='flag-5'>GPU</b>驅(qū)動(dòng)<b class='flag-5'>端</b><b class='flag-5'>側(cè)</b>AI發(fā)展

    信馳達(dá)Sub-G模塊成為實(shí)現(xiàn)廣域物聯(lián)網(wǎng)連接的中堅(jiān)力量

    一條暢通無(wú)阻的“城郊快速路”,以其遠(yuǎn)距離、低功耗的卓越特性,與擁擠如 “城市中心高速公路” 的2.4 GHz頻段形成鮮明對(duì)比,成為實(shí)現(xiàn)廣域物聯(lián)網(wǎng)連接的中堅(jiān)力量。
    的頭像 發(fā)表于 11-24 10:31 ?2315次閱讀
    信馳達(dá)Sub-G模塊成為實(shí)現(xiàn)廣域物聯(lián)網(wǎng)連接的<b class='flag-5'>中堅(jiān)力量</b>

    星坤K202820 Series車用連接器賦能高效導(dǎo)電

    中國(guó)星坤 (XKB Connection) 自 1999年在香港成立以來(lái),始終致力于全球用戶提供高性能、高可靠性的連接產(chǎn)品與服務(wù)。作為中國(guó)本土崛起最快的連接器企業(yè),星坤已成為國(guó)產(chǎn)替代浪潮中的中堅(jiān)力量。
    的頭像 發(fā)表于 11-20 10:02 ?2334次閱讀
    星坤K202820 Series車用連接器賦能高效導(dǎo)電

    專注微波頻段的中堅(jiān)力量:Agilent E8247C 模擬信號(hào)發(fā)生器

    科技 Keysight Technologies)的 E8247C 正是為此而生的中堅(jiān)力量,它在特定的頻率范圍內(nèi)提供了頂尖的性能。 E8247C:精準(zhǔn)定位的微波信號(hào)源 Agilent E8247C 是 PSG 模擬信號(hào)發(fā)生器家族的一員,它并非追求極致的頻率上限,而是在其覆蓋的頻段內(nèi)追求極致的信
    的頭像 發(fā)表于 10-11 15:38 ?431次閱讀
    專注微波頻段的<b class='flag-5'>中堅(jiān)力量</b>:Agilent E8247C 模擬信號(hào)發(fā)生器

    潤(rùn)和軟件榮登2025 IDC中國(guó)金融IT中堅(jiān)力量榜單

    近日,全球領(lǐng)先的IT市場(chǎng)研究和咨詢公司IDC公布“2025 IDC中國(guó)金融IT中堅(jiān)力量”榜單。江蘇潤(rùn)和軟件股份有限公司(以下簡(jiǎn)稱“潤(rùn)和軟件”)憑借在金融科技領(lǐng)域的深厚積累和創(chuàng)新實(shí)踐,連續(xù)三年入選該榜單,再獲國(guó)際市場(chǎng)認(rèn)可。
    的頭像 發(fā)表于 09-01 11:53 ?682次閱讀

    中軟國(guó)際榮登2025 IDC中國(guó)金融IT中堅(jiān)力量榜單

    8月21日,2025年度IDC(中國(guó))FinTech系列榜單正式公布。中軟國(guó)際憑借在金融行業(yè)的出色表現(xiàn),連續(xù)三年入選“IDC中國(guó)金融IT中堅(jiān)力量” 榜單。
    的頭像 發(fā)表于 08-25 17:25 ?2049次閱讀

    側(cè)AI推理賦能效率革命,美格智能多領(lǐng)域落地打造行業(yè)范本

    的性能不斷增強(qiáng),側(cè)AI推理的成本全面降低,應(yīng)用場(chǎng)景更加廣泛。目前,AI助手已廣泛應(yīng)用于智能手機(jī)、智能穿戴、車載系統(tǒng)、辦公軟件及各類垂直行業(yè)應(yīng)用中,用戶提供信息
    的頭像 發(fā)表于 08-25 17:06 ?3905次閱讀
    <b class='flag-5'>端</b><b class='flag-5'>側(cè)</b>AI<b class='flag-5'>推理</b>賦能效率革命,美格智能多領(lǐng)域落地打造行業(yè)范本

    Say Hi to ERNIE!Imagination GPU率先完成文心大模型的側(cè)部署

    本地AI推理,同時(shí)大幅降低推理成本,這一成果也標(biāo)志著ImaginationGPU在側(cè)AI推理場(chǎng)景中的技術(shù)領(lǐng)先性。Imagination高度
    的頭像 發(fā)表于 07-01 08:17 ?968次閱讀
    Say Hi to ERNIE!Imagination <b class='flag-5'>GPU</b>率先完成文心大模型的<b class='flag-5'>端</b>側(cè)部署

    廣和通加速通義千問(wèn)Qwen3在側(cè)全面落地

    6月,廣和通宣布:率先完成通義千問(wèn)Qwen3系列混合推理模型在高通QCS8550平臺(tái)側(cè)的適配部署。廣和通通過(guò)定制化混合精度量化方案與創(chuàng)新硬件加速算法,成功突破Qwen3新型架構(gòu)在邊緣側(cè)
    的頭像 發(fā)表于 06-25 15:35 ?1120次閱讀

    華邦電子創(chuàng)新存儲(chǔ)賦能側(cè)智能側(cè)

    人工智能技術(shù)的飛速發(fā)展,#側(cè)AI 正在成為智能設(shè)備發(fā)展的重要趨勢(shì)。華邦電子憑借其卓越存儲(chǔ)技術(shù)和豐富的產(chǎn)品,積極布局端側(cè) AI 市場(chǎng),
    的頭像 發(fā)表于 05-14 09:59 ?1549次閱讀
    華邦電子創(chuàng)新存儲(chǔ)賦能<b class='flag-5'>端</b><b class='flag-5'>側(cè)</b>智能<b class='flag-5'>端</b><b class='flag-5'>側(cè)</b>

    國(guó)產(chǎn)主板:科技崛起中堅(jiān)力量

    在計(jì)算機(jī)硬件的龐大體系中,主板猶如一座堅(jiān)固的基石,承載并協(xié)調(diào)著各個(gè)組件的有序運(yùn)行。近年來(lái),國(guó)產(chǎn)主板憑借著技術(shù)創(chuàng)新與突破,在市場(chǎng)中逐漸嶄露頭角。
    的頭像 發(fā)表于 05-07 10:01 ?532次閱讀

    炬芯科技探索側(cè)AI技術(shù)與應(yīng)用

    隨著人工智能技術(shù)的迅猛發(fā)展,AI應(yīng)用正從云端向終端迅速擴(kuò)張。側(cè)AI的核心在于讓智能設(shè)備在本地完成數(shù)據(jù)處理和推理決策,并且可以在較低能耗情況下的持續(xù)工作,從而減少對(duì)云端的依賴,提升交互效率和保障數(shù)據(jù)安全。
    的頭像 發(fā)表于 03-27 14:58 ?1115次閱讀

    無(wú)法調(diào)用GPU插件推理的遠(yuǎn)程張量API怎么解決?

    運(yùn)行了使用 GPU 插件的遠(yuǎn)程張量 API 的推理。但是,它未能共享 OpenCL* 內(nèi)存,但結(jié)果不正確。
    發(fā)表于 03-06 06:13