的AI應(yīng)用需要經(jīng)歷訓(xùn)練和推理兩個(gè)過(guò)程。所謂訓(xùn)練,就是我們要將大量的數(shù)據(jù)代入到神經(jīng)網(wǎng)絡(luò)模型中運(yùn)算并反復(fù)迭代,教會(huì)算法模型如何正確的工作,訓(xùn)練出一個(gè)DL模型。而接下來(lái),我們就可以利用訓(xùn)練出來(lái)的模型來(lái)在線響應(yīng)用戶的需求,根據(jù)
2020-09-29 10:43:32
5536 谷歌第七代TPU Ironwood深度解讀:AI推理時(shí)代的硬件革命 Google 發(fā)布了 Ironwood,這是其第七代張量處理單元 (TPU),專為推理而設(shè)計(jì)。這款功能強(qiáng)大的 AI 加速器旨在處理
2025-04-12 11:10:01
3280 
本月,高通推出其首款基于云端的 AI 加速器:Qualcomm Cloud AI 100,正式宣布進(jìn)軍云計(jì)算領(lǐng)域。根據(jù)高通的說(shuō)法,Qualcomm Cloud AI 100 是一款用于數(shù)據(jù)中心的 AI 推理處理器。
2019-04-29 17:46:59
6250 電子發(fā)燒友網(wǎng)報(bào)道(文/黃晶晶)在嵌入式領(lǐng)域,邊緣與端側(cè)AI推理需求不斷增長(zhǎng),Arm既有Helium 技術(shù)使 CPU 能夠執(zhí)行更多計(jì)算密集型的 AI 推理算法,也有Ethos 系列 AI 加速器,以
2024-04-16 09:10:17
6146 
電子發(fā)燒友網(wǎng)報(bào)道(文/梁浩斌)去年年底,多家大廠爆出開(kāi)發(fā)數(shù)據(jù)中心ASIC芯片的消息,包括傳聞蘋果與博通合作開(kāi)發(fā)面向AI推理的ASIC,亞馬遜也在年底公布了其AI?ASIC的應(yīng)用實(shí)例,展示出ASIC
2025-03-03 00:13:00
4388 
電子發(fā)燒友網(wǎng)報(bào)道(文 / 李彎彎)日前,谷歌在 Cloud Next 大會(huì)上,隆重推出了最新一代 TPU AI 加速芯片 ——Ironwood。據(jù)悉,該芯片預(yù)計(jì)于今年晚些時(shí)候面向 Google
2025-04-12 00:57:00
3397 設(shè)計(jì)及商業(yè)化。公司推出了面向企業(yè)級(jí)、消費(fèi)級(jí)、行業(yè)級(jí)三大類應(yīng)用場(chǎng)景的行業(yè)領(lǐng)先的NPU驅(qū)動(dòng)AI推理芯片相關(guān)產(chǎn)品及服務(wù),成功打造了從AI推理基礎(chǔ)設(shè)施構(gòu)建到產(chǎn)品設(shè)計(jì)、開(kāi)發(fā)及商業(yè)化落地的完整閉環(huán),實(shí)現(xiàn)了AI在多元場(chǎng)景的快速遷移。 ? ? 2024年?duì)I收超9億元,消費(fèi)級(jí)場(chǎng)景加速
2025-08-04 09:22:55
4335 
? ? 降低HBM依賴,華為發(fā)布AI推理創(chuàng)新技術(shù)UCM ? 日前,華為正式發(fā)布AI推理創(chuàng)新技術(shù)UCM(推理記憶數(shù)據(jù)管理器)。據(jù)了解,作為一款以KV Cache為中心的推理加速套件,UCM融合了多類型
2025-08-13 09:45:46
4115 電子發(fā)燒友網(wǎng)報(bào)道(文/莫婷婷)隨著AI技術(shù)迅猛發(fā)展,大模型的參數(shù)規(guī)模已突破千億級(jí)別,AI推理需求呈現(xiàn)出爆發(fā)式增長(zhǎng)。然而,在大模型加速落地的浪潮中,高效、穩(wěn)定且安全的推理能力日益凸顯為制約產(chǎn)業(yè)發(fā)展
2025-11-14 08:21:00
9924 
電子發(fā)燒友網(wǎng)報(bào)道(文/李彎彎)2025年,人工智能正式邁入應(yīng)用推理時(shí)代。大模型從實(shí)驗(yàn)室走向千行百業(yè),推理需求呈指數(shù)級(jí)爆發(fā)。然而,高昂的推理成本與有限的算力供給之間的矛盾日益凸顯,成為制約AI規(guī)模化
2025-12-11 08:57:00
7493 ai加速芯片,申耀的科技觀察讀懂科技,贏取未來(lái)!毫無(wú)疑問(wèn),以大數(shù)據(jù)分析、云計(jì)算、人工智能等新技術(shù)所推動(dòng)的數(shù)字化轉(zhuǎn)型正迅速的改變著我們所處的時(shí)代,其巨大的影響力已經(jīng)從量變上升為質(zhì)變,可以說(shuō)數(shù)字化轉(zhuǎn)型已成...
2021-07-28 07:53:56
CPU、GPU 和其他加速器的支持,簡(jiǎn)化了并行編程模型。
漸進(jìn)式類型系統(tǒng)
結(jié)合靜態(tài)類型檢查和類型推導(dǎo),既保證編譯時(shí)安全性,又保留動(dòng)態(tài)類型的靈活性。
應(yīng)用場(chǎng)景
AI 與機(jī)器學(xué)習(xí)
用于訓(xùn)練大型模型和實(shí)時(shí)推理
2025-11-07 05:59:01
DLLite-Micro 是一個(gè)輕量級(jí)的 AI 推理框架,可以為 OpenHarmony OS 的輕量設(shè)備和小型設(shè)備提供深度模型的推理能力DLLite-Micro 向開(kāi)發(fā)者提供清晰、易上手的北向接口
2021-08-05 11:40:11
場(chǎng)景介紹
MindSpore Lite 是一款 AI 引擎,它提供了面向不同硬件設(shè)備 AI 模型推理的功能,目前已經(jīng)在圖像分類、目標(biāo)識(shí)別、人臉識(shí)別、文字識(shí)別等應(yīng)用中廣泛使用。
本文介紹
2023-12-14 11:41:13
首個(gè)獨(dú)立AI推理基準(zhǔn)測(cè)試 ——MLPerf Inference 0.5中取得第一名。由于推理一直是AI市場(chǎng)中最大、同時(shí)也是最具競(jìng)爭(zhēng)力的領(lǐng)域,業(yè)內(nèi)此前一直希望能夠有一套客觀的推理性能測(cè)試指標(biāo)。在參與
2019-11-08 19:44:51
首先感謝電子發(fā)燒友論壇提供的書(shū)籍和閱讀評(píng)測(cè)的機(jī)會(huì)。
拿到書(shū),先看一下封面介紹。這本書(shū)的中文名是《AI加速器架構(gòu)設(shè)計(jì)與實(shí)現(xiàn)》,英文名是Accelerator Based on CNN Design
2023-09-17 16:39:45
項(xiàng)目名稱:AI圖像開(kāi)發(fā)試用計(jì)劃:申請(qǐng)理由本人在AI圖像識(shí)別中已有一年的開(kāi)發(fā)經(jīng)驗(yàn),目前正采用瑞芯微的rk1808芯片進(jìn)行模型的落地部署,但是該芯片沒(méi)有任何的攝像頭方案,需要自己選取。目前選取的攝像頭在
2020-09-25 10:11:50
會(huì)對(duì)關(guān)鍵源碼進(jìn)行解析。
一、Vitis AI Library簡(jiǎn)介
上一篇帖子中,我們了解了Vitis統(tǒng)一軟件平臺(tái)和Vitis AI,并體驗(yàn)了Vitis AI Runtime的Resnet50圖像分類示例
2023-10-06 23:32:47
模態(tài)的技術(shù)特性,DeepSeek正加速推動(dòng)AI在金融、政務(wù)、科研及網(wǎng)絡(luò)智能化等關(guān)鍵領(lǐng)域的深度應(yīng)用。 信而泰:AI推理引擎賦能網(wǎng)絡(luò)智能診斷新范式信而泰深度整合DeepSeek-R1大模型系統(tǒng),構(gòu)建了新一
2025-07-16 15:29:20
,機(jī)器的學(xué)習(xí)成效都遠(yuǎn)遠(yuǎn)超越人類了。機(jī)器所具有的AI智能是它自己學(xué)習(xí)來(lái)的,又能迅速精通。 然而從另一方面來(lái)看,機(jī)器的邏輯能力卻一直無(wú)法超越人類?;仡?b class="flag-6" style="color: red">一下AI的發(fā)展歷史,自從1950年代,許多專家們就是希望將
2021-01-04 10:16:36
你好我使用 STM32CUBE-AI v5.1.2 ApplicationTemplate 將簡(jiǎn)單的 CNN 導(dǎo)入到 STM32L462RCT我發(fā)現(xiàn)壓縮模型對(duì)推理時(shí)間沒(méi)有影響。aiRun 程序在 8
2023-01-29 06:24:08
。K510是嘉楠公司推出的第二代AI加速芯片,它采用雙核RISC-V CPU@800Mhz,內(nèi)置DSP協(xié)處理器和強(qiáng)大的AI運(yùn)算單元KPU,支持 BF16浮點(diǎn)數(shù)據(jù)格式,可在邊緣端進(jìn)行高精度推理,是國(guó)內(nèi)少有
2022-11-22 15:52:15
基于SRAM的方法可加速AI推理
2020-12-30 07:28:28
隨著人工智能技術(shù)的飛速發(fā)展,深度學(xué)習(xí)大模型在各個(gè)領(lǐng)域得到了廣泛應(yīng)用。然而,大模型的推理過(guò)程對(duì)顯存和計(jì)算資源的需求較高,給實(shí)際應(yīng)用帶來(lái)了挑戰(zhàn)。為了解決這一問(wèn)題,本文將探討大模型推理顯存和計(jì)算量的估計(jì)
2025-07-03 19:43:59
在即將開(kāi)展的“中國(guó)移動(dòng)全球合作伙伴大會(huì)”上,華為將發(fā)布一款面向運(yùn)營(yíng)商電信領(lǐng)域的一站式AI開(kāi)發(fā)平臺(tái)——SoftCOM AI平臺(tái),幫助電信領(lǐng)域開(kāi)發(fā)者解決AI開(kāi)發(fā)在數(shù)據(jù)準(zhǔn)備、模型訓(xùn)練、模型發(fā)布以及部署驗(yàn)證
2021-02-25 06:53:41
Tengine是什么?如何在RK3399這一 Arm64 平臺(tái)上搭建 Tengine AI 推理框架,并運(yùn)行圖像識(shí)別相關(guān)應(yīng)用?
2022-03-07 07:53:43
Tengine是什么呢?如何在RK3399這一 Arm64平臺(tái)上搭建Tengine AI推理框架呢?
2022-03-04 12:31:35
步保駕護(hù)航。下面讓我們來(lái)了解如何不借助手動(dòng)工具或手動(dòng)編程來(lái)選擇模型、隨時(shí)隨地訓(xùn)練模型并將其無(wú)縫部署到TI處理器上,從而實(shí)現(xiàn)硬件加速推理。圖1: 邊緣AI應(yīng)用的開(kāi)發(fā)流程第1步:選擇模型邊緣AI系統(tǒng)開(kāi)發(fā)
2022-11-03 06:53:28
Network Runtime 神經(jīng)網(wǎng)絡(luò)運(yùn)行時(shí),作為中間橋梁連通上層AI推理框架和底層加速芯片,實(shí)現(xiàn)AI模型的跨芯片推理計(jì)算。提供統(tǒng)一AI芯片驅(qū)動(dòng)接口,使AI芯片驅(qū)動(dòng)能夠接入OpenHarmony系統(tǒng)
2024-04-11 16:14:55
一旦被訓(xùn)練完成,線上推理的效率才決定用戶體驗(yàn)。比如,有2個(gè)同樣AI模型的訓(xùn)練,一家公司用了1天訓(xùn)練完成,但線上推理的效率只有每秒100個(gè)任務(wù);另一家公司用了7天訓(xùn)練完成,但線上推理效率可以達(dá)到每秒
2021-09-17 17:08:32
1 簡(jiǎn)介AI任務(wù)管理與統(tǒng)一的推理能力提供了接口的統(tǒng)一標(biāo)準(zhǔn)系統(tǒng)上CPU提供了AI任務(wù)調(diào)度管理的能力,對(duì)AI的能力進(jìn)行了開(kāi)放的推理和推理,同時(shí),提供了一個(gè)不同的生命周期框架層級(jí)的應(yīng)用程序。推理接口
2022-03-25 11:15:36
商業(yè)發(fā)行之前就已經(jīng)過(guò)時(shí)了。算法明天需要對(duì)架構(gòu)、內(nèi)存/數(shù)據(jù)進(jìn)行徹底改革資源和能力。推理的夢(mèng)幻建筑重新定義重寫(xiě)在計(jì)算和交付突破性的人工智能加速和靈活的計(jì)算能力超越了服務(wù)器級(jí)CPU和比GPU/ASIC通用
2020-11-01 09:28:57
產(chǎn)品簡(jiǎn)介AIC-200是芯研通基于華為ATLAS 200 AI加速處理模塊推出的人工智能推理加速卡,內(nèi)部集成2顆ATLAS 200加速模塊,可提供高達(dá)44TOPS INT8算力。AIC-200采用
2022-03-29 11:30:56
堆疊構(gòu)建AI計(jì)算集群。4核ARMv8 64bit CPU@2.4GHz4個(gè)基于ManyCore計(jì)算架構(gòu)的異構(gòu)運(yùn)算加速簇, 12.8TOPS@INT818GB LPD
2022-11-17 14:03:31
尤里云科技推理運(yùn)算加速卡UXC2000內(nèi)置TF16110高性能異構(gòu)處理器及大容量?jī)?nèi)存,兼容各類標(biāo)準(zhǔn)外擴(kuò)式機(jī)架服務(wù)器,可直接提供業(yè)務(wù)層級(jí)的軟件交互接口。12.8TOPS@INT818GB
2022-11-17 14:05:09
產(chǎn)品簡(jiǎn)介AI推理服務(wù)器HS1208G1HS1208G1是華頡科技推出的一款支持單張全長(zhǎng)全高雙寬GPU的高性價(jià)比AI推理服務(wù)器,基于Intel企業(yè)級(jí)C246芯片組,可搭載Intel Xeon
2025-03-31 15:54:03
這篇文章的主角是 AlphaGo ,谷歌DeepMind團(tuán)隊(duì)開(kāi)發(fā)出的圍棋AI 。其憑借著2016年擊敗全球頂尖棋手李世石的壯舉而廣受矚目。下面就隨網(wǎng)絡(luò)通信小編一起來(lái)了解一下相關(guān)內(nèi)容吧。 圍棋是一
2018-03-25 10:03:00
11621 一文解析PLC的應(yīng)用,具體的跟隨小編一起來(lái)了解一下。
2018-07-19 11:21:56
6117 
芯文芯事丨瑞薩e-AI加速“實(shí)時(shí)”和“安全”,實(shí)現(xiàn)智能工廠
2019-07-02 14:11:52
2529 2019年12月18日— — NVIDIA于今日發(fā)布一款突破性的推理軟件。借助于該軟件,全球各地的開(kāi)發(fā)者都可以實(shí)現(xiàn)會(huì)話式AI應(yīng)用,大幅減少推理延遲。而此前,巨大的推理延遲一直都是實(shí)現(xiàn)真正交互式互動(dòng)的一大阻礙。
2019-12-19 10:06:51
1571 英偉達(dá)發(fā)布了一款突破性的推理軟件,借助于這款軟件,全球各地的開(kāi)發(fā)者都可以實(shí)現(xiàn)會(huì)話式AI應(yīng)用,大幅減少推理延遲。而此前,巨大的推理延遲一直都是實(shí)現(xiàn)真正交互式互動(dòng)的一大阻礙。
2020-02-03 15:51:48
829 的TensorRT推理引擎及其用于深度學(xué)習(xí)的CUDA/ cuDNN加速庫(kù),以及用于Jetson模塊的NVIDIAJetPack工具套件。
2020-07-02 15:00:54
2470 雖然推理加速器最初用于數(shù)據(jù)中心,但它們已經(jīng)迅速發(fā)展到應(yīng)用程序的邊緣推理,如自動(dòng)駕駛和醫(yī)學(xué)成像。通過(guò)這種轉(zhuǎn)變,客戶發(fā)現(xiàn),同樣的加速器,在數(shù)據(jù)中心處理圖像很順利,但移到邊緣推斷方面卻顯得糟糕。其實(shí)原因很簡(jiǎn)單:一個(gè)處理數(shù)據(jù)池,而另一個(gè)處理的是數(shù)據(jù)流。
2020-09-19 11:31:44
2334 9月2日,歐洲航天局發(fā)射了46顆大小與臺(tái)式機(jī)相當(dāng)?shù)膶?shí)驗(yàn)衛(wèi)星,其中一顆名為“PhiSat-1”的實(shí)驗(yàn)衛(wèi)星搭載了新款高光譜熱像儀,具備機(jī)載AI處理能力——衛(wèi)星具備硬件加速AI推理能力,這還是第一次。
2020-10-22 09:46:13
1954 的 AI 應(yīng)用需要經(jīng)歷訓(xùn)練和推理兩個(gè)過(guò)程。所謂“訓(xùn)練”,就是我們要將大量的數(shù)據(jù)代入到神經(jīng)網(wǎng)絡(luò)模型中運(yùn)算并反復(fù)迭代,“教會(huì)”算法模型如何正確的工作,訓(xùn)練出一個(gè) DL 模型。而接下來(lái),我們就可以利用訓(xùn)練出來(lái)的模型來(lái)在線響應(yīng)用戶的
2020-10-30 12:17:37
854 為了讓更多的工程師迅速掌握這個(gè)高性能的加速工具,英偉達(dá)將聯(lián)合生態(tài)合作伙伴,面向全國(guó)開(kāi)發(fā)者們發(fā)起TensorRT加速AI推理hackathon 2021大賽。
2021-03-21 10:04:22
3462 
如今在嵌入式開(kāi)發(fā)領(lǐng)域,如何實(shí)現(xiàn)嵌入式AI推理是一個(gè)熱門話題。其中,如何在低算力、低功耗、低成本的MCU上部署AI應(yīng)用,是開(kāi)發(fā)者普遍面臨的一個(gè)設(shè)計(jì)“痛點(diǎn)”。 在硬件方面,MCU自身性能的局限性限制了
2021-06-06 18:05:46
3354 據(jù) IDC 研究顯示,到 2024 年,AI 服務(wù)器市場(chǎng)市值預(yù)計(jì)將超 260 億美元,年增長(zhǎng)率將達(dá) 13.7%。在中心和邊緣的基礎(chǔ)架構(gòu)中,Ampere 的客戶正在尋找解決方案,以管理 AI 推理任務(wù)成本和不斷增長(zhǎng)的需求。
2021-08-05 15:36:41
978 騰訊一直積極地推動(dòng)強(qiáng)化學(xué)習(xí)在游戲AI領(lǐng)域的發(fā)展,并在2019年推出了“開(kāi)悟”AI開(kāi)放研究平臺(tái),提供不同游戲的訓(xùn)練場(chǎng)景、支撐AI進(jìn)行強(qiáng)化訓(xùn)練的大規(guī)模算力、統(tǒng)一的強(qiáng)化學(xué)習(xí)框架以加速研發(fā)速度、通用的訓(xùn)練
2021-10-22 09:23:24
2251 軟件的新功能,該軟件為所有AI模型和框架提供跨平臺(tái)推理;同時(shí)也包含對(duì)NVIDIA TensorRT的更新,該軟件優(yōu)化AI模型并為NVIDIA GPU上的高性能推理提供運(yùn)行時(shí)優(yōu)化。 NVIDIA還推出了NVIDIA A2 Tensor Core GPU,這是一款用于邊
2021-11-12 14:42:53
2690 自第一代云端AI推理加速卡“云燧i10”發(fā)布后,燧原科技在構(gòu)建原始創(chuàng)新的通用算力和自主生態(tài)上付出了卓絕的努力。
2021-12-07 15:29:23
933 
2021年12月,燧原科技重磅發(fā)布第二代云端人工智能推理加速卡“云燧i20”——這是時(shí)隔僅五個(gè)月,繼今年7月發(fā)布云端人工智能訓(xùn)練加速卡“云燧T20”之后,燧原科技又推出的全新一代針對(duì)云端推理場(chǎng)景的AI加速產(chǎn)品。
2021-12-09 15:16:17
2577 i20”,這是時(shí)隔僅五個(gè)月,繼今年7月發(fā)布云端人工智能訓(xùn)練加速卡“云燧T20”之后,燧原科技又推出的全新一代針對(duì)云端推理場(chǎng)景的AI加速產(chǎn)品。 ? 燧原科技CEO趙立東和COO張亞林發(fā)布第二代云端AI推理產(chǎn)品 ? 燧原科技CEO趙立東在發(fā)布會(huì)上表示,我們的
2021-12-09 13:12:00
6363 
NVIDIA Clara Holoscan 為開(kāi)發(fā)人員提供了一個(gè)可擴(kuò)展的醫(yī)療設(shè)備計(jì)算平臺(tái),以創(chuàng)建人工智能微服務(wù)并實(shí)時(shí)提供見(jiàn)解。該平臺(tái)優(yōu)化了數(shù)據(jù)管道的每個(gè)階段:從高帶寬數(shù)據(jù)流和基于物理的分析到加速 AI 推理和圖形可視化。
2022-04-15 14:45:29
1833 
網(wǎng)易互娛 AI Lab 的研發(fā)人員,基于 Wenet 語(yǔ)音識(shí)別工具進(jìn)行優(yōu)化和創(chuàng)新,利用 NVIDIA Triton 推理服務(wù)器的 GPU Batch Inference 機(jī)制加速了語(yǔ)音識(shí)別的速度,并且降低了成本。
2022-05-13 10:40:19
2805 SiFive 將 RISC-V 處理器 IP 引入其下一代 AI 推理加速器,為邊緣設(shè)備中的計(jì)算機(jī)視覺(jué)和語(yǔ)音提供更快、更高效的計(jì)算能力。
2022-05-31 10:47:55
1432 客戶對(duì)基準(zhǔn)推理學(xué)習(xí)曲線的最后階段是開(kāi)發(fā)自己的模型,使用通常來(lái)自 Nvidia 或數(shù)據(jù)中心的訓(xùn)練硬件/軟件,然后在可能的目標(biāo)推理加速器上對(duì)該模型進(jìn)行基準(zhǔn)測(cè)試。
2022-06-06 16:02:21
1935 最新的 AI 推理基準(zhǔn)顯然具有重要意義,因?yàn)樗悄壳翱捎玫淖罱咏鎸?shí)世界 AI 推理性能的衡量標(biāo)準(zhǔn)。但隨著它的成熟和吸引更多的提交,它也將成為成功部署技術(shù)堆棧的晴雨表和新實(shí)施的試驗(yàn)場(chǎng)。
2022-07-08 15:37:55
2384 
SiFive 將 RISC-V 處理器 IP 引入其下一代 AI 推理加速器,為邊緣設(shè)備中的計(jì)算機(jī)視覺(jué)和語(yǔ)音提供更快、更高效的計(jì)算能力。RISC-V 處理器的高靈活性和強(qiáng)大功能使客戶能夠以比傳統(tǒng)技術(shù)更簡(jiǎn)單和更快的速度創(chuàng)建智能城市、智能零售和汽車等復(fù)雜的人工智能應(yīng)用程序。
2022-07-11 11:07:06
1210 瑞薩電子開(kāi)發(fā)了一種新的內(nèi)存處理器 (PIM) 技術(shù),用于在低功耗邊緣設(shè)備中加速 AI 推理。用于基于 SRAM 技術(shù)的測(cè)試芯片實(shí)現(xiàn)了 8.8 TOPS/W 的運(yùn)行卷積神經(jīng)網(wǎng)絡(luò) (CNN) 工作負(fù)載
2022-07-21 15:50:32
2009 當(dāng) AI 設(shè)計(jì)人員將硬件加速器整合到用于訓(xùn)練和推理應(yīng)用的定制芯片中時(shí),應(yīng)考慮以下四個(gè)因素
2022-08-19 11:35:55
2386 
SiFive 將 RISC-V 處理器 IP 引入其下一代 AI 推理加速器,為邊緣設(shè)備中的計(jì)算機(jī)視覺(jué)和語(yǔ)音提供更快、更高效的計(jì)算能力。
2022-08-16 11:24:05
1689 騰訊云計(jì)算加速套件 TACO Kit 包含 TACO Train 和 TACO Infer 兩個(gè) AI 組件?;?GPU 異構(gòu)計(jì)算平臺(tái)針對(duì)業(yè)界 AI 訓(xùn)練和推理任務(wù)進(jìn)行了全方位的加速優(yōu)化。TACO
2022-08-31 09:24:07
2284 一方面,有廣泛使用的基于CPU和GPU的解決方案。另一方面,許多推理處理器通常專門作為視覺(jué)處理器。
2022-08-31 09:42:34
2595 
螞蟻鏈 AIoT 團(tuán)隊(duì)與 NVIDIA 合作,將量化感知訓(xùn)練(QAT)技術(shù)應(yīng)用于深度學(xué)習(xí)模型性能優(yōu)化中,并通過(guò) NVIDIA TensorRT 高性能推理 SDK 進(jìn)行高效率部署, 通過(guò) INT8 推理, 吞吐量提升了 3 倍, 助力螞蟻鏈版權(quán) AI 平臺(tái)中的模型推理服務(wù)大幅降本增效。
2022-09-09 09:53:52
1845 加速AI推理模型已成為一項(xiàng)基本任務(wù),因?yàn)槲覀冋鴦?chuàng)建更復(fù)雜,更高效的AI應(yīng)用程序邁進(jìn)。靈活和完整的AI輔助是在快速增長(zhǎng)的AI領(lǐng)域取得成功的關(guān)鍵組成部分。
2022-10-19 09:08:50
1015 電子發(fā)燒友網(wǎng)站提供《基于AdderNet的深度學(xué)習(xí)推理加速器.zip》資料免費(fèi)下載
2022-10-31 11:12:28
0 研華自從發(fā)布VEGA-300系列以來(lái),產(chǎn)品引起良好市場(chǎng)反響。截至2022年,產(chǎn)品性能已較前一代產(chǎn)品提升10倍,可提供強(qiáng)大的圖形圖像計(jì)算能力。用戶可通過(guò)搭配Edge AI Suite軟件工具包,輕松地將VEGA AI加速模塊集成到現(xiàn)有嵌入式板卡和系統(tǒng)中,進(jìn)行AI推理。
2022-11-01 15:51:08
1497 行體驗(yàn) FastDeploy! 全場(chǎng)景高性能 AI 部署工具 FastDeploy 人工智能技術(shù)在各行各業(yè)正加速應(yīng)用落地。為了向開(kāi)發(fā)者提供產(chǎn)業(yè)實(shí)踐推理部署最優(yōu)解,百度飛槳發(fā)起了
2022-12-13 19:50:05
2193 低門檻玩轉(zhuǎn)X3派AI算法推理
2022-07-18 14:24:30
1698 
自動(dòng)駕駛的最優(yōu) AI 推理流水線設(shè)計(jì)
2023-07-05 16:30:41
1504 
AI推理平臺(tái)是一種基于人工智能技術(shù)的視頻分析工具,可以通過(guò)分析視頻內(nèi)容,提取其中的關(guān)鍵信息,從而幫助用戶實(shí)現(xiàn)自動(dòng)化的視頻處理和管理。這種系統(tǒng)通常包括視頻識(shí)別、內(nèi)容分類、目標(biāo)檢測(cè)、場(chǎng)景分析、行為識(shí)別等
2023-05-22 15:53:55
3789 
vLLM是一個(gè)開(kāi)源的大模型推理加速框架,通過(guò)PagedAttention高效地管理attention中緩存的張量,實(shí)現(xiàn)了比HuggingFace Transformers高14-24倍的吞吐量。
2023-10-10 15:09:58
7490 
昆侖芯科技公眾號(hào)全新欄目“用芯指南”重磅推出!面向AI行業(yè)技術(shù)從業(yè)者,系列好文將提供手把手的昆侖芯產(chǎn)品使用指南。第一期圍繞昆侖芯自研效能工具——昆侖芯Anyinfer展開(kāi),這是一款基于昆侖芯AI加速卡的高效模型推理部署框架。種種行業(yè)痛點(diǎn),昆侖芯Anyinfer輕松搞定。
2023-10-17 11:16:43
3136 
由 CSDN 舉辦的 NVIDIA AI Inference Day - 大模型推理線上研討會(huì),將幫助您了解 NVIDIA 開(kāi)源大型語(yǔ)言模型(LLM)推理加速庫(kù) TensorRT-LLM ?及其功能
2023-10-26 09:05:02
684 圖形處理單元(GPU)、張量處理單元(TPU)和其他類型的專用集成電路(ASIC)通過(guò)提供并行處理能力來(lái)實(shí)現(xiàn)高性能計(jì)算,以滿足加速人工智能(AI)訓(xùn)練和推理工作負(fù)載的需求。
2023-11-16 17:23:58
1826 
這家云計(jì)算巨頭的計(jì)算機(jī)視覺(jué)和數(shù)據(jù)科學(xué)服務(wù)使用 NVIDIA Triton 推理服務(wù)器來(lái)加速 AI 預(yù)測(cè)。
2024-02-29 14:04:40
1458 英特爾助力京東云用CPU加速AI推理,以大模型構(gòu)建數(shù)智化供應(yīng)鏈
2024-05-27 11:50:10
1046 
近日,全球科技圈再次掀起波瀾。據(jù)外媒最新報(bào)道,被譽(yù)為明星AI芯片獨(dú)角獸的Cerebras Systems,已經(jīng)悄然向證券監(jiān)管機(jī)構(gòu)遞交了首次公開(kāi)募股(IPO)的秘密申請(qǐng)。這一動(dòng)作無(wú)疑為當(dāng)前火爆的AI芯片市場(chǎng)再添一把火。
2024-06-27 17:44:20
1251 LLM(大型語(yǔ)言模型)大模型推理加速是當(dāng)前人工智能領(lǐng)域的一個(gè)研究熱點(diǎn),旨在提高模型在處理復(fù)雜任務(wù)時(shí)的效率和響應(yīng)速度。以下是對(duì)LLM大模型推理加速關(guān)鍵技術(shù)的詳細(xì)探討,內(nèi)容將涵蓋模型壓縮、解碼方法優(yōu)化、底層優(yōu)化、分布式并行推理以及特定框架和工具的應(yīng)用等方面。
2024-07-24 11:38:19
3037 提高成本效率。HyperAccel 針對(duì)新興的生成式 AI 應(yīng)用提供超級(jí)加速的芯片 IP/解決方案。HyperAccel 已經(jīng)打造出一個(gè)快速、高效且低成本的推理系統(tǒng),加速了基于轉(zhuǎn)換器的大型語(yǔ)言模型
2024-09-18 09:37:26
1202 
麗蟾科技通過(guò) Leaper 資源管理平臺(tái)集成 NVIDIA AI Enterprise,為企業(yè)和科研機(jī)構(gòu)提供了一套高效、靈活的 AI 訓(xùn)練與推理加速解決方案。無(wú)論是在復(fù)雜的 AI 開(kāi)發(fā)任務(wù)中,還是在高并發(fā)推理場(chǎng)景下,都能夠確保項(xiàng)目的順利進(jìn)行,并顯著提升業(yè)務(wù)效率與創(chuàng)新能力。
2024-10-27 10:03:25
1765 
隨著現(xiàn)在AI的快速發(fā)展,使用FPGA和ASIC進(jìn)行推理加速的研究也越來(lái)越多,從目前的市場(chǎng)來(lái)說(shuō),有些公司已經(jīng)有了專門做推理的ASIC,像Groq的LPU,專門針對(duì)大語(yǔ)言模型的推理做了優(yōu)化,因此相比GPU這種通過(guò)計(jì)算平臺(tái),功耗更低、延遲更小,但應(yīng)用場(chǎng)景比較單一,在圖像/視頻方向就沒(méi)有優(yōu)勢(shì)了。
2024-10-29 14:12:01
2772 
生成式 AI 和 AI 智能體推理將推動(dòng) AI 計(jì)算基礎(chǔ)設(shè)施從邊緣云向中心云分布的需求。IDC 預(yù)測(cè)“到 2030 年,商業(yè) AI(不包括消費(fèi)者)將為全球經(jīng)濟(jì)貢獻(xiàn) 19.9 萬(wàn)億美元,并且占到 GDP 的 3.5%。”
2024-11-19 14:57:03
3525 
(reasoning)能力,這一轉(zhuǎn)變將極大推動(dòng)上層應(yīng)用的發(fā)展。 紅杉資本近期指出,在可預(yù)見(jiàn)的未來(lái),邏輯推理和推理時(shí)計(jì)算將是一個(gè)重要主題,并開(kāi)啟生成式AI的下一階段。新一輪競(jìng)賽已然開(kāi)始。 那么,在推理這一
2025-01-20 11:16:36
1338 
NVIDIA推理平臺(tái)提高了 AI 推理性能,為零售、電信等行業(yè)節(jié)省了數(shù)百萬(wàn)美元。
2025-02-08 09:59:03
1512 
電子發(fā)燒友網(wǎng)站提供《一文解析工業(yè)互聯(lián)網(wǎng).pptx》資料免費(fèi)下載
2025-02-20 16:42:51
1 ——Oracle 和 NVIDIA 今日宣布,NVIDIA 加速計(jì)算和推理軟件與 Oracle 的 AI 基礎(chǔ)設(shè)施以及生成式 AI 服務(wù)首次實(shí)現(xiàn)集成,以幫助全球企業(yè)組織加速創(chuàng)建代理式 AI 應(yīng)用。 ? 此次
2025-03-19 15:24:36
504 
Triton 推理服務(wù)器的后續(xù)產(chǎn)品,NVIDIA Dynamo 是一款全新的 AI 推理服務(wù)軟件,旨在為部署推理 AI 模型的 AI 工廠最大化其 token 收益。它協(xié)調(diào)并加速數(shù)千個(gè) GPU 之間的推理通信,并使用分離服務(wù)將大語(yǔ)
2025-03-20 15:03:55
1120 Oracle 數(shù)據(jù)庫(kù)與 NVIDIA AI 相集成,使企業(yè)能夠更輕松、快捷地采用代理式 AI Oracle 和 NVIDIA 宣布,NVIDIA 加速計(jì)算和推理軟件與 Oracle 的 AI
2025-03-21 12:01:55
1268 
創(chuàng)新技術(shù)——UCM推理記憶數(shù)據(jù)管理器,旨在推動(dòng)AI推理體驗(yàn)升級(jí),提升推理性價(jià)比,加速AI商業(yè)正循環(huán)。同時(shí),華為攜手中國(guó)銀聯(lián)率先在金融典型場(chǎng)景開(kāi)展UCM技術(shù)試點(diǎn)應(yīng)用,并聯(lián)合發(fā)布智慧金融AI推理加速方案應(yīng)用成果。
2025-08-15 09:45:05
1090 產(chǎn)品組合,覆蓋從1.5B至32B參數(shù)規(guī)模的端側(cè)AI模型推理需求,滿足工業(yè)、消費(fèi)電子、智能終端等多樣化場(chǎng)景的部署需求,推動(dòng)AI技術(shù)從云端向邊緣高效落地?!昂?b class="flag-6" style="color: red">一”AI加速計(jì)
2025-09-15 11:53:00
2011 
我們正在參加全球電子成就獎(jiǎng)的評(píng)選,歡迎大家?guī)臀覀兺镀薄x謝支持很多人聽(tīng)過(guò)“大模型”,但沒(méi)搞懂兩件事。我們總說(shuō)AI有多強(qiáng),但真正決定AI能否落地的,是它的兩個(gè)階段:訓(xùn)練(Training)和推理
2025-09-19 11:58:22
1913 
NVIDIA 的數(shù)據(jù)工廠團(tuán)隊(duì)為 NVIDIA Cosmos Reason 等 AI 模型奠定了基礎(chǔ),該模型近日在 Hugging Face 的物理推理模型排行榜中位列榜首。
2025-09-23 15:19:23
1043 AI產(chǎn)業(yè)已從“追求模型能力極限”轉(zhuǎn)向“追求推理體驗(yàn)最優(yōu)化”,推理體驗(yàn)決定用戶與AI的交互質(zhì)感。當(dāng)前推理應(yīng)用快速發(fā)展,Token調(diào)用量爆發(fā)式增長(zhǎng),推理遇到“推不動(dòng)、推得慢、推得貴”三大瓶頸,成為產(chǎn)業(yè)
2025-11-28 10:03:31
254 
電子發(fā)燒友網(wǎng)報(bào)道(文/黃晶晶)近幾年,生成式AI引領(lǐng)行業(yè)變革,AI訓(xùn)練率先崛起,帶動(dòng)高帶寬內(nèi)存HBM一飛沖天。但我們知道AI推理的廣泛應(yīng)用才能推動(dòng)AI普惠大眾。在AI推理方面,業(yè)內(nèi)巨頭、初創(chuàng)公司等都
2025-03-03 08:51:57
2682 
評(píng)論