91欧美超碰AV自拍|国产成年人性爱视频免费看|亚洲 日韩 欧美一厂二区入|人人看人人爽人人操aV|丝袜美腿视频一区二区在线看|人人操人人爽人人爱|婷婷五月天超碰|97色色欧美亚州A√|另类A√无码精品一级av|欧美特级日韩特级

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫(xiě)文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

AI芯片技術(shù)的選型說(shuō)明

DzOH_ele ? 來(lái)源:中國(guó)人工智能產(chǎn)業(yè)發(fā)展聯(lián) ? 作者:中國(guó)人工智能產(chǎn)業(yè) ? 2020-09-01 10:20 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

一、背景與意義

當(dāng)前隨著人工智能理論和技術(shù)的日益成熟,應(yīng)用范圍不斷擴(kuò)大,目前已廣泛應(yīng)用于計(jì)算機(jī)科學(xué)、金融貿(mào)易、醫(yī)藥、診斷、重工業(yè)、運(yùn)輸、遠(yuǎn)程通訊、在線和電話服務(wù)、法律、科學(xué)發(fā)現(xiàn)、玩具和游戲、音樂(lè)等諸多方面。

算力作為承載人工智能應(yīng)用的平臺(tái)和基礎(chǔ),其發(fā)展推動(dòng)了整個(gè)人工智能系統(tǒng)的進(jìn)步和快速演進(jìn),是人工智能最核心的要素之一。以人工智能應(yīng)用為主要任務(wù)的,面向智能計(jì)算的處理器的相關(guān)設(shè)計(jì)方法與技術(shù)已成為國(guó)內(nèi)外工業(yè)界和學(xué)術(shù)界共同角逐的熱點(diǎn),國(guó)內(nèi)外企業(yè)紛紛布局AI芯片。

AI芯片的應(yīng)用場(chǎng)景不再局限于云端,部署于智能手機(jī)、安防攝像頭、及自動(dòng)駕駛汽車(chē)等終端的各項(xiàng)產(chǎn)品日趨豐富。除了追求性能提升外,AI芯片也逐漸專(zhuān)注于特殊場(chǎng)景的優(yōu)化。

為了進(jìn)一步促進(jìn)供需對(duì)接,為AI芯片供應(yīng)商和需求商提供交流的平臺(tái),中國(guó)人工智能產(chǎn)業(yè)發(fā)展聯(lián)盟(以下簡(jiǎn)稱(chēng)“AIIA”或聯(lián)盟)計(jì)算架構(gòu)與芯片推進(jìn)組啟動(dòng)“AI芯片技術(shù)選型目錄”(以下簡(jiǎn)稱(chēng)“選型目錄”)的工作,希望為AI芯片的可持續(xù)發(fā)展,服務(wù)和促進(jìn)相關(guān)產(chǎn)業(yè)發(fā)展壯大貢獻(xiàn)一份力量。

人工智能芯片按照目前的應(yīng)用場(chǎng)景來(lái)看,主要分為訓(xùn)練和推斷兩類(lèi)場(chǎng)景,按部署位置又可分為云端、邊緣和終端。AIIA“AI芯片技術(shù)選型目錄”具體根據(jù)應(yīng)用場(chǎng)景與部署位置,包含云端訓(xùn)練、基于云端、邊緣和終端推斷的四大產(chǎn)品形態(tài)。又依據(jù)行業(yè)應(yīng)用,AI芯片技術(shù)選型目錄根據(jù)垂直應(yīng)用場(chǎng)景如圖3所示給出。

AI芯片根據(jù)行業(yè)應(yīng)用分類(lèi)圖

二、云端訓(xùn)練

技術(shù)概述

百度昆侖1芯片面向AI通用計(jì)算,基于百度XPU架構(gòu),既可以用于訓(xùn)練,也可以用于推理,能全面支持語(yǔ)音,圖像,自然語(yǔ)言處理等應(yīng)用。

技術(shù)指標(biāo)百度昆侖1芯片基于百度XPU架構(gòu),采用三星14nm工藝,HBM2和PCIE4.0等技術(shù),給用戶(hù)提供高性能、高帶寬、低功耗、高靈活性、高度可編程等優(yōu)勢(shì)。

產(chǎn)品信息

應(yīng)用案例

百度ERNIE模型,應(yīng)用于翻譯、搜索排序等場(chǎng)景。百度網(wǎng)盤(pán)里的圖像模型;百度云主機(jī);百度云的工業(yè)質(zhì)檢客戶(hù)。

產(chǎn)品特征/技術(shù)特點(diǎn)

1.高性能,峰值256Tops;

2.高帶寬,片外內(nèi)存帶寬512GB/s;

3.高度可編程性,能提供C/C++的編程,用戶(hù)可以自由開(kāi)發(fā)自己的算子。

上海燧原科技有限公司-邃思通用人工智能訓(xùn)練芯片

技術(shù)概述

邃思芯片集成神經(jīng)元處理器架構(gòu)和數(shù)據(jù)處理引擎,通過(guò)可編程的通用張量/向量運(yùn)算核心,支持各類(lèi)數(shù)據(jù)精度的主流深度學(xué)習(xí)訓(xùn)練負(fù)載。

技術(shù)指標(biāo)

邃思芯片采用12nmFinFET工藝,2.5D封裝,總計(jì)141億個(gè)晶體管。其宣稱(chēng)單芯片提供20TFLOPS@FP32及80TFLOPS@BF16/FP16的算力,最大功耗190W。

邃思芯片主要技術(shù)特點(diǎn)包括:自主指令集的神經(jīng)元處理器(SIP),可編程的通用張量/向量運(yùn)算核心,支持張量/向量/標(biāo)量計(jì)算;神經(jīng)元處理集群(SIC),由8個(gè)神經(jīng)元處理器構(gòu)成,4MB共享集群緩存;自主研發(fā)2.5D封裝,集成16GBHBM存儲(chǔ),提供512GB/s帶寬;自主ESL(燧原智能互聯(lián),Enflame SmartLink)片間互聯(lián)引擎,每通道雙向50GB/s,4通道總共200GB/s接口帶寬,通道延時(shí)小于1μs;系統(tǒng)穩(wěn)定性控制,支持服務(wù)器級(jí)別RAS需求。支持CNN、RNN、LSTM、BERT等網(wǎng)絡(luò)模型

產(chǎn)品信息

產(chǎn)品特征/技術(shù)特點(diǎn)

云燧T10是基于邃思芯片打造的人工智能訓(xùn)練加速卡,20TFLOPS@FP32,最大功耗225W,支持FP32/FP16/BF16/INT8/INT16/INT32等多種數(shù)據(jù)類(lèi)型;支持PCIe4.0接口,提供64GB帶寬以及200GB/s片間互聯(lián)帶寬;

計(jì)算和編程平臺(tái)主要包含分布式調(diào)度、軟件開(kāi)發(fā)包(SDK)和設(shè)備驅(qū)動(dòng)層,用戶(hù)可以將已有訓(xùn)練系統(tǒng),無(wú)縫遷移至邃思平臺(tái)上運(yùn)行,無(wú)需二次開(kāi)發(fā)或者模型轉(zhuǎn)換工作。

云燧T10人工智能訓(xùn)練加速卡面向云端數(shù)據(jù)中心,可廣泛應(yīng)用于互聯(lián)網(wǎng)、金融、教育、醫(yī)療、工業(yè)及政務(wù)等人工智能訓(xùn)練場(chǎng)景。

NVIDIA-NVIDIAA100/V100/T4Tensor Core GPUs

技術(shù)概述

為數(shù)據(jù)中心GPU,可加快AI、高性能計(jì)算(HPC)和圖形技術(shù)的發(fā)展。

技術(shù)指標(biāo)

NVIDIA Ampere GPU架構(gòu)配備540億個(gè)晶體管,為7納米芯片架構(gòu),集訓(xùn)練和推理于一身,具有多實(shí)例GPU、TF32、結(jié)構(gòu)化稀疏等特性。

NVIDIAVolta GPU架構(gòu)配備640個(gè)Tensor內(nèi)核,可提供每秒超過(guò)100萬(wàn)億次(TFLOPS)的深度學(xué)習(xí)性能,是上一代NVIDIA Pascal架構(gòu)的5倍以上。NVIDIA Turing GPU架構(gòu)支持實(shí)時(shí)光線追蹤、AI、模擬和光柵化技術(shù)。

應(yīng)用案例

利用NVIDIAA100/V100/T4GPU可以更快速地處理要求最嚴(yán)格的高性能計(jì)算(HPC)和超大規(guī)模數(shù)據(jù)中心工作負(fù)載。現(xiàn)在,數(shù)據(jù)科學(xué)家和研究人員可以在能源勘探和深度學(xué)習(xí)等應(yīng)用場(chǎng)合中解析PB級(jí)的數(shù)據(jù),速度比使用傳統(tǒng)CPU快幾個(gè)數(shù)量級(jí)。NVIDIA A100/V100/T4加速器可以超快速度運(yùn)行更大型的模擬。此外,NVIDIA GPU還能為虛擬桌面、應(yīng)用程序和工作站提供超高性能和用戶(hù)密度。

產(chǎn)品特征/技術(shù)特點(diǎn)

NVIDIA A100采用了NVIDIA Ampere架構(gòu)的突破性設(shè)計(jì),集AI訓(xùn)練和推理于一身,宣稱(chēng)其性能相比于前代產(chǎn)品提升了20倍。作為一款通用型工作負(fù)載加速器,A100還被設(shè)計(jì)用于數(shù)據(jù)分析、科學(xué)計(jì)算和云圖形。NVIDIAT4GPU推理加速器搭載NVIDIATuringTensorCore,提供多精度推理性能,以加速人工智能的各種應(yīng)用。

產(chǎn)品信息

賽靈思–Alveo

技術(shù)概述

賽靈思AlveoTM數(shù)據(jù)中心加速器卡專(zhuān)為現(xiàn)代數(shù)據(jù)中心多樣的應(yīng)用需求而設(shè)計(jì)。Alveo加速器卡可通過(guò)對(duì)加速資源的重新配置,適應(yīng)持續(xù)算法優(yōu)化,在降低總成本的同時(shí),靈活支持各類(lèi)工作負(fù)載。

賽靈思推出的Vitis統(tǒng)一軟件平臺(tái)為各類(lèi)軟件和AI推理應(yīng)用開(kāi)發(fā)提供統(tǒng)一編程模型,幫助用戶(hù)加速實(shí)現(xiàn)從C/C++、Python、Caffe、Tensor flow到差異化應(yīng)用落地的開(kāi)發(fā)過(guò)程。

技術(shù)指標(biāo)

賽靈思Alveo數(shù)據(jù)中心加速器卡基于Xilinx 16nm Ultra Scale架構(gòu),使用賽靈思堆疊硅片互聯(lián)(SSI)技術(shù)來(lái)實(shí)現(xiàn)FPGA容量、帶寬和功耗效率,通過(guò)結(jié)合多個(gè)超邏輯區(qū)域(SLR)來(lái)增大密度。

Alveo加速卡旨在加速服務(wù)器或工作站中的機(jī)器學(xué)習(xí)、數(shù)據(jù)分析和視頻處理等計(jì)算密集型應(yīng)用。Alveo U50卡采用XCU50 FPGA包括2個(gè)SLR,配備PCIe Gen4和8G HBM2,每秒100G網(wǎng)絡(luò)連接,以高效能75瓦、小尺寸形式為金融計(jì)算、機(jī)器學(xué)習(xí)、計(jì)算存儲(chǔ)以及數(shù)據(jù)搜索與分析工作負(fù)載提供優(yōu)化加速。

AlveoU200卡采用XCU200FPGA包括3個(gè)SLR,AlveoU250卡使用XCU250FPGA包括4個(gè)SLR。二者均可連接到PCIExpress的16個(gè)通道,最高運(yùn)行速度8GT/s(Gen3),也可以連接到4根DDR4 16GB 2400MT/s64位含糾錯(cuò)碼(ECC)的DIMM,總計(jì)64GB的DDR4。

應(yīng)用案例

Alveo加速卡已經(jīng)開(kāi)發(fā)和認(rèn)證的關(guān)鍵應(yīng)用涵蓋AI/ML、視頻轉(zhuǎn)碼、數(shù)據(jù)分析、金融風(fēng)險(xiǎn)建模、安全和基因組學(xué)等。Algo-Logic SystemsInc、Bigstream、Black LynxInc.、CTAccel、Falcon Computing、Maxeler Technologies、Mipsology、NGCodec、Skreens、Sum Up Analytics、Titan IC、Vitesse Data、VYUsync和Xelera Technologies等合作伙伴開(kāi)發(fā)完成的應(yīng)用已經(jīng)投入部署。此外,DellEMC、Fujitsu Limited和IBM等頂級(jí)OEM廠商也在同賽靈思合作,認(rèn)證采用Alveo加速器卡的多個(gè)服務(wù)器SKU。

Alveo-Mipsology,Zebra搭載Alveo

U50數(shù)據(jù)中心加速卡用于神經(jīng)網(wǎng)絡(luò)推理,板卡功耗75W,關(guān)鍵功能:快速卷積神經(jīng)網(wǎng)絡(luò)(CNN)推理——Zebra設(shè)立了新的性能標(biāo)準(zhǔn);支持所有神經(jīng)網(wǎng)絡(luò)——Zebra可加速任何CNN的所有層級(jí);易于使用——Zebra是“即插即用”的解決方案,無(wú)需對(duì)神經(jīng)網(wǎng)絡(luò)進(jìn)行修改或再訓(xùn)練;不改變軟件環(huán)境——無(wú)新語(yǔ)言、框架或工具。Zebra在TensorFlow、PyTorch、ONNX、Caffe和MXNet模型內(nèi)運(yùn)行;可擴(kuò)展性、靈活性和適應(yīng)性——Zebra可替代GPU或在任何位置補(bǔ)充CPU。

Alveo-SK電訊基于人工智能的實(shí)時(shí)物理入侵和盜竊檢測(cè)服務(wù),基于賽靈思Alveo U250加速器卡,可提供充足的吞吐量與精準(zhǔn)度

產(chǎn)品特征/技術(shù)特點(diǎn)

AlveoU50數(shù)據(jù)中心加速器卡采用賽靈思UltraScale+架構(gòu),使用半高半長(zhǎng)的外形尺寸和低于75瓦的低包絡(luò)功耗。該卡支持第四代PCIe及高帶寬存儲(chǔ)器(HBM2),每秒100G網(wǎng)絡(luò)連接,面向各種類(lèi)型的服務(wù)器部署。

AlveoU50加速器卡產(chǎn)品詳細(xì)介紹:

通過(guò)PCIe3.3V電源供電線提供的HBM2功耗僅限為10W。使用HBM2可實(shí)現(xiàn)的性能受限于此功耗限制,并且因設(shè)計(jì)而異。HBM2的額定帶寬為201GB/s。在不兼容PCIe的規(guī)格中,針對(duì)A-U50DD-P00G-ES3-G和A-U50-P00G-PQ-G卡測(cè)得的HBM2帶寬峰值為316GB/s。

AlveoU200和U250數(shù)據(jù)中心加速器卡采用PCIeGen3x16,設(shè)計(jì)用于加速高計(jì)算強(qiáng)度應(yīng)用,如機(jī)器學(xué)習(xí)、數(shù)據(jù)分析和視頻處理。

AlveoU280數(shù)據(jù)中心加速器卡專(zhuān)為計(jì)算和存儲(chǔ)工作負(fù)載而設(shè)計(jì),擁有8GBHBM2+32GB DDR4內(nèi)存、1.1MLUT、8.5kDSP片、每秒100G雙網(wǎng)絡(luò)連接,并支持第四代PCIe和CCIX互聯(lián)標(biāo)準(zhǔn)。

AlveoU280加速器卡產(chǎn)品詳細(xì)介紹:

產(chǎn)品信息

寒武紀(jì)科技股份有限公司-寒武紀(jì)思元100

技術(shù)概述

為云端推理提供運(yùn)算能力支撐

技術(shù)指標(biāo)

INT8算力32TOPS,內(nèi)置硬件編解碼引擎

應(yīng)用案例

計(jì)算機(jī)視覺(jué)、語(yǔ)音識(shí)別、自然語(yǔ)言處理。

產(chǎn)品信息


產(chǎn)品特征/技術(shù)特點(diǎn)

1.通用智能,支持計(jì)算機(jī)視覺(jué)、語(yǔ)音識(shí)別、自然語(yǔ)言處理等多模態(tài)智能處理;

2.針對(duì)深度學(xué)習(xí)定制的指令集和處理器架構(gòu),具有更優(yōu)的能效比;

3.完善軟件開(kāi)發(fā)環(huán)境NeuWare,包括應(yīng)用開(kāi)發(fā)、功能調(diào)試、性能調(diào)優(yōu)等。

中科寒武紀(jì)科技股份有限公司-寒武紀(jì)思元270

為高能效比AI推理設(shè)計(jì)的數(shù)據(jù)中心級(jí)PCIe智能加速卡。

技術(shù)指標(biāo)

支持多種精度,比上一代加速芯片計(jì)算能力提高4倍,INT8算力128TOPS。

應(yīng)用案例

廣泛支持視覺(jué)、語(yǔ)音、自然語(yǔ)言處理以及傳統(tǒng)機(jī)器學(xué)習(xí)等高度多樣化的人工智能應(yīng)用,幫助AI推理平臺(tái)實(shí)現(xiàn)高能效比。


產(chǎn)品特征/技術(shù)特點(diǎn)

1.支持INT16、INT8、INT4、FP32、FP16多種精度;2.內(nèi)置視頻和圖片編解碼器,有效降低CPU前處理負(fù)載和PCIe帶寬占用;3.計(jì)算彈性,支持多類(lèi)神經(jīng)網(wǎng)絡(luò),寒武紀(jì)Neuware軟件棧部署推理環(huán)境;4.可編程,基于Bang語(yǔ)言編程環(huán)境可對(duì)計(jì)算資源定制,滿足多樣化需求。

產(chǎn)品信息

北京比特大陸科技有限公司-比特大陸算豐TPU芯片BM1684

技術(shù)概述

BM1684是比特大陸面向深度學(xué)習(xí)領(lǐng)域自主研發(fā)的第三代張量處理器(TPU),是聚焦視頻圖像分析的云端及邊緣的人工智能推理芯片。

技術(shù)指標(biāo)

芯片:BM1684聚焦視頻圖像分析,是云端及邊緣的人工智能推理芯片;AI算力:17.6TOPSINT8,Winograd卷積加速下最高可達(dá)35.2TOPS,實(shí)測(cè)推理性能較上一代提升約5倍以上;AI架構(gòu):本芯片基于自主研發(fā)的TPU架構(gòu);典型功耗:16W;視頻解碼:支持H264/H265解碼,最大分辨率8192x8192,支持4K/8K。H264和H265解碼都支持32路高清30FPS@1080P,可處理數(shù)十路視頻智能分析全流程;

應(yīng)用案例

北京海淀城市大腦中的AI計(jì)算推理,百度大腦Paddle TPU計(jì)算集群,處理千路級(jí)別的高清視頻結(jié)構(gòu)化。福州長(zhǎng)樂(lè)區(qū)的AI算力中心TPU計(jì)算集群,處理上千路的高清視頻結(jié)構(gòu)化、人臉識(shí)別等。福州城市大腦的AI計(jì)算推理TPU計(jì)算集群,處理千路級(jí)別的高清視頻結(jié)構(gòu)化。

優(yōu)必達(dá)(Ubitus)的互聯(lián)網(wǎng)云端游戲AI加速TPU加速游戲中的圖像特征提取,畫(huà)面增強(qiáng),超分辨率等。

產(chǎn)品特征/技術(shù)特點(diǎn)

BM1684芯片技術(shù)特點(diǎn)是:

1)TPU芯片架構(gòu)自主研發(fā),相關(guān)專(zhuān)利申請(qǐng)達(dá)到270項(xiàng)以上;

2)性能功耗比高,在16W情況下,最高可達(dá)到35.2T性能(Winograd加速);

3)視頻解碼路數(shù)多,支持32路H264和H265高清30FPS@1080P硬解碼;

4)視頻全流程處理能力強(qiáng),可達(dá)到16~32路典型視頻結(jié)構(gòu)化/人臉?lè)治雎窋?shù);

5)AI工具鏈完備,Caffe,Tensorflow,PyTorch,MXNet,PaddlePaddle都支持;

6)部署場(chǎng)景靈活,云端和邊緣均可部署;

7)使用靈活,可工作于PCIE從設(shè)備模式或者SOC主設(shè)備模式;

板卡產(chǎn)品特色:

1)75W半高半長(zhǎng)PCIE小卡,峰值算力105.6T,無(wú)需外接供電;

2)宣稱(chēng)其性能趕上并部分超越英偉達(dá)推理GPUT4;

3)視頻解碼路數(shù)多,96路高清視頻30FPS解碼;

模組產(chǎn)品特色:

1)AI邊緣計(jì)算模組,17.6T/35.2T;

2)視頻解碼支持32路H264和H265高清30FPS@1080P硬解碼;

3)視頻全流程處理可達(dá)到16~32路典型視頻結(jié)構(gòu)化/人臉?lè)治觯?/p>

盒子產(chǎn)品特色:

1)AI邊緣計(jì)算盒子,17.6T/35.2T;

2)視頻全流程處理能力可達(dá)到16~32路典型視頻結(jié)構(gòu)化/人臉?lè)治觯?/p>

3)可室外部署,無(wú)風(fēng)扇散熱,-20℃至

+60℃寬溫;

4)接口支持USB/HDMI/RS-485/RS-

232等;

產(chǎn)品信息

深圳鯤云信息科技有限公司-星空x3加速卡

技術(shù)概述

星空X3加速卡為鯤云推出的面向邊緣端和數(shù)據(jù)中心進(jìn)行深度學(xué)習(xí)推斷的AI計(jì)算加速卡,搭載鯤云自研的定制數(shù)據(jù)流CAISA芯片,采用無(wú)指令集的架構(gòu)方式,為支持深度學(xué)習(xí)的邊緣和數(shù)據(jù)中心服務(wù)器提供計(jì)算加速方案。

技術(shù)指標(biāo)

支持ResNet、VGG、YOLO等多個(gè)主流

CNN算法模型提供Rain Builder編譯工具鏈,支持端到端算法開(kāi)發(fā)和部署支持Tensor Flow、Caffe、PyTorch及ONNX(MXNet)等主流深度學(xué)習(xí)框架開(kāi)發(fā)的算法模型其宣稱(chēng)芯片利用率可達(dá)95.4%

應(yīng)用案例

工業(yè)領(lǐng)域:鯤云與合作方針對(duì)某電容上激光刻蝕字符推出基于深度學(xué)習(xí)的OCR識(shí)別方案,識(shí)別算法采用了深度學(xué)習(xí)方法,可識(shí)別字母、數(shù)字以及數(shù)十種特殊字符,字符識(shí)別精度可達(dá)到99.99%。采用搭載鯤云CAISA芯片的星空加速卡,識(shí)別延遲可以降低到50ms,識(shí)別速度可達(dá)到20pcs/s。

電力領(lǐng)域

鯤云與合作方通過(guò)研究適用于電力無(wú)人機(jī)巡檢的目標(biāo)檢測(cè)深度學(xué)習(xí)算法,實(shí)現(xiàn)基于人工智能技術(shù)的電力無(wú)人機(jī)智能巡檢、數(shù)據(jù)采集,并在服務(wù)器端進(jìn)行高質(zhì)量的圖片數(shù)據(jù)分析,提高巡檢效率,降低巡檢工作量。

產(chǎn)品特征/技術(shù)特點(diǎn)

其宣稱(chēng)芯片利用率可達(dá)95.4%;時(shí)延:3ms分類(lèi)延時(shí)支持分類(lèi)、目標(biāo)檢測(cè)以及語(yǔ)義分割類(lèi)深度學(xué)習(xí)算法;Batchsize不敏感;溫度范圍:-20℃~70℃

實(shí)測(cè)Benchmark

產(chǎn)品信息

華為技術(shù)有限公司-昇騰310AI處理器

技術(shù)概述

昇騰AI處理器的主要架構(gòu)組成:芯片系統(tǒng)控制CPU(Control CPU)

AI計(jì)算引擎(包括AICore和AI CPU)多層級(jí)的片上系統(tǒng)緩存(Cache)或緩沖區(qū)(Buffer)數(shù)字視覺(jué)預(yù)處理模塊(Digital VisionPre-Processing,DVPP)等。

技術(shù)指標(biāo)

應(yīng)用案例

華為針對(duì)其昇騰AI芯片的計(jì)算架構(gòu)專(zhuān)門(mén)構(gòu)建了完整的軟件棧,兼容各個(gè)深度學(xué)習(xí)框架并能夠高效運(yùn)行在昇騰AI芯片上,讓開(kāi)發(fā)者能夠快速開(kāi)發(fā)推理應(yīng)用,為開(kāi)發(fā)者提供便利的解決方案。當(dāng)前主流的深度學(xué)習(xí)應(yīng)用,包括圖像分類(lèi)、人臉識(shí)別、目標(biāo)檢測(cè)、光學(xué)字符識(shí)別、視頻處理和自然語(yǔ)言處理領(lǐng)域的各個(gè)模型,均可以在昇騰310處理器上得到很好的技術(shù)支持。

產(chǎn)品特征/技術(shù)特點(diǎn)

達(dá)芬奇架構(gòu)主要由計(jì)算單元、存儲(chǔ)系統(tǒng)和控制單元三部分構(gòu)成。其中計(jì)算單元又分為:矩陣計(jì)算單元、向量計(jì)算單元、標(biāo)量計(jì)算單元,分別對(duì)應(yīng)矩陣、向量和標(biāo)量三種常見(jiàn)的計(jì)算模式。

矩陣計(jì)算單元(CubeUnit):矩陣計(jì)算單元和累加器主要完成矩陣相關(guān)運(yùn)算。一拍完成一個(gè)FP16的16x16與16x16矩陣乘(4096);如果是INT8輸入,則一拍完成16*32與32*16矩陣乘(8192);

向量計(jì)算單元(VectorUnit):實(shí)現(xiàn)向量和標(biāo)量,或雙向量之間的計(jì)算,功能覆蓋各種基本的計(jì)算類(lèi)型和許多定制的計(jì)算類(lèi)型,主要包括FP16/FP32/INT32/INT8等數(shù)據(jù)類(lèi)型的計(jì)算;

標(biāo)量計(jì)算單元(ScalarUnit):相當(dāng)于一個(gè)微型CPU,控制整個(gè)AICore的運(yùn)行,完成整個(gè)程序的循環(huán)控制、分支判斷,可以為Cube/Vector提供數(shù)據(jù)地址和相關(guān)參數(shù)的計(jì)算,以及基本的算術(shù)運(yùn)算。

產(chǎn)品信息

如需下載完整報(bào)告,請(qǐng)?jiān)诤笈_(tái)回復(fù)“報(bào)告”。

聲明:本文內(nèi)容及配圖由入駐作者撰寫(xiě)或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問(wèn)題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • 人工智能
    +關(guān)注

    關(guān)注

    1819

    文章

    50177

    瀏覽量

    266127
  • AI芯片
    +關(guān)注

    關(guān)注

    17

    文章

    2135

    瀏覽量

    36817

原文標(biāo)題:AI芯片技術(shù)選型目錄

文章出處:【微信號(hào):elecfanscom,微信公眾號(hào):核芯產(chǎn)業(yè)觀察】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評(píng)論

    相關(guān)推薦
    熱點(diǎn)推薦

    車(chē)載功放芯片精準(zhǔn)選型技術(shù)要點(diǎn)與華潤(rùn)微CD7377CZ/7388適配方案

    技術(shù)服務(wù)經(jīng)驗(yàn),從場(chǎng)景適配、參數(shù)解讀、實(shí)戰(zhàn)應(yīng)用三大核心維度,系統(tǒng)拆解車(chē)載功放芯片選型邏輯,并給出華潤(rùn)微CD7377CZ/7388的專(zhuān)屬適配方案,為車(chē)企研發(fā)與音響改裝從業(yè)者提供專(zhuān)業(yè)技術(shù)
    的頭像 發(fā)表于 12-31 15:39 ?510次閱讀

    車(chē)載功放芯片選型高頻問(wèn)題解答,看完秒懂)

    技術(shù)支持? 解答:選擇正規(guī)授權(quán)代理商是關(guān)鍵。深智微科技作為華潤(rùn)微授權(quán)代理商,所有 CD7377CZ 與 CD7388 芯片均直接對(duì)接原廠,確保正品貨源,附帶完整品質(zhì)認(rèn)證。同時(shí),我們提供全流程技術(shù)支持:從
    發(fā)表于 12-09 09:27

    【「AI芯片:科技探索與AGI愿景」閱讀體驗(yàn)】+AI芯片到AGI芯片

    、分布式群體智能 1)物聯(lián)網(wǎng)AGI系統(tǒng) 優(yōu)勢(shì): 組成部分: 2)分布式AI訓(xùn)練 7、發(fā)展重點(diǎn):基于強(qiáng)化學(xué)習(xí)的后訓(xùn)練與推理 8、超越大模型:神經(jīng)符號(hào)計(jì)算 三、AGI芯片的實(shí)現(xiàn) 1、技術(shù)需求 AI
    發(fā)表于 09-18 15:31

    【「AI芯片:科技探索與AGI愿景」閱讀體驗(yàn)】+AI的科學(xué)應(yīng)用

    配備科學(xué)發(fā)現(xiàn)仍需人類(lèi)的直覺(jué)和靈感 ④正價(jià)可解釋性和透明性 ⑤解決倫理和道德問(wèn)題六、AI芯片用于“AI科學(xué)家”系統(tǒng) AI芯片的作用:七、用量子
    發(fā)表于 09-17 11:45

    【「AI芯片:科技探索與AGI愿景」閱讀體驗(yàn)】+半導(dǎo)體芯片產(chǎn)業(yè)的前沿技術(shù)

    半導(dǎo)體芯片是現(xiàn)在世界的石油,它們推動(dòng)了經(jīng)歷、國(guó)防和整個(gè)科技行業(yè)。-------------帕特里克-基辛格。 AI的核心是一系列最先進(jìn)的半導(dǎo)體芯片。那么AI
    發(fā)表于 09-15 14:50

    【「AI芯片:科技探索與AGI愿景」閱讀體驗(yàn)】+AI芯片的需求和挑戰(zhàn)

    景嘉微電子、海光信息技術(shù)、上海復(fù)旦微電子、上海壁仞科技、上海燧原科技、上海天數(shù)智芯半導(dǎo)體、墨芯人工智能、沐曦集成電路等。 在介紹完這些云端數(shù)據(jù)中心的AI芯片之后,還為我們介紹了邊緣AI
    發(fā)表于 09-12 16:07

    【「AI芯片:科技探索與AGI愿景」閱讀體驗(yàn)】+可期之變:從AI硬件到AI濕件

    的不同。隨著AI熱潮的興起,大腦的抽象模型已被提煉成各種的AI算法,并使用半導(dǎo)體芯片技術(shù)加以實(shí)現(xiàn)。 而大腦是一個(gè)由無(wú)數(shù)神經(jīng)元通過(guò)突觸連接而成的復(fù)雜網(wǎng)絡(luò),是極其復(fù)雜和精密的。大腦在本質(zhì)上
    發(fā)表于 09-06 19:12

    【「AI芯片:科技探索與AGI愿景」閱讀體驗(yàn)】+內(nèi)容總覽

    AI芯片:科技探索與AGI愿景》這本書(shū)是張臣雄所著,由人民郵電出版社出版,它與《AI芯片:前沿技術(shù)與創(chuàng)新未來(lái)》一書(shū)是姊妹篇,由此可見(jiàn)作者在
    發(fā)表于 09-05 15:10

    AI 芯片浪潮下,職場(chǎng)晉升新契機(jī)?

    職場(chǎng)、渴望在專(zhuān)業(yè)領(lǐng)域更進(jìn)一步的人來(lái)說(shuō),AI 芯片與職稱(chēng)評(píng)審之間,實(shí)則有著千絲萬(wàn)縷的聯(lián)系,為職業(yè)晉升開(kāi)辟了新的路徑。 AI 芯片領(lǐng)域細(xì)分與職稱(chēng)對(duì)應(yīng) 目前,
    發(fā)表于 08-19 08:58

    2025端側(cè)AI芯片爆發(fā):存算一體、非Transformer架構(gòu)誰(shuí)主浮沉?邊緣計(jì)算如何選型?

    各位技術(shù)大牛好!最近WAIC 2025上端側(cè)AI芯片密集發(fā)布,徹底打破傳統(tǒng)算力困局。各位大佬在實(shí)際項(xiàng)目中都是如何選型的呢?
    發(fā)表于 07-28 14:40

    【書(shū)籍評(píng)測(cè)活動(dòng)NO.64】AI芯片,從過(guò)去走向未來(lái):《AI芯片:科技探索與AGI愿景》

    問(wèn)題請(qǐng)咨詢(xún)工作人員(微信:elecfans_666)。 AI芯片,從過(guò)去走向未來(lái) 四年前,市面上僅有的一本AI芯片全書(shū)在世界范圍內(nèi)掀起一陣求知熱潮,這本暢銷(xiāo)書(shū)就是《
    發(fā)表于 07-28 13:54

    語(yǔ)音識(shí)別芯片選型有哪些技術(shù)參數(shù)要注意

    語(yǔ)音識(shí)別芯片的使用場(chǎng)景越來(lái)越多涉及的范圍也越來(lái)越廣!那么語(yǔ)音芯片選型就很重要了,選型不對(duì)直接影響產(chǎn)品的使用體驗(yàn),下面小編從不同的維度來(lái)給大家介紹語(yǔ)音識(shí)別
    的頭像 發(fā)表于 06-23 17:31 ?941次閱讀
    語(yǔ)音識(shí)別<b class='flag-5'>芯片</b><b class='flag-5'>選型</b>有哪些<b class='flag-5'>技術(shù)</b>參數(shù)要注意

    HZHY-AI500G-技術(shù)規(guī)格說(shuō)明書(shū)

    電子發(fā)燒友網(wǎng)站提供《HZHY-AI500G-技術(shù)規(guī)格說(shuō)明書(shū).pdf》資料免費(fèi)下載
    發(fā)表于 04-17 16:57 ?0次下載

    HZHY-AI300G-技術(shù)規(guī)格說(shuō)明書(shū)

    電子發(fā)燒友網(wǎng)站提供《HZHY-AI300G-技術(shù)規(guī)格說(shuō)明書(shū).pdf》資料免費(fèi)下載
    發(fā)表于 04-17 16:54 ?1次下載

    **【技術(shù)干貨】Nordic nRF54系列芯片:傳感器數(shù)據(jù)采集與AI機(jī)器學(xué)習(xí)的完美結(jié)合**

    技術(shù)干貨】nRF54系列芯片:傳感器數(shù)據(jù)采集與AI機(jī)器學(xué)習(xí)的完美結(jié)合 近期收到不少伙伴咨詢(xún)nRF54系列芯片的應(yīng)用與技術(shù)細(xì)節(jié),今天我們整理
    發(fā)表于 04-01 00:00