91欧美超碰AV自拍|国产成年人性爱视频免费看|亚洲 日韩 欧美一厂二区入|人人看人人爽人人操aV|丝袜美腿视频一区二区在线看|人人操人人爽人人爱|婷婷五月天超碰|97色色欧美亚州A√|另类A√无码精品一级av|欧美特级日韩特级

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

大規(guī)模人工智能(AI)處理器的功耗分析方法

天數(shù)智芯 ? 來(lái)源:天數(shù)智芯 ? 作者:天數(shù)智芯 ? 2022-01-17 16:24 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

近日,來(lái)自天數(shù)智芯公司Power團(tuán)隊(duì)的三位工程師闕詩(shī)璇、孫凌、甘振華合作發(fā)表的技術(shù)論文《左移:大規(guī)模人工智能(AI)處理器的功耗分析方法》順利入選第58屆(國(guó)際設(shè)計(jì)自動(dòng)化會(huì)議,Design Automation Conference),并做poster presentation。

文章主要內(nèi)容如下:

AI芯片最重要的設(shè)計(jì)指標(biāo)之一就是單位功耗每瓦算力(TOPS/W),因此低功耗設(shè)計(jì)對(duì)于AI芯片的設(shè)計(jì)實(shí)現(xiàn),在市場(chǎng)中具備競(jìng)爭(zhēng)力都十分重要。然而原有的功耗分析方法存在一定的不足,對(duì)新的需求也無(wú)法滿足:

1.原有方法只是對(duì)功能驗(yàn)證的場(chǎng)景,而缺乏真實(shí)的應(yīng)用場(chǎng)景,跟真實(shí)的軟件應(yīng)用有一定的差距;

2.傳統(tǒng)的功耗分析需要綜合后的網(wǎng)表和門級(jí)的向量,這在項(xiàng)目早期很難獲取,太晚介入會(huì)讓功耗優(yōu)化受限;

3.對(duì)于仿真時(shí)間長(zhǎng)的向量,尤其是要按時(shí)間分析功耗時(shí),所需的運(yùn)行時(shí)間和資源都是巨大的;

4.自適應(yīng)電壓頻率縮放等需要有實(shí)時(shí)的功耗才能進(jìn)行軟硬件控制,這是原有方法無(wú)法實(shí)現(xiàn)的;

5.為了搶占市場(chǎng),需要更快的迭代設(shè)計(jì),因此設(shè)計(jì)人員希望每周甚至每天都可以對(duì)低功耗功能進(jìn)行驗(yàn)證,原有方法很難趕上驗(yàn)證迭代的速度;

為了解決這些挑戰(zhàn)跟需求,天數(shù)智芯提出了一種創(chuàng)新的功耗分析方案:利用一種功耗分析工具對(duì)所給的仿真向量進(jìn)行高性能的按時(shí)間分析功耗的分布,從而得到平均功耗和峰值功耗等參數(shù)。這種方法在RTL階段就進(jìn)行分析,有利于對(duì)AI處理器進(jìn)行優(yōu)化功耗的迭代,最終實(shí)現(xiàn)項(xiàng)目功耗目標(biāo)。與之前的方法相比較,它在某些實(shí)驗(yàn)中,可以達(dá)到100甚至1000倍的加速。

接下來(lái)將展開(kāi)描述該方案在實(shí)際工作中的一個(gè)應(yīng)用:通過(guò)機(jī)器學(xué)習(xí)的訓(xùn)練得到實(shí)時(shí)功耗預(yù)測(cè)模型。

現(xiàn)在所用的新的功耗分析方法和原有的按時(shí)間分析網(wǎng)表的功耗分析方法,具有很好的相關(guān)一致性。所以利用它超高倍加速的分析能力,可以用于各種應(yīng)用場(chǎng)景激勵(lì)產(chǎn)生訓(xùn)練模型所需要的充足的數(shù)據(jù)集。當(dāng)訓(xùn)練數(shù)據(jù)集達(dá)到百萬(wàn)甚至是上億級(jí)別,通過(guò)機(jī)器學(xué)習(xí)算法得到的模型就比較準(zhǔn)確。這是依賴新的分析方法才能得到的,傳統(tǒng)的分析方法無(wú)法產(chǎn)生這么大的數(shù)據(jù)量。

我們用機(jī)器學(xué)習(xí)的算法對(duì)各個(gè)模塊進(jìn)行參數(shù)訓(xùn)練,從而得到最佳的預(yù)測(cè)模型,這樣就可以用于預(yù)測(cè)實(shí)時(shí)功耗,從而實(shí)現(xiàn)軟硬件的控制。

經(jīng)過(guò)幾天的訓(xùn)練,我們最終得到的預(yù)測(cè)模型與真實(shí)的功耗之間的誤差只有不到5%。

總的來(lái)看,創(chuàng)新的功耗分析方法與傳統(tǒng)流程相比,能在項(xiàng)目早期介入,所需要的運(yùn)行時(shí)間跟內(nèi)存消耗大大減少,可以在設(shè)計(jì)階段進(jìn)行快速的迭代。它不僅僅可以對(duì)原有的功能驗(yàn)證激勵(lì)進(jìn)行分析,對(duì)于原型驗(yàn)證的真實(shí)的應(yīng)用場(chǎng)景向量也可以進(jìn)行分析,從而得到更真實(shí)的功耗相關(guān)指標(biāo),且與項(xiàng)目最終簽核時(shí)的數(shù)據(jù)具有一致性。利用它的快速和節(jié)省資源特性,能夠?yàn)閷?shí)時(shí)功耗的預(yù)測(cè)模型提供大量充足的數(shù)據(jù)樣本,最終得到誤差5%以內(nèi)的預(yù)測(cè)模型。

關(guān)于DAC

DAC(國(guó)際設(shè)計(jì)自動(dòng)化會(huì)議,Design Automation Conference)與ICCAD(國(guó)際計(jì)算機(jī)輔助設(shè)計(jì)會(huì)議,International Conference on Computer Aided Design)、DATE(歐洲設(shè)計(jì)自動(dòng)化與測(cè)試學(xué)術(shù)會(huì)議,Design, Automation and Test in Europe)、ASP-DAC(亞太地區(qū)設(shè)計(jì)自動(dòng)化會(huì)議,Asia and South Pacific Design Automation Conference)一起被公認(rèn)為電子設(shè)計(jì)自動(dòng)化領(lǐng)域水平最高的四大國(guó)際會(huì)議。

關(guān)于天數(shù)智芯

上海天數(shù)智芯半導(dǎo)體有限公司(簡(jiǎn)稱“天數(shù)智芯”)于2018年正式啟動(dòng)7納米通用并行(GPGPU)云端計(jì)算芯片設(shè)計(jì),是中國(guó)第一家通用并行(GPGPU)云端計(jì)算芯片及高性能算力系統(tǒng)提供商。公司以“成為智能社會(huì)的賦能者”為使命,專注于云端服務(wù)器級(jí)的通用并行高性能云端計(jì)算芯片,瞄準(zhǔn)以云計(jì)算、人工智能、數(shù)字化轉(zhuǎn)型為代表的數(shù)據(jù)驅(qū)動(dòng)技術(shù)市場(chǎng),解決核心算力瓶頸問(wèn)題。重點(diǎn)打造自主可控、國(guó)際一流的通用、標(biāo)準(zhǔn)、高性能云端計(jì)算GPGPU芯片,從芯片端解決算力問(wèn)題。

原文標(biāo)題:天數(shù)智芯技術(shù)論文入選第58屆DAC

文章出處:【微信公眾號(hào):天數(shù)智芯】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。

審核編輯:湯梓紅

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問(wèn)題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • 參數(shù)
    +關(guān)注

    關(guān)注

    11

    文章

    1870

    瀏覽量

    33960
  • 自動(dòng)化
    +關(guān)注

    關(guān)注

    31

    文章

    5941

    瀏覽量

    90303
  • 人工智能
    +關(guān)注

    關(guān)注

    1817

    文章

    50115

    瀏覽量

    265569

原文標(biāo)題:天數(shù)智芯技術(shù)論文入選第58屆DAC

文章出處:【微信號(hào):IluvatarCoreX,微信公眾號(hào):天數(shù)智芯】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評(píng)論

    相關(guān)推薦
    熱點(diǎn)推薦

    Magna AI加入NVIDIA Inception計(jì)劃,推動(dòng)生產(chǎn)級(jí)人工智能規(guī)模化發(fā)展

    智能交付的頂尖人工智能機(jī)構(gòu)行列。 Magna AI的加入,體現(xiàn)了其與NVIDIA人工智能平臺(tái)之間高度契合的技術(shù)協(xié)同關(guān)系。這一合作基于Magna A
    的頭像 發(fā)表于 01-12 15:46 ?182次閱讀

    瑞芯微SOC智能視覺(jué)AI處理器

    需要連接多種外設(shè)的產(chǎn)品。顯示: 支持雙屏異顯,最高4K@60fps輸出。 RK1126B: 一款集成自研NPU的智能視覺(jué)AI處理器,專注于視頻輸入端的AI
    發(fā)表于 12-19 13:44

    瑞薩電子RZ/V系列微處理器助力邊緣AI開(kāi)發(fā)

    邊緣AI越來(lái)越多地應(yīng)用于諸如工業(yè)攝像頭和公共設(shè)施攝像頭等嵌入式設(shè)備中,并要求嵌入式產(chǎn)品小型化且具有低功耗。瑞薩電子RZ/V系列微處理器(MPU)內(nèi)置AI加速
    的頭像 發(fā)表于 09-23 10:31 ?917次閱讀
    瑞薩電子RZ/V系列微<b class='flag-5'>處理器</b>助力邊緣<b class='flag-5'>AI</b>開(kāi)發(fā)

    利用超微型 Neuton ML 模型解鎖 SoC 邊緣人工智能

    nRF52805),只占用幾千字節(jié)的非易失性存儲(chǔ)(NVM)。這使得以前被認(rèn)為不可能的應(yīng)用也能增加 ML 功能。例如,您現(xiàn)在可以在廣泛的傳感網(wǎng)絡(luò)的每個(gè)節(jié)點(diǎn)上進(jìn)行人工智能處理,而在這
    發(fā)表于 08-31 20:54

    AI 芯片浪潮下,職場(chǎng)晉升新契機(jī)?

    方向,就明確涵蓋了人工智能芯片的研發(fā)、部署與優(yōu)化技術(shù)崗位 。如果你從事 GPU 相關(guān)研發(fā)工作,在申報(bào)職稱時(shí),就需著重突出在圖形處理加速、大規(guī)模并行計(jì)算等方面的成果,因?yàn)?GPU 的高并行結(jié)構(gòu)及強(qiáng)大浮點(diǎn)
    發(fā)表于 08-19 08:58

    挖到寶了!人工智能綜合實(shí)驗(yàn)箱,高校新工科的寶藏神器

    和生態(tài)體系帶到使用者身邊 ,讓我們?cè)诩夹g(shù)學(xué)習(xí)和使用上不再受制于人。 三、多模態(tài)實(shí)驗(yàn),解鎖AI全流程 它嵌入了2D視覺(jué)、深度視覺(jué)、機(jī)械手臂、語(yǔ)音識(shí)別、嵌入式傳感等多種類AI模塊,涵蓋人工智能
    發(fā)表于 08-07 14:30

    挖到寶了!比鄰星人工智能綜合實(shí)驗(yàn)箱,高校新工科的寶藏神器!

    和生態(tài)體系帶到使用者身邊 ,讓我們?cè)诩夹g(shù)學(xué)習(xí)和使用上不再受制于人。 三、多模態(tài)實(shí)驗(yàn),解鎖AI全流程 它嵌入了2D視覺(jué)、深度視覺(jué)、機(jī)械手臂、語(yǔ)音識(shí)別、嵌入式傳感等多種類AI模塊,涵蓋人工智能
    發(fā)表于 08-07 14:23

    關(guān)于人工智能處理器的11個(gè)誤解

    本文轉(zhuǎn)自:TechSugar編譯自ElectronicDesign人工智能浪潮已然席卷全球,將人工智能加速處理器整合到各類應(yīng)用中也變得愈發(fā)普遍。然而,圍繞它們是什么、如何運(yùn)作、能如
    的頭像 發(fā)表于 08-07 13:21 ?1086次閱讀
    關(guān)于<b class='flag-5'>人工智能</b><b class='flag-5'>處理器</b>的11個(gè)誤解

    迅為RK3588開(kāi)發(fā)板Linux安卓麒麟瑞芯微國(guó)產(chǎn)工業(yè)AI人工智能

    迅為RK3588開(kāi)發(fā)板Linux安卓麒麟瑞芯微國(guó)產(chǎn)工業(yè)AI人工智能
    發(fā)表于 07-14 11:23

    AI芯片:加速人工智能計(jì)算的專用硬件引擎

    人工智能AI)的快速發(fā)展離不開(kāi)高性能計(jì)算硬件的支持,而傳統(tǒng)CPU由于架構(gòu)限制,難以高效處理AI任務(wù)中的大規(guī)模并行計(jì)算需求。因此,專為
    的頭像 發(fā)表于 07-09 15:59 ?1619次閱讀

    開(kāi)售RK3576 高性能人工智能主板

    ZYSJ-2476B 高性能智能主板,采用瑞芯微 RK3576 高性能 AI 處理器、神經(jīng)網(wǎng)絡(luò)處理器 NPU, Android 14.0/debian11/ubuntu20.04 操
    發(fā)表于 04-23 10:55

    光子 AI 處理器的核心原理及突破性進(jìn)展

    電子發(fā)燒友網(wǎng)(文 / 李彎彎)光子 AI 處理器,作為一種借助光子執(zhí)行信息處理人工智能AI)計(jì)算的新型硬件設(shè)備,正逐漸嶄露頭角。與傳統(tǒng)基
    的頭像 發(fā)表于 04-19 00:40 ?4208次閱讀

    支持實(shí)時(shí)物體識(shí)別的視覺(jué)人工智能處理器RZ/V2MA數(shù)據(jù)手冊(cè)

    DRP-AI 采用了一種由動(dòng)態(tài)可重構(gòu)處理器(DRP)和 AI-MAC組成的人工智能加速,該加速
    的頭像 發(fā)表于 03-18 18:12 ?935次閱讀
    支持實(shí)時(shí)物體識(shí)別的視覺(jué)<b class='flag-5'>人工智能</b>微<b class='flag-5'>處理器</b>RZ/V2MA數(shù)據(jù)手冊(cè)

    用于實(shí)時(shí)人類和物體識(shí)別的視覺(jué)-AI ASSP人工智能處理器RZ/V2M數(shù)據(jù)手冊(cè)

    配置了DRP和AI-MAC的人工智能硬件IP DRP-AI將高速人工智能推理和低功耗結(jié)合起來(lái),實(shí)現(xiàn)了1TOPS/W級(jí)別的功率性能。此外,圖像
    的頭像 發(fā)表于 03-14 17:41 ?955次閱讀
    用于實(shí)時(shí)人類和物體識(shí)別的視覺(jué)-<b class='flag-5'>AI</b> ASSP<b class='flag-5'>人工智能</b>微<b class='flag-5'>處理器</b>RZ/V2M數(shù)據(jù)手冊(cè)

    基于嵌入式人工智能的高速圖像處理的微處理器RZ/A2M數(shù)據(jù)手冊(cè)

    和特征提取,與ARM?Cortex?A9 CPU緊密結(jié)合,用于人工智能推理。 *附件:基于嵌入式人工智能的高速圖像處理的微處理器RZA2M數(shù)據(jù)手冊(cè).pdf 特性 中央
    的頭像 發(fā)表于 03-11 15:54 ?1030次閱讀
    基于嵌入式<b class='flag-5'>人工智能</b>的高速圖像<b class='flag-5'>處理</b>的微<b class='flag-5'>處理器</b>RZ/A2M數(shù)據(jù)手冊(cè)