91欧美超碰AV自拍|国产成年人性爱视频免费看|亚洲 日韩 欧美一厂二区入|人人看人人爽人人操aV|丝袜美腿视频一区二区在线看|人人操人人爽人人爱|婷婷五月天超碰|97色色欧美亚州A√|另类A√无码精品一级av|欧美特级日韩特级

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

稀疏化計(jì)算產(chǎn)品商業(yè)落地將賦能AI產(chǎn)業(yè)變革

lPCU_elecfans ? 來源:電子發(fā)燒友網(wǎng) ? 作者:電子發(fā)燒友網(wǎng) ? 2022-09-02 09:45 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

電子發(fā)燒友網(wǎng)報(bào)道(文/李彎彎)AI5G等新興產(chǎn)業(yè)的蓬勃發(fā)展催生了海量數(shù)據(jù)計(jì)算需求,同時(shí)AI算法模型持續(xù)迭代,復(fù)雜化日益凸顯,數(shù)字經(jīng)濟(jì)時(shí)代下市場(chǎng)需要強(qiáng)大、普惠的算力引擎。而從供給端來看,先進(jìn)制程的迭代周期變長(zhǎng),使得芯片能效比的提升并不顯著。

針對(duì)AI應(yīng)用特點(diǎn)實(shí)現(xiàn)硬件架構(gòu)創(chuàng)新是必然趨勢(shì),墨芯人工智能CEO王維在某論壇上談到,依托對(duì)AI的理解用軟硬一體解決算力瓶頸問題是行業(yè)公認(rèn)的發(fā)展方向。他認(rèn)為,稀疏化能夠有效應(yīng)對(duì)算力瓶頸,實(shí)現(xiàn)原理是,不存儲(chǔ)和不處理零值,從而得到更小且更快的模型。

軟硬一體化稀疏路徑符合AI計(jì)算核心訴求軟硬一體化稀疏路徑符合AI計(jì)算高吞吐、低功耗、低延時(shí)的核心需求。AI稀疏產(chǎn)業(yè)化的成功要素包括:1、跨算法、軟件、硬件領(lǐng)域的協(xié)同開發(fā);2、擁有持續(xù)多層次優(yōu)化稀疏運(yùn)算的底層算法能力;3、架構(gòu)需保證可編程性、高度可拓展屬性及快速迭代能力。

稀疏化路徑已具備批量化工程應(yīng)用能力。英偉達(dá)在2020年推出的A100產(chǎn)品中,就率先引入稀疏Tensor Core實(shí)現(xiàn)4:2結(jié)構(gòu)化稀疏,稀疏是神經(jīng)網(wǎng)絡(luò)輕量化的重要手段,英偉達(dá)稀疏化產(chǎn)品有效引領(lǐng)市場(chǎng)應(yīng)用趨勢(shì)。稀疏化架構(gòu)可與現(xiàn)有AI軟件生態(tài)深度適配,例如英偉達(dá)直接使用Tensor Core進(jìn)行稀疏矩陣乘累加操作,無需進(jìn)行底層編程。

基于雙稀疏特點(diǎn),自研核心AI架構(gòu)墨芯是全球最早研發(fā)稀疏化算法及架構(gòu)的企業(yè),并在2018年開始稀疏化的全球?qū)@季郑摴疽彩亲钤缟逃孟∈杌a(chǎn)品實(shí)現(xiàn)銷售的,第一款FPGA產(chǎn)品在2019年Q4開始產(chǎn)生銷售。

王維表示,現(xiàn)有芯片架構(gòu)設(shè)計(jì)在稀疏化支持中面臨較大局限,比如CPU架構(gòu),可支持跳點(diǎn)運(yùn)算,但因其算力限制,僅能夠支持邊緣端應(yīng)用,無法支持更大的模型,再比如GPU架構(gòu),只能進(jìn)行并行計(jì)算,所有元素(包括0元素)均參與運(yùn)算,無法實(shí)現(xiàn)高倍數(shù)加速。

基于雙稀疏特點(diǎn),墨芯自研核心AI架構(gòu)。其雙稀疏架構(gòu)設(shè)計(jì)理念:平衡的權(quán)重和激活張量剪枝技術(shù),可將精度損失降至最低的前提下保持對(duì)硬件的友好度;墨芯獨(dú)有的剪枝和壓縮技術(shù)可以再許多網(wǎng)絡(luò)和應(yīng)用中實(shí)現(xiàn)最多高到32倍的稀疏。

墨芯首款稀疏化云端AI芯片Antoum-1已經(jīng)回片,實(shí)測(cè)性能ResNet 50超33000SPS;墨芯板卡S4(單顆Antoum-1)僅30W功耗,實(shí)測(cè)性能實(shí)現(xiàn)英偉達(dá)主流產(chǎn)品T4近16倍能效比;墨芯板卡S4對(duì)比英偉達(dá)主流產(chǎn)品Latency可以做到1/4-1/5。

稀疏化計(jì)算產(chǎn)品商業(yè)落地,將賦能AI產(chǎn)業(yè)變革。一、助力云服務(wù)商降低單位算力擁有成本,2021年,Nvidia在中國(guó)營(yíng)收超過38億美金,其中阿里,騰訊等頭部互聯(lián)網(wǎng)公司采購金額基本超過1億美金。隨著AI持續(xù)發(fā)展,數(shù)據(jù)量的指數(shù)上升導(dǎo)致AI芯片的需求會(huì)持續(xù)上升,云服務(wù)商采購額將逐年增加,因此他們對(duì)降低成本的訴求非常強(qiáng)勁,基于Antoum-1的推理卡S4相較于英偉達(dá)對(duì)標(biāo)推理卡T4,ResNest50及BERT每FPS/SPS成本降低約85%。

二、助力云服務(wù)商縮減能耗成本,電費(fèi)支出是數(shù)據(jù)中心最大的營(yíng)業(yè)成本,平均數(shù)據(jù)中心近60%的營(yíng)業(yè)成本是電力成本,降低能耗是數(shù)據(jù)中心和云服務(wù)商的最大痛點(diǎn),2021年全國(guó)數(shù)據(jù)中心的耗電量占社會(huì)總用電的近3%,且增長(zhǎng)率已連續(xù)8年超過12%,基于Antoum-1的推理卡S4相較于Nvidia主力推理卡T4,ResNest50及BERT每FPS/SPS能耗成本降低約90%。

小結(jié)目前基于稀疏化的AI架構(gòu)主要面向云端訓(xùn)練場(chǎng)景,不過理論上來說,稀疏化訓(xùn)練由于能大幅降低對(duì)內(nèi)存、帶寬與計(jì)算的需求,十分適合訓(xùn)練,未來墨芯在滿足推理市場(chǎng)的需求后,將切入訓(xùn)練市場(chǎng),建立稀疏訓(xùn)練生態(tài),產(chǎn)品在軟件層面對(duì)訓(xùn)練做更多的開發(fā),支持訓(xùn)練專用的算子,同時(shí)硬件上也會(huì)為訓(xùn)練定義架構(gòu)。

審核編輯:彭靜
聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • 硬件
    +關(guān)注

    關(guān)注

    12

    文章

    3599

    瀏覽量

    69053
  • AI
    AI
    +關(guān)注

    關(guān)注

    91

    文章

    40086

    瀏覽量

    301719
  • 人工智能
    +關(guān)注

    關(guān)注

    1819

    文章

    50134

    瀏覽量

    265761

原文標(biāo)題:?稀疏化應(yīng)對(duì)算力瓶頸,助力云服務(wù)商大幅降低成本

文章出處:【微信號(hào):elecfans,微信公眾號(hào):電子發(fā)燒友網(wǎng)】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評(píng)論

    相關(guān)推薦
    熱點(diǎn)推薦

    沐曦曦索GPU產(chǎn)品AI4S重塑材料研發(fā)新范式

    2026年1月29日,“AI4Science 前沿:材料研發(fā)計(jì)算新范式——國(guó)產(chǎn)算力×深度學(xué)習(xí)框架技術(shù)沙龍·上海站”在張江百度飛槳人工智能產(chǎn)業(yè)
    的頭像 發(fā)表于 02-10 14:28 ?510次閱讀

    益萊儲(chǔ)2026新年展望:融合共生,租賃科技變革新周

    益萊儲(chǔ)2026新年展望:融合共生,租賃科技變革新周期 回首2025年,全球科技產(chǎn)業(yè)在“AI
    發(fā)表于 01-21 15:11

    泰芯半導(dǎo)體攜手生態(tài)伙伴助力AI硬件產(chǎn)業(yè)規(guī)模落地

    當(dāng)前,AI大模型加速滲透硬件產(chǎn)業(yè)AI硬件正從 “單點(diǎn)智能” 邁向 “系統(tǒng)級(jí)智能”,大模型已成為硬件產(chǎn)品的基礎(chǔ)能力之一。順應(yīng)這一行業(yè)發(fā)展趨勢(shì),珠海泰芯半導(dǎo)體有限公司(以下簡(jiǎn)稱 “泰芯半
    的頭像 發(fā)表于 01-05 17:18 ?1194次閱讀

    森木磊石持續(xù)AI工業(yè)場(chǎng)景落地,助力電力電子行業(yè)智能發(fā)展

    PPECWorkbench電力電子智能化開發(fā)平臺(tái),為AI的工業(yè)場(chǎng)景落地,助力電力電子行業(yè)智能
    的頭像 發(fā)表于 12-05 11:35 ?1419次閱讀
    森木磊石持續(xù)<b class='flag-5'>賦</b><b class='flag-5'>能</b><b class='flag-5'>AI</b>工業(yè)<b class='flag-5'>化</b>場(chǎng)景<b class='flag-5'>落地</b>,助力電力電子行業(yè)智能<b class='flag-5'>化</b>發(fā)展

    AI6G與衛(wèi)星通信:開啟智能天網(wǎng)新時(shí)代

    需求?傳統(tǒng)網(wǎng)絡(luò)會(huì)因流量激增而擁堵,而AI的6G網(wǎng)絡(luò)則能提前預(yù)測(cè)流量模式,動(dòng)態(tài)調(diào)整資源分配。 AI算法能夠?qū)崟r(shí)分析海量數(shù)據(jù),包括用戶位置、網(wǎng)絡(luò)負(fù)載、歷史流量模式等。在2025年上海世
    發(fā)表于 10-11 16:01

    華為算力支撐AI產(chǎn)業(yè)發(fā)展

    在全球AI產(chǎn)業(yè)蓬勃發(fā)展的浪潮中,人工智能技術(shù)正以前所未有的速度重塑全球經(jīng)濟(jì)格局和產(chǎn)業(yè)生態(tài)。作為數(shù)字經(jīng)濟(jì)發(fā)展的前沿陣地,廣東省肩負(fù)著推動(dòng)AI技術(shù)創(chuàng)新和
    的頭像 發(fā)表于 09-16 15:22 ?1032次閱讀

    智慧科研新紀(jì)元:善思創(chuàng)興引領(lǐng)AI與自動(dòng)變革

    同行,智創(chuàng)未來? “科研融合智能,未來無限可能”。善思創(chuàng)興正以其深厚的技術(shù)積累與創(chuàng)新的產(chǎn)品體系,推動(dòng)科研模式從經(jīng)驗(yàn)驅(qū)動(dòng)向數(shù)據(jù)驅(qū)動(dòng)、智能驅(qū)動(dòng)的深刻變革。公司產(chǎn)品與理念已在如“2025超高能量密度電池研討會(huì)(BB500-3)”及“首
    發(fā)表于 09-05 16:55

    RK3576無人機(jī)巡檢:多路視頻+AI識(shí)別引領(lǐng)智能變革

    數(shù)據(jù)。這對(duì)機(jī)載計(jì)算平臺(tái)提出了嚴(yán)苛要求:高性能、多接口、低功耗、輕量化。 米爾電子推出的米爾RK3576核心板,正是為這一應(yīng)用場(chǎng)景量身定制的硬件平臺(tái)。 米爾RK3576核心板產(chǎn)品特性1. 無人機(jī)巡檢的現(xiàn)實(shí)
    發(fā)表于 08-20 17:26

    利爾達(dá)AIoT模組與解決方案獲矚目,AI+機(jī)器人產(chǎn)業(yè)加速落地

    AI產(chǎn)品線市場(chǎng)經(jīng)理范遠(yuǎn)航先生受邀出席,并發(fā)表了主題演講,彰顯了公司在推動(dòng)AIoT技術(shù)深度產(chǎn)業(yè)智能
    的頭像 發(fā)表于 07-25 14:06 ?1304次閱讀
    利爾達(dá)AIoT模組與解決方案獲矚目,<b class='flag-5'>賦</b><b class='flag-5'>能</b><b class='flag-5'>AI</b>+機(jī)器人<b class='flag-5'>產(chǎn)業(yè)</b>加速<b class='flag-5'>落地</b>

    睿賽德邀您共赴“2025AI商業(yè)落地論壇”:共探實(shí)效派AI產(chǎn)業(yè)變革力量 | 活動(dòng)預(yù)告

    作為全球人工智能領(lǐng)域的年度盛會(huì),2025世界人工智能大會(huì)(WAIC)將于7月26日在上海盛大啟幕。“AI商業(yè)落地論壇”是世界人工智能大會(huì)的重要系列論壇之一,自第一屆舉辦便目光鎖定到
    的頭像 發(fā)表于 07-21 20:15 ?740次閱讀
    睿賽德邀您共赴“2025<b class='flag-5'>AI</b><b class='flag-5'>商業(yè)</b><b class='flag-5'>落地</b>論壇”:共探實(shí)效派<b class='flag-5'>AI</b>的<b class='flag-5'>產(chǎn)業(yè)</b><b class='flag-5'>變革</b>力量 | 活動(dòng)預(yù)告

    芯盾時(shí)代以AI戰(zhàn)略全線產(chǎn)品智能升級(jí)

    ChatGPT掀起的智能革命席卷全球,DeepSeek等大模型持續(xù)刷新性能邊界,人工智能從實(shí)驗(yàn)走向產(chǎn)業(yè)深處,成為重塑經(jīng)濟(jì)格局、重構(gòu)安全范式的核心力量。從國(guó)家戰(zhàn)略到企業(yè)實(shí)踐,從技術(shù)突破到場(chǎng)景落地,智能浪潮以前所未有的速度推動(dòng)著社
    的頭像 發(fā)表于 07-14 15:47 ?1620次閱讀

    CES Asia 2025蓄勢(shì)待發(fā),聚焦低空經(jīng)濟(jì)與AI,引領(lǐng)未來產(chǎn)業(yè)變革

    分享最新的科研成果和技術(shù)發(fā)展趨勢(shì),為行業(yè)發(fā)展提供理論支持。頭部企業(yè)展示最前沿的技術(shù)和產(chǎn)品,分享實(shí)踐經(jīng)驗(yàn),推動(dòng)技術(shù)的商業(yè)化應(yīng)用。創(chuàng)新力量也將在這個(gè)平臺(tái)上嶄露頭角,帶來新的創(chuàng)意和思路,激發(fā)行業(yè)的創(chuàng)新活力。 CES
    發(fā)表于 07-09 10:29

    賽美特“AI智造”生態(tài)體系亮相,四大方向智能制造

    行業(yè)專家、技術(shù)先鋒及生態(tài)伙伴共聚一堂,共議AI智能制造的趨勢(shì)與落地實(shí)踐,為產(chǎn)業(yè)智能升級(jí)提供
    發(fā)表于 05-26 14:30 ?1083次閱讀

    COMPUTEX 2025:德明利以全棧存儲(chǔ)技術(shù)AI NEXT”產(chǎn)業(yè)落地

    2025年5月20日,全球科技盛會(huì)臺(tái)北國(guó)際電腦展啟幕。在千億參數(shù)大模型商業(yè)化與算力需求指數(shù)級(jí)增長(zhǎng)的雙重驅(qū)動(dòng)下,存儲(chǔ)技術(shù)已從數(shù)據(jù)載體發(fā)展為AI效能的深度落地關(guān)鍵。德明利通過端側(cè)適配方案、全棧技術(shù)整合
    的頭像 發(fā)表于 05-21 15:05 ?1222次閱讀
    COMPUTEX 2025:德明利以全棧存儲(chǔ)技術(shù)<b class='flag-5'>賦</b><b class='flag-5'>能</b>“<b class='flag-5'>AI</b> NEXT”<b class='flag-5'>產(chǎn)業(yè)</b><b class='flag-5'>落地</b>

    Banana Pi 發(fā)布 BPI-AI2N &amp; BPI-AI2N Carrier,助力 AI 計(jì)算與嵌入式開發(fā)

    助力 AI、智能制造和物聯(lián)網(wǎng)行業(yè)的發(fā)展。未來,Banana Pi 繼續(xù)深化與Renesas的技術(shù)合作,推動(dòng)更多高性能嵌入式解決方案的落地。 ” BPI-AI2N開發(fā)板
    發(fā)表于 03-19 17:54