91欧美超碰AV自拍|国产成年人性爱视频免费看|亚洲 日韩 欧美一厂二区入|人人看人人爽人人操aV|丝袜美腿视频一区二区在线看|人人操人人爽人人爱|婷婷五月天超碰|97色色欧美亚州A√|另类A√无码精品一级av|欧美特级日韩特级

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

關(guān)于內(nèi)存大家都知道,但什么是內(nèi)存內(nèi)計(jì)算

獨(dú)愛72H ? 來(lái)源:至頂網(wǎng) ? 作者:至頂網(wǎng) ? 2019-12-24 15:37 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

(文章來(lái)源:至頂網(wǎng))

在過(guò)去的幾十年中,計(jì)算性能的提高是通過(guò)更快、更精確地處理更大數(shù)量的數(shù)據(jù)來(lái)實(shí)現(xiàn)的。內(nèi)存和存儲(chǔ)空間現(xiàn)在是以千兆字節(jié)和兆字節(jié)來(lái)衡量的,而不是以千字節(jié)和兆字節(jié)。處理器操作64位而不是8位數(shù)據(jù)塊。然而,半導(dǎo)體行業(yè)創(chuàng)造和收集高質(zhì)量數(shù)據(jù)的能力比分析數(shù)據(jù)的能力增長(zhǎng)得更快。

隨著人工智能的不斷發(fā)展,逐漸衍生出了一個(gè)新興技術(shù),那就是“內(nèi)存內(nèi)計(jì)算”。而近來(lái),內(nèi)存內(nèi)計(jì)算也一度成了熱門的關(guān)鍵詞。早些時(shí)候,IBM就發(fā)布了基于相變內(nèi)存(PCM)的內(nèi)存內(nèi)計(jì)算,在此之后基于Flash內(nèi)存內(nèi)計(jì)算的初創(chuàng)公司也獲得高額融資;而在中國(guó),初創(chuàng)公司也開始在做內(nèi)存內(nèi)計(jì)算方面的嘗試。然而“內(nèi)存內(nèi)計(jì)算”倒是什么東西?這種新技術(shù)的誕生,還要從馮 · 諾依曼體系和人工智能講起。

自從計(jì)算機(jī)誕生的那天開始,馮 · 諾依曼架構(gòu)的體系就占據(jù)著主導(dǎo)的地位。這種運(yùn)行計(jì)算方式是先把數(shù)據(jù)存入主存儲(chǔ)器,再按照順序從主存儲(chǔ)器中取出指令,然后一條一條地執(zhí)行。我們都知道,如果內(nèi)存的通訊速度跟不上CPU的性能,就會(huì)導(dǎo)致計(jì)算能力受到限制,這就是內(nèi)存墻了。同時(shí)在效能方面,馮 · 諾依曼體系也存在明顯的缺點(diǎn),它讀寫一次內(nèi)存數(shù)據(jù)的能量,要比計(jì)算一次數(shù)據(jù)的能量多消耗了足足幾百倍。

而在現(xiàn)在人工智能的技術(shù)中,隨著數(shù)據(jù)量越來(lái)越多,計(jì)算量越來(lái)越大,原始的馮 · 諾依曼結(jié)構(gòu)正承受著越來(lái)越多的挑戰(zhàn)。硬件架構(gòu)不能指望計(jì)算量一大,就擴(kuò)展CPU。因?yàn)榇鎯?chǔ)量一變大,就馬上采用增大內(nèi)存來(lái)存儲(chǔ)的方式是對(duì)過(guò)去架構(gòu)的嚴(yán)重依賴,并且這種方式也非常不適合AI。當(dāng)容量大到一定程度,只能說(shuō)明某些技術(shù)需要革新。從生物角度來(lái)講,大腦存儲(chǔ)了大量的知識(shí),并且能夠快速訪問(wèn)并提取,而大腦的內(nèi)存和計(jì)算是相容的。未來(lái)的計(jì)算機(jī)不是基于計(jì)算的memory,而是基于memory的計(jì)算。

關(guān)于內(nèi)存大家都知道,但什么是內(nèi)存內(nèi)計(jì)算

同時(shí),目前最主流的人工智能,也是對(duì)計(jì)算能力有著極高的要求。如果想讓人工智能用在移動(dòng)端和嵌入式設(shè)備中,還有能耗大,發(fā)熱降頻等問(wèn)題。這樣一來(lái),內(nèi)存和效能就變成了馮 · 諾依曼計(jì)算機(jī)體系的一個(gè)瓶頸。為了解決這一系列的問(wèn)題,于是就衍生出了傳說(shuō)中的內(nèi)存內(nèi)計(jì)算。顧名思義就是把計(jì)算單元嵌入到內(nèi)存里面,這樣的話內(nèi)存既是一個(gè)存儲(chǔ)器,也是一個(gè)計(jì)算機(jī),它并不需要從內(nèi)存中讀取數(shù)據(jù),數(shù)據(jù)是直接進(jìn)出CPU的。不但不受內(nèi)存的性能限制,而且還提高了效能比(能源轉(zhuǎn)換的效率之比)。

人工智能專用的NPU(嵌入式神經(jīng)網(wǎng)絡(luò)處理器)SPR2801S就使用了內(nèi)存內(nèi)計(jì)算,這種技術(shù)還搭建了人工智能專用的APIM構(gòu)架,它的全稱是AI Processing In Memory。采用了APIM構(gòu)架的計(jì)算機(jī)不需要指令,也不需要總線和DDR(雙倍速率同步動(dòng)態(tài)隨機(jī)存儲(chǔ)器),大數(shù)據(jù)就可以直接進(jìn)出CPU,極大地提高了效能比。此外,它還把算力提高到了5.6T ops,高效能比高達(dá)9.2T ops每瓦。Firefly基于這款SPR2801S則推出了人工智能開源主板AIO-3399EC,以及NCC S1 神經(jīng)網(wǎng)絡(luò)計(jì)算卡和USB神經(jīng)網(wǎng)絡(luò)計(jì)算棒,還搭配了模型訓(xùn)練工具PLAI。可以說(shuō),這些都加速了人工智能項(xiàng)目的落實(shí)。

雖然內(nèi)存內(nèi)計(jì)算現(xiàn)在還處于探索階段,但是人們?cè)谑嗄曛熬驼J(rèn)識(shí)到了“內(nèi)存墻”的問(wèn)題,但是為什么內(nèi)存內(nèi)計(jì)算直到現(xiàn)在才被人們關(guān)注呢?小編認(rèn)為主要有兩點(diǎn),第一個(gè)就是基于神經(jīng)網(wǎng)絡(luò)的AI的興起,尤其是人們都希望AI能普及到移動(dòng)端和嵌入式設(shè)備中。而神經(jīng)網(wǎng)絡(luò)的其中1個(gè)特點(diǎn)就是對(duì)于計(jì)算精度的誤差有著比較高的容忍度,所以內(nèi)存內(nèi)計(jì)算的中引入的誤差一般都可以被神經(jīng)網(wǎng)絡(luò)所接受。內(nèi)存內(nèi)計(jì)算和人工智能,尤其是嵌入式人工智能,可以說(shuō)是完美的結(jié)合。

第二個(gè)則是新存儲(chǔ)器分發(fā)展。對(duì)于內(nèi)存內(nèi)計(jì)算來(lái)說(shuō),存儲(chǔ)器的特性決定了它的效率,所以每當(dāng)帶有新特性的存儲(chǔ)器出現(xiàn)時(shí),都會(huì)帶動(dòng)內(nèi)存內(nèi)計(jì)算的發(fā)展。此外,從存儲(chǔ)器推廣的角度,新存儲(chǔ)器的誕生也愿意搭上人工智能的風(fēng)潮,這樣一來(lái)新存儲(chǔ)器的廠商也樂(lè)于看到有人做基于自家存儲(chǔ)器的內(nèi)存內(nèi)計(jì)算去加速人工智能,也會(huì)幫助一起推廣內(nèi)存內(nèi)計(jì)算。

內(nèi)存內(nèi)計(jì)算利用存儲(chǔ)器的特點(diǎn),減少了人工智能在計(jì)算中的讀寫和操作,也正是因?yàn)閮?nèi)存內(nèi)計(jì)算的精度受到了模擬計(jì)算的限制,所以它也是目前為止,最適合追求能效比以及能接受一定精確度損失的嵌入式人工智能的應(yīng)用。
(責(zé)任編輯:fqj)

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問(wèn)題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • 內(nèi)存
    +關(guān)注

    關(guān)注

    9

    文章

    3215

    瀏覽量

    76409
  • 內(nèi)存計(jì)算
    +關(guān)注

    關(guān)注

    1

    文章

    15

    瀏覽量

    12301
收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評(píng)論

    相關(guān)推薦
    熱點(diǎn)推薦

    MangoTree Halo Ultra「全新PXI」,標(biāo)配自動(dòng)糾錯(cuò)內(nèi)存#

    內(nèi)存
    芒果樹數(shù)字
    發(fā)布于 :2026年03月06日 15:59:34

    曙光云發(fā)布“HME內(nèi)存聚變技術(shù)”

    了顛覆性解決方案——正式推出“HME內(nèi)存聚變引擎”(Hyper-Memory Engine),以獨(dú)家軟件技術(shù),打破傳統(tǒng)云架構(gòu)中算力成本與DRAM內(nèi)存容量的剛性捆綁。 這一技術(shù)的推出,實(shí)現(xiàn)了云計(jì)算底層架構(gòu)的代際跨越。曙光云研發(fā)團(tuán)隊(duì)
    的頭像 發(fā)表于 02-08 16:26 ?6.1w次閱讀

    容易造成單片機(jī)內(nèi)存溢出的幾個(gè)陷阱介紹

    關(guān)于程序變量和內(nèi)存分配,都是需要我們時(shí)刻關(guān)注的問(wèn)題。我相信有不少人在這塊犯過(guò)很多的錯(cuò)誤,也可能說(shuō)明我們基礎(chǔ)不夠扎實(shí),編寫程序的習(xí)慣也不夠好。 總結(jié)一下關(guān)于程序的變量和內(nèi)存方面的概念,雖
    發(fā)表于 01-23 07:25

    keil中c語(yǔ)言的動(dòng)態(tài)分配內(nèi)存

    關(guān)于內(nèi)存的錯(cuò)誤往往都是毀滅性的。下面我列舉幾點(diǎn)最容易犯的錯(cuò)誤,希望能幫助到大家。 (1)對(duì)空指針(NULL)解引用。看下面的代碼: 這段代碼看上去似乎沒(méi)什么錯(cuò)誤,存在潛在的風(fēng)險(xiǎn):
    發(fā)表于 01-21 06:04

    rk基于linux/android內(nèi)存管理

    一、內(nèi)存分布 ? U-Boot 由前級(jí) Loader 加載到 CONFIG_SYS_TEXT_BASE 地址,初始化時(shí)會(huì)探明當(dāng)前系統(tǒng)的總內(nèi)存容 量, 32 位平臺(tái)上認(rèn)為最大 4GB 可用(但是不影響
    的頭像 發(fā)表于 12-15 10:42 ?240次閱讀
    rk基于linux/android<b class='flag-5'>內(nèi)存</b>管理

    技嘉鈦冰雕主板24小時(shí)內(nèi)兩破D5內(nèi)存超頻紀(jì)錄 再創(chuàng)巔峰

    自從進(jìn)入DDR5時(shí)代,內(nèi)存頻率不斷刷新上限,就在數(shù)日前,技嘉Z890 AORUS Tachyon ICE主板再次打破紀(jì)錄,超頻高手Saltycroissant與Sergmann先后憑借該主板,在24小時(shí)內(nèi)內(nèi)存頻率從13407M
    的頭像 發(fā)表于 12-08 16:28 ?801次閱讀

    為啥 AI 計(jì)算速度這么驚人?—— 聊聊 GPU、內(nèi)存與并行計(jì)算

    提到AI,大家常說(shuō)它“算得快”,其實(shí)是指AI能在眨眼間處理海量數(shù)據(jù)??伤鼮樯队羞@本事?答案就藏在“GPU+高速內(nèi)存+并行計(jì)算”這trio(組合)里。咱們可以把AI要處理的數(shù)據(jù),想象成一大堆“小任務(wù)
    的頭像 發(fā)表于 12-05 14:35 ?939次閱讀
    為啥 AI <b class='flag-5'>計(jì)算</b>速度這么驚人?—— 聊聊 GPU、<b class='flag-5'>內(nèi)存</b>與并行<b class='flag-5'>計(jì)算</b>

    內(nèi)存與數(shù)據(jù)處理優(yōu)化藝術(shù)

    ,避免了數(shù)組索引的額外計(jì)算。 選擇合適的數(shù)據(jù)類型同樣重要。如果一個(gè)變量只需要表示0或1,使用最小所需的數(shù)據(jù)類型就比使用較大的類型更好,因?yàn)樗加?b class='flag-5'>內(nèi)存更少,可能提高緩存利用率。 對(duì)于浮點(diǎn)運(yùn)算,在不需要
    發(fā)表于 11-14 07:46

    Credo發(fā)布業(yè)界首款內(nèi)存扇出Gearbox

    Weaver,一款內(nèi)存扇出Gearbox,該產(chǎn)品可顯著提升內(nèi)存帶寬和內(nèi)存密度,優(yōu)化AI加速器或xPU的計(jì)算效率。作為Credo OmniConnect系列的首款產(chǎn)品,Weaver旨在解
    的頭像 發(fā)表于 11-08 11:01 ?2352次閱讀

    WebGL/Canvas 內(nèi)存泄露分析

    在構(gòu)建高性能、長(zhǎng)周期運(yùn)行的 WebGL/Canvas 應(yīng)用(如 3D 編輯器、數(shù)據(jù)可視化平臺(tái))時(shí),內(nèi)存管理是一個(gè)至關(guān)重要且極具挑戰(zhàn)性的課題。 開發(fā)者通常面臨的內(nèi)存泄漏問(wèn)題,其根源遠(yuǎn)比簡(jiǎn)單
    的頭像 發(fā)表于 10-21 11:40 ?451次閱讀
    WebGL/Canvas <b class='flag-5'>內(nèi)存</b>泄露分析

    科普:什么AI 內(nèi)存技術(shù)

    AI 內(nèi)存是一種專為人工智能 (AI) 應(yīng)用設(shè)計(jì)的新型內(nèi)存技術(shù)。與傳統(tǒng)的通用內(nèi)存(如 DDR5 或 LPDDR5)不同,AI 內(nèi)存的核心目標(biāo)是解決 AI
    的頭像 發(fā)表于 09-03 15:44 ?1496次閱讀

    比肩HBM,SOCAMM內(nèi)存模組即將商業(yè)化

    參數(shù)規(guī)模達(dá)數(shù)百億甚至萬(wàn)億級(jí)別,帶來(lái)巨大內(nèi)存需求,HBM內(nèi)存價(jià)格高昂,只應(yīng)用在高端算力卡上。SOCAMM則有望應(yīng)用于AI服務(wù)器、高性能計(jì)算、AI PC以及其他如游戲、圖形設(shè)計(jì)、虛擬現(xiàn)實(shí)
    的頭像 發(fā)表于 05-17 01:15 ?4082次閱讀

    golang內(nèi)存分配

    作者:錢文 Go 的分配采用了類似 tcmalloc 的結(jié)構(gòu).特點(diǎn): 使用一小塊一小塊的連續(xù)內(nèi)存頁(yè), 進(jìn)行分配某個(gè)范圍大小的內(nèi)存需求. 比如某個(gè)連續(xù) 8KB 專門用于分配 17-24 字節(jié),以此減少
    的頭像 發(fā)表于 03-31 15:00 ?537次閱讀
    golang<b class='flag-5'>內(nèi)存</b>分配