91欧美超碰AV自拍|国产成年人性爱视频免费看|亚洲 日韩 欧美一厂二区入|人人看人人爽人人操aV|丝袜美腿视频一区二区在线看|人人操人人爽人人爱|婷婷五月天超碰|97色色欧美亚州A√|另类A√无码精品一级av|欧美特级日韩特级

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

數(shù)據(jù)大爆炸?讓人焦慮的內(nèi)存計算怎么克服?

h1654155971.8456 ? 來源:YXQ ? 2019-03-25 17:05 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

在過去的幾十年中,計算性能的提高是通過更快、更精確地處理更大數(shù)量的數(shù)據(jù)來實現(xiàn)的。

內(nèi)存和存儲空間現(xiàn)在是以千兆字節(jié)和兆字節(jié)來衡量的,而不是以千字節(jié)和兆字節(jié)。處理器操作64位而不是8位數(shù)據(jù)塊。然而,半導(dǎo)體行業(yè)創(chuàng)造和收集高質(zhì)量數(shù)據(jù)的能力比分析數(shù)據(jù)的能力增長得更快。

一方面,互聯(lián)網(wǎng)和物聯(lián)網(wǎng)正在推動數(shù)據(jù)爆炸。惠普實驗室(Hewlett-Packard Labs)的研究科學(xué)家約翰·保羅·斯特拉坎(John Paul Strachan)在Leti設(shè)備研討會(12月的IEEE電子設(shè)備會議的一個附帶活動)上的一次演講中指出,僅Facebook用戶每天就產(chǎn)生4千兆字節(jié)(1千兆字節(jié)=1015字節(jié))的數(shù)據(jù)。

通過傳感器、攝像頭和其他所有設(shè)備對現(xiàn)實的數(shù)字捕捉產(chǎn)生了更大的效果。一輛獨立的汽車每天可以收集4 TB的數(shù)據(jù),將來一個大城市可能會有數(shù)百萬的數(shù)據(jù)。僅僅捕獲這些信息并將其上傳到中央數(shù)據(jù)中心所需的能量和帶寬就很驚人。

神經(jīng)網(wǎng)絡(luò)和馮諾依曼瓶頸

同時,對大型數(shù)據(jù)集的大部分分析都屬于神經(jīng)網(wǎng)絡(luò)。

神經(jīng)網(wǎng)絡(luò)的工作原理是計算矩陣的積和。將數(shù)據(jù)矩陣加載到數(shù)組中,并將每個元素乘以預(yù)定權(quán)重。在大多數(shù)情況下,結(jié)果將傳遞到網(wǎng)絡(luò)的下一層并乘以一組新的權(quán)重。經(jīng)過幾個這樣的步驟,就能得出關(guān)于數(shù)據(jù)是什么的結(jié)論。這有點像貓,可疑的行為模式,或者某種特殊的電活動。

在訓(xùn)練階段,將網(wǎng)絡(luò)的結(jié)論與先前已知的“正確”答案進(jìn)行比較。然后,一個稱為反向傳播的過程使用預(yù)測值和正確值之間的差異向上或向下調(diào)整網(wǎng)絡(luò)每個層中的每個權(quán)重。

從概念上講,這種方法非常簡單。但實際上,數(shù)據(jù)集很大,計算步驟也很大。ImageNet圖像分類基準(zhǔn)測試中表現(xiàn)最佳的是使用具有6000萬個參數(shù)的8層神經(jīng)網(wǎng)絡(luò)。一次通過算法獲得一個圖像需要200億次操作。

對于網(wǎng)絡(luò)的每一層,現(xiàn)有權(quán)重和每個訓(xùn)練示例的元素都被加載到處理器的寄存器中,然后相乘,并將結(jié)果寫回到存儲器中。性能瓶頸不是計算,而是處理器和存儲器陣列之間的帶寬。存儲器和處理器之間的這種分離是馮·諾依曼架構(gòu)的定義特征之一,并且存在于幾乎所有現(xiàn)代計算系統(tǒng)中。

大數(shù)據(jù)集,帶寬受限的機(jī)器學(xué)習(xí)工作負(fù)載以及Dennard擴(kuò)展的結(jié)束正在將行業(yè)基準(zhǔn)從原始計算性能轉(zhuǎn)變?yōu)橛嬎阈省?/strong>對于給定的任務(wù),硅片面積,功耗和計算精度之間的最佳平衡是什么?

低精度,模擬內(nèi)存,高精度

IBMResearchAlmaden的副總裁兼實驗室主任JeffWelser在一次IEDM演示中指出,神經(jīng)網(wǎng)絡(luò)計算通常不需要高計算精度。16位計算模塊使用等效32位塊所需的四分之一電路空間,并將所需的數(shù)據(jù)量減半。即使使用傳統(tǒng)架構(gòu),降低精度算法也可以顯著提高計算效率。

克服內(nèi)存瓶頸的需求也在推動更激進(jìn)的計算內(nèi)存架構(gòu)。在這種體系結(jié)構(gòu)的最簡單視圖中,預(yù)先確定的權(quán)重存儲在非易失性內(nèi)存元素數(shù)組中。將輸入數(shù)據(jù)加載在內(nèi)存字行上,并對來自單個單元格的電流求和。

究竟如何在硬件中實現(xiàn)這樣的方案是正在進(jìn)行的研究的主題。業(yè)界已經(jīng)提出了數(shù)字和模擬解決方案。

例如,數(shù)字陣列可以由閃存元件組裝而成。明尼蘇達(dá)大學(xué)的研究人員展示了兼容CMOS的eflash存儲單元,它將電荷存儲在控制柵極和通道之間的浮動?xùn)艠O上。在這樣的陣列中,可以通過完善的集成電路設(shè)計精確地控制特定權(quán)重值和它們改變的速率(學(xué)習(xí)速率)。這種方法很有吸引力,因為它依賴于成熟,易于理解的組件技術(shù)。

然而,機(jī)器學(xué)習(xí)應(yīng)用中感興趣的許多數(shù)據(jù)本質(zhì)上是模擬的。斯坦福大學(xué)和加州大學(xué)伯克利分校的研究員Xin Zheng及其同事觀察到,通過使用固有存儲模擬值的RRAM等存儲元件,可以避免模數(shù)轉(zhuǎn)換和數(shù)模轉(zhuǎn)換及其相關(guān)的能耗和硅足跡。然而,目前可用的模擬存儲器元件帶來了一系列新的挑戰(zhàn)。

當(dāng)數(shù)字元件處于開啟或關(guān)閉狀態(tài)時,模擬元件可以具有一系列值。給定信號存儲的值取決于設(shè)備的屬性。在絲狀RRAM中,電阻隨著導(dǎo)電細(xì)絲在器件的端子之間形成而下降。一系列弱編程脈沖可能會產(chǎn)生弱細(xì)絲,而強(qiáng)脈沖會產(chǎn)生更強(qiáng)的細(xì)絲。因此,存儲給定值所需的脈沖強(qiáng)度和數(shù)量取決于長絲形成的動力學(xué)。學(xué)習(xí)速率取決于電阻狀態(tài)與從一個狀態(tài)移動到下一個狀態(tài)所需的脈沖數(shù)之間的分離。

對于推理任務(wù),可以使用傳統(tǒng)CMOS邏輯計算權(quán)重,然后將其存儲在RRAM陣列中。使用給定數(shù)量的編程脈沖實現(xiàn)的精確值可能因設(shè)備而異,但模擬表明在面對這些變化時總體精度是穩(wěn)健的。

然而,對于學(xué)習(xí)任務(wù),隨著修正在網(wǎng)絡(luò)中的傳播,個體權(quán)重需要上下調(diào)整。不幸的是,當(dāng)前的RRAM設(shè)備通常具有對SET和RESET脈沖有不對稱響應(yīng)。簡單地改變編程脈沖的符號不會在相反的方向上產(chǎn)生相等的調(diào)整。這種不對稱性是學(xué)習(xí)任務(wù)在記憶中實現(xiàn)的一個主要問題。

耐力,穩(wěn)定性和可重復(fù)性

如上所述,清華大學(xué)的研究生Meiran Zhao表示,學(xué)習(xí)任務(wù)還需要大量的數(shù)據(jù)和非常多的重量更新,大約10 5和10 7。針對傳統(tǒng)存儲應(yīng)用設(shè)計的RRAM陣列的測試將設(shè)備壽命放在相同的范圍內(nèi)。然而,數(shù)據(jù)存儲應(yīng)用需要數(shù)字值——一個設(shè)備是開著的還是關(guān)著的——并且通常使用足夠強(qiáng)的設(shè)置和重置脈沖來創(chuàng)建或移除一根強(qiáng)導(dǎo)電絲。如果使用弱脈沖代替,趙的小組表明模擬切換在超過10 11之后沒有失敗更新脈沖,盡管學(xué)習(xí)準(zhǔn)確度確實降低到超過10 9個更新脈沖。

所需的大量訓(xùn)練周期也會威脅存儲的重量值的穩(wěn)定性。在RRAM裝置中,燈絲的導(dǎo)電率由燈絲體積內(nèi)的氧空位濃度決定。該濃度又由施加的電壓脈沖控制。但是,不可能精確控制個別職位空缺的位置。當(dāng)它們在器件內(nèi)遷移時,無論是在電壓梯度的影響下還是在熱激發(fā)后,精確的電阻都會發(fā)生變化。

另一種非易失性存儲器,即電化學(xué)RAM,試圖解決絲狀RRAM的局限性。當(dāng)RRAM是雙終端設(shè)備時,ECRAM是三終端設(shè)備。施加到第三端子的電壓控制離子從LiPON電解質(zhì)層插入到WO 3導(dǎo)體中。電阻取決于氧化還原反應(yīng),該反應(yīng)可以在開啟和關(guān)閉方向上精確且可重復(fù)地控制。

超越神經(jīng)網(wǎng)絡(luò)

卷積神經(jīng)網(wǎng)絡(luò)是最常見的機(jī)器學(xué)習(xí)技術(shù),但它不一定是最好的。新興存儲器設(shè)備的非線性概率行為對于某些算法來說是一個挑戰(zhàn),但對其他算法來說可能是一個優(yōu)勢。

例如,生成對抗網(wǎng)絡(luò)使用一個神經(jīng)網(wǎng)絡(luò)為另一個生成測試示例。當(dāng)“鑒別器”網(wǎng)絡(luò)能夠區(qū)分真實數(shù)據(jù)和“發(fā)生器”網(wǎng)絡(luò)生成的示例時,它就是成功的。

因此,鑒別器網(wǎng)絡(luò)可以通過顯示由發(fā)生器網(wǎng)絡(luò)創(chuàng)建的一組非小狗圖像來學(xué)習(xí)識別小狗的照片。生成對抗性網(wǎng)絡(luò)算法的一個挑戰(zhàn)是生成測試示例,這些測試示例涵蓋了所有感興趣的真實情況?!澳J絹G棄”,其中生成的示例聚集在有限數(shù)量的類別周圍,可能會由于RRAM網(wǎng)絡(luò)固有的隨機(jī)性而減少。同樣的非線性行為使得精確的權(quán)重難以存儲,這可能導(dǎo)致更多的測試示例。

RRAM行為與歷史有關(guān)。給定的重置脈沖實際重置設(shè)備的概率會隨著之前設(shè)置的脈沖數(shù)的增加而降低。Imec的一個小組使用這種行為作為時間序列學(xué)習(xí)規(guī)則的基礎(chǔ) - 在時間t有效的裝置用于預(yù)測在時間t +Δ處有效的裝置。將該預(yù)測與實際數(shù)據(jù)進(jìn)行比較,然后通過SET脈沖加強(qiáng)具有正確預(yù)測的設(shè)備,而通過RESET脈沖削弱具有不正確預(yù)測的設(shè)備。訓(xùn)練之后,將得到的網(wǎng)絡(luò)拓?fù)溆米魃尚聰?shù)據(jù)序列的模型。

最后,密歇根大學(xué)的研究人員將RRAM交叉開關(guān)陣列與隨機(jī)導(dǎo)電橋存儲器件結(jié)合使用,通過模擬退火來解決“自旋玻璃”優(yōu)化問題。自旋玻璃問題源于物理學(xué),但也適用于許多其他領(lǐng)域,它試圖尋找相互作用自旋的隨機(jī)二維陣列的最低能量狀態(tài)。模擬退火隨機(jī)翻轉(zhuǎn)一組單個自旋,保留那些減少系統(tǒng)總能量的翻轉(zhuǎn),然后降低系統(tǒng)溫度并重復(fù)該過程。密歇根集團(tuán)利用CBRAMS的隨機(jī)切換概率來降低找到局部最小狀態(tài)而不是真正的最低能量狀態(tài)的風(fēng)險。

內(nèi)存計算展望未來

從歷史上看,電子設(shè)備研究首先出現(xiàn),然后電氣工程師和軟件開發(fā)人員學(xué)會了如何利用新功能。

在過去的幾年里,新興的存儲設(shè)備已經(jīng)從實驗室的奇思妙想,到令人失望的閃存替代品,再到新機(jī)器學(xué)習(xí)方法的推動者。

接下來的幾年將展示半導(dǎo)體行業(yè)是否可以使用這些設(shè)備來幫助管理它正在幫助創(chuàng)建的數(shù)據(jù)大爆炸。

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • 內(nèi)存計算
    +關(guān)注

    關(guān)注

    1

    文章

    15

    瀏覽量

    12301
  • 大數(shù)據(jù)
    +關(guān)注

    關(guān)注

    64

    文章

    9075

    瀏覽量

    143874

原文標(biāo)題:數(shù)據(jù)大爆炸?讓人焦慮的內(nèi)存計算怎么克服?

文章出處:【微信號:eda365wx,微信公眾號:EDA365電子論壇】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關(guān)推薦
    熱點推薦

    三星SOCAMM2內(nèi)存模組提升AI數(shù)據(jù)中心帶寬與能效表現(xiàn)

    隨著人工智能在全球范圍內(nèi)加速普及,數(shù)據(jù)中心的計算工作負(fù)載正經(jīng)歷爆炸式增長。隨著大規(guī)模模型訓(xùn)練向持續(xù)推理的轉(zhuǎn)變,挑戰(zhàn)不再僅僅局限于性能一一能效對于維持下一代人工智能基礎(chǔ)設(shè)施的運(yùn)行也變得至關(guān)重要。這一轉(zhuǎn)變推動了對低功耗
    的頭像 發(fā)表于 03-16 10:28 ?390次閱讀

    從真實爆炸到實驗室模擬:爆炸分離沖擊試驗方法的演進(jìn)

    爆炸分離沖擊試驗是一種用于評估材料和設(shè)備在爆炸環(huán)境下的耐受能力的專項測試,是模擬航天器、導(dǎo)彈等裝備在爆炸分離瞬間承受的沖擊環(huán)境,驗證其結(jié)構(gòu)完整性和功能可靠性的關(guān)鍵測試。該試驗主要用于軍事裝備
    的頭像 發(fā)表于 03-06 16:15 ?76次閱讀
    從真實<b class='flag-5'>爆炸</b>到實驗室模擬:<b class='flag-5'>爆炸</b>分離沖擊試驗方法的演進(jìn)

    超級電容充電寶會爆炸嗎?

    “嘭——”地鐵扶梯上,一團(tuán)火球從乘客兜里竄出,羽絨服瞬間燒穿。視頻只有7秒,卻足以全網(wǎng)充電寶用戶后背發(fā)涼。爆炸之后,除了拍視頻上傳,更多人開始追問:如果受傷的是我,到底該找誰賠?
    的頭像 發(fā)表于 02-10 09:17 ?463次閱讀
    超級電容充電寶會<b class='flag-5'>爆炸</b>嗎?

    曙光云發(fā)布“HME內(nèi)存聚變技術(shù)”

    當(dāng)下,內(nèi)存市場價格迎來狂飆式上漲,這無數(shù)數(shù)字化項目陷入“預(yù)算超支”與“配置縮水”的兩難境地。在硬件成本居高不下的當(dāng)下,如何用有限預(yù)算交付達(dá)標(biāo)的算力,成為眾多企業(yè)亟待解決的難題。 對此,曙光云給出
    的頭像 發(fā)表于 02-08 16:26 ?6.1w次閱讀

    天合儲能釋放AIDC構(gòu)網(wǎng)型儲能系統(tǒng)降本增效價值

    2026年的第一次信息大爆炸,在CES開幕演講中正式展開,伴隨AI普及率的持續(xù)上升,日益復(fù)雜的應(yīng)答思考路徑,人工智能的算力需求成指數(shù)級增長,全球頭部科技巨擘達(dá)成共識,未來五年,全球潛在算力需求將超過10 Yottaflops。
    的頭像 發(fā)表于 01-19 10:47 ?596次閱讀
    天合儲能釋放AIDC構(gòu)網(wǎng)型儲能系統(tǒng)降本增效價值

    C語言內(nèi)存池使用

    C語言的內(nèi)存管理,從來都是一個人頭禿的問題。要想更自由地管理內(nèi)存,就必須去堆中申請,然后還需要考慮何時釋放,萬一釋放不當(dāng),或者沒有及時釋放,造成的后果都是難以估量的。 當(dāng)然如果就這些,那倒也還不
    發(fā)表于 12-11 07:57

    為啥 AI 計算速度這么驚人?—— 聊聊 GPU、內(nèi)存與并行計算

    提到AI,大家常說它“算得快”,其實是指AI能在眨眼間處理海量數(shù)據(jù)??伤鼮樯队羞@本事?答案就藏在“GPU+高速內(nèi)存+并行計算”這trio(組合)里。咱們可以把AI要處理的數(shù)據(jù),想象成一
    的頭像 發(fā)表于 12-05 14:35 ?937次閱讀
    為啥 AI <b class='flag-5'>計算</b>速度這么驚人?—— 聊聊 GPU、<b class='flag-5'>內(nèi)存</b>與并行<b class='flag-5'>計算</b>

    內(nèi)存數(shù)據(jù)處理優(yōu)化藝術(shù)

    ,避免了數(shù)組索引的額外計算。 選擇合適的數(shù)據(jù)類型同樣重要。如果一個變量只需要表示0或1,使用最小所需的數(shù)據(jù)類型就比使用較大的類型更好,因為它占用內(nèi)存更少,可能提高緩存利用率。 對于浮點
    發(fā)表于 11-14 07:46

    Credo發(fā)布業(yè)界首款內(nèi)存扇出Gearbox

    和橫向擴(kuò)展問題。Weaver專為克服AI推理工作負(fù)載中的內(nèi)存瓶頸而設(shè)計,為下一代數(shù)據(jù)中心和AI應(yīng)用提供前所未有的可擴(kuò)展性、帶寬和效率。
    的頭像 發(fā)表于 11-08 11:01 ?2350次閱讀

    科普:什么AI 內(nèi)存技術(shù)

    問題。 為什么 AI 內(nèi)存很重要? 在 AI 模型訓(xùn)練和推理過程中,大量的數(shù)據(jù)需要從內(nèi)存傳輸?shù)教幚砥鳎ㄈ?GPU 或 TPU)進(jìn)行計算。傳統(tǒng)的內(nèi)存
    的頭像 發(fā)表于 09-03 15:44 ?1496次閱讀

    利用NVIDIA Cosmos模型訓(xùn)練通用機(jī)器

    機(jī)器領(lǐng)域的一大核心挑戰(zhàn)在于如何機(jī)器掌握新任務(wù),而無需針對每個新任務(wù)和環(huán)境耗費大量精力收集和標(biāo)注數(shù)據(jù)集。NVIDIA 的最新研究方案通過生成式 AI、世界基礎(chǔ)模型(如 NVIDIA
    的頭像 發(fā)表于 08-05 16:22 ?2152次閱讀
    利用NVIDIA Cosmos模型訓(xùn)練通用機(jī)器<b class='flag-5'>人</b>

    低軌衛(wèi)星物聯(lián)網(wǎng)通信終端:云翎智能如何打通“天地”三域數(shù)據(jù)閉環(huán)?

    云翎智能以低軌衛(wèi)星物聯(lián)網(wǎng)終端為核心,構(gòu)建“天地”三域數(shù)據(jù)閉環(huán):通過500-2000公里低軌衛(wèi)星星座實現(xiàn)全球無縫覆蓋,集成北斗定位與AI邊緣計算,終端在無網(wǎng)絡(luò)區(qū)自主處理
    的頭像 發(fā)表于 07-24 00:36 ?896次閱讀
    低軌衛(wèi)星物聯(lián)網(wǎng)通信終端:云翎智能如何打通“天地<b class='flag-5'>人</b>”三域<b class='flag-5'>數(shù)據(jù)</b>閉環(huán)?

    無創(chuàng)快檢新突破:芯片實驗室微通道側(cè)向流技術(shù)借唾液破譯焦慮抑郁密碼

    在快節(jié)奏的現(xiàn)代生活中,焦慮癥和抑郁癥等精神疾病正逐漸成為威脅人們身心健康的 “隱形殺手”。據(jù)世界衛(wèi)生組織數(shù)據(jù)顯示,全球有超過 3 億患有抑郁癥,焦慮癥患者數(shù)量同樣龐大。傳統(tǒng)的精神疾病
    的頭像 發(fā)表于 06-20 11:09 ?728次閱讀

    天拓四方邊緣計算采集網(wǎng)關(guān),設(shè)備“會思考”

    ,助力客戶加速數(shù)字化轉(zhuǎn)型。 一、邊緣智能:設(shè)備“會思考” TDE網(wǎng)關(guān)通過Modbus、OPC UA等工業(yè)協(xié)議,實現(xiàn)CNC機(jī)床、工業(yè)機(jī)器等設(shè)備的秒級數(shù)據(jù)采集,并在邊緣端完成: 實時分析:振動監(jiān)測預(yù)警刀具磨損,溫度
    的頭像 發(fā)表于 04-15 17:32 ?672次閱讀
    天拓四方邊緣<b class='flag-5'>計算</b>采集網(wǎng)關(guān),<b class='flag-5'>讓</b>設(shè)備“會思考”

    Samtec應(yīng)用分享 | 適用于最新內(nèi)存應(yīng)用的連接解決方案

    摘要前言 Samtec在為數(shù)據(jù)通信領(lǐng)域的存儲設(shè)備創(chuàng)建連接解決方案方面有著悠久的傳統(tǒng)。 內(nèi)存一直是任何計算機(jī)系統(tǒng)的重要組成部分。無論是在處理數(shù)據(jù)之前檢索
    發(fā)表于 04-02 11:28 ?972次閱讀
    Samtec應(yīng)用分享 | 適用于最新<b class='flag-5'>內(nèi)存</b>應(yīng)用的連接解決方案