91欧美超碰AV自拍|国产成年人性爱视频免费看|亚洲 日韩 欧美一厂二区入|人人看人人爽人人操aV|丝袜美腿视频一区二区在线看|人人操人人爽人人爱|婷婷五月天超碰|97色色欧美亚州A√|另类A√无码精品一级av|欧美特级日韩特级

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

巨頭們的人工智能芯片研發(fā)得怎么樣了

0BFC_eet_china ? 來源:未知 ? 作者:鄧佳佳 ? 2018-03-04 16:31 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

前言

根據(jù)百度(Baidu)深度學(xué)習(xí)(deep learning)資深研究人員針對最新加速器進(jìn)行的測試結(jié)果顯示,現(xiàn)有的加速器芯片和軟件仍然存在一些美中不足之處,應(yīng)該盡快迎頭趕上。

這些結(jié)果有一部份來自于使用DeepBench測試。DeepBench是使用32位浮點(diǎn)數(shù)學(xué)訓(xùn)練神經(jīng)網(wǎng)絡(luò)的開放來源基準(zhǔn)。號(hào)稱“中國Google”的百度于2016年9月發(fā)布DeepBench,并在去年6月進(jìn)行了更新,使其涵蓋推論工作以及使用16位數(shù)學(xué)運(yùn)算。

DeepBench利用神經(jīng)網(wǎng)絡(luò)庫測試不同硬件的基本運(yùn)算效能(來源:Baidu)

百度硅谷人工智能實(shí)驗(yàn)室(Silicon Valley AI Lab)資深研究員Greg Daimos解釋。在一些像矩陣乘法這樣的底層作業(yè)中,具有專用硬件的芯片(例如Nvidia Volta GPU的張量核心)能夠提供“數(shù)百TeraFlops (每秒1兆次浮點(diǎn)運(yùn)算)。..比前一代的5-10TFLOPS更快幾個(gè)數(shù)量級(jí)?!?/p>

然而,他說:“在實(shí)際應(yīng)用中所使用的一些底層作業(yè)并沒有足夠的(數(shù)據(jù))區(qū)域性,讓這些專用處理器充份發(fā)揮效能,所以我們必須為其適度地加速,或者改變算法。”

百度研究小組目前正探索兩種方式使用新芯片獲得更大回報(bào)。一方面,研究人員在其算法中開啟控制功能,以便同時(shí)接收饋入數(shù)據(jù),期望能提高10倍的資料平行性。

另一條途徑是讓所有的模型看起來更像一般用于成像應(yīng)用的卷積神經(jīng)網(wǎng)絡(luò)(CNN)。Daimos說,CNN比一般用于文本或音頻應(yīng)用(app)等循序數(shù)據(jù)的遞歸神經(jīng)網(wǎng)絡(luò)(RNN)具有更多區(qū)域性。

研究人員在從文本產(chǎn)生音頻的百度模型中,“以CNN層取代RNN層堆?!?,使得“運(yùn)算密度提高了40倍”,從而帶來了更好的新硬件利用率。他強(qiáng)調(diào),“我們必須透過編寫的所有應(yīng)用程序來檢視是否可以普遍使用這種方法,或只是將其用于語音合成。”

目前尚不清楚這兩種方法的研究成果何時(shí)可用于生產(chǎn)系統(tǒng)。同時(shí),Daimos也分享了硬件測試的其它觀察結(jié)果。

編程、內(nèi)存與靈活性

雖然百度取得將近90%的Nvidia Volta最佳利用率,但編程GPU并非易事。Diamos說,該芯片“有著成千上萬個(gè)線程,你必須在一個(gè)問題上進(jìn)行協(xié)調(diào)和同步。..。..編寫這樣的程序代碼并不容易,而當(dāng)面對的是像張量核心這樣的對象時(shí)就更困難了?!?/p>

的確,Diamos表示,“讓這些任務(wù)變得更易于編程,正是我們面臨的最大挑戰(zhàn)。....而其中最大的問題就出在內(nèi)存。我們想要執(zhí)行更大的神經(jīng)網(wǎng)絡(luò),但內(nèi)存比預(yù)期地更快耗盡,這并不是透過打造更好的處理器就能解決的問題?!?/p>

他補(bǔ)充說,該問題的一部份答案在于尋找能與新興內(nèi)存搭配作業(yè)的技術(shù),例如許多最新加速器所使用的高帶寬內(nèi)存(HBM)芯片堆棧等。

在百度的測試中,英特爾Intel)多核心x86處理器Xeon Phi的利用率甚至高于Nvidia Volta。然而,英特爾的芯片還沒有任何張量專用核心,因此該芯片在神經(jīng)網(wǎng)絡(luò)作業(yè)上的性能不若Volta。

Nvidia Volta配備640個(gè)Tensor核心,每秒提供超過100TFLOPS的深度學(xué)習(xí)效能(來源:Nvidia)

直接進(jìn)行比較并不容易,因?yàn)椴煌男酒ǔJ褂貌煌倪\(yùn)算格式。例如,Xeon Phi采用定點(diǎn)數(shù)學(xué),而Volta則混合使用16位和32位浮點(diǎn)運(yùn)算。

Diamos說:“英特爾芯片的測試結(jié)果顯示,對于一些CNN來說,定點(diǎn)數(shù)學(xué)運(yùn)算沒問題。然而Nvidia發(fā)布的結(jié)果顯示在影像和語音應(yīng)用上表現(xiàn)良好,所以我們?nèi)〉昧艘恍?shù)據(jù),但還需要進(jìn)行更多研究?!?/p>

他稱贊AMD最新的GPU及其新的機(jī)器學(xué)習(xí)開放軟件是正確的發(fā)展方向,但指出他們也缺乏張量核心。他表示,對于英特爾Nirvana和Graphcore Colossus等芯片“沒啥可分享的消息”,也許是因?yàn)榘俣瓤赡苓€在測試其預(yù)先發(fā)布的樣片。

擁有大量的矩陣乘法單元通常是一件好事。但是,Volta、Nervana和Colossus處理器則以充滿矩陣乘法數(shù)組的芯片將其性能指針推進(jìn)到或接近其工藝節(jié)點(diǎn)所能實(shí)現(xiàn)的極限。

他說:“最終你的收益會(huì)遞減。..。..讓你不得不放棄靈活度,以便為更多不同的工作負(fù)載進(jìn)行更精密的運(yùn)算。因此,我們應(yīng)該找到曲線的轉(zhuǎn)折點(diǎn),讓芯片不僅在CNN上運(yùn)作良好,在其它方面也表現(xiàn)出色?!?/p>

神經(jīng)網(wǎng)絡(luò)軟件架構(gòu)各執(zhí)一端

除了底層數(shù)學(xué)之外,加速器還可能缺少優(yōu)化,因?yàn)樗鼈儾⒉煌耆私馍疃葘W(xué)習(xí)應(yīng)用的所有范圍。

當(dāng)今用于設(shè)計(jì)神經(jīng)網(wǎng)絡(luò)的競爭軟件架構(gòu)各執(zhí)一端,可能會(huì)讓情況變得復(fù)雜。遺憾的是,跨不同架構(gòu)建立標(biāo)準(zhǔn)規(guī)格的努力也是各自為政,Diamos指出他的團(tuán)隊(duì)注意到目前有11種開發(fā)中規(guī)格分別處于不同的完善階段。

他說,由Facebook和微軟(Microsoft)發(fā)起的開放神經(jīng)網(wǎng)絡(luò)交換格式(ONNX)“正朝著正確的方向發(fā)展,但仍缺乏一些像是如何表達(dá)控制流程和反向傳播的特性?!?/p>

最近有20多家廠商(主要是半導(dǎo)體供應(yīng)商)宣布了神經(jīng)網(wǎng)絡(luò)交換格式(Neural Network Exchange Format),他們認(rèn)為該格式對芯片廠商來說更好。Diamos說:“要搞清這些格式中是否有些能成功實(shí)施可能還為時(shí)過早,但我們正踏上一條更好的發(fā)展道路,確實(shí)也需要其中某一種規(guī)格勝出?!?/p>

他補(bǔ)充說:“在2014年,我當(dāng)時(shí)認(rèn)為未來將會(huì)看到人工智能(AI)架構(gòu)的融合,就像如今在繪圖API中所看到的,但人們?nèi)匀辉诎l(fā)明新的神經(jīng)網(wǎng)絡(luò)類型,有時(shí)還會(huì)創(chuàng)造新的原型,所以它可能會(huì)像編程語言的多樣性一樣不斷地與時(shí)俱進(jìn)?!?/p>

也就是說,Daimos仍然看好深度學(xué)習(xí)。在今年稍早時(shí),他的團(tuán)隊(duì)發(fā)表研究指出,這一領(lǐng)域尚未成熟,預(yù)計(jì)接下來將會(huì)看到更多的突破。

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報(bào)投訴
  • 人工智能
    +關(guān)注

    關(guān)注

    1817

    文章

    50099

    瀏覽量

    265446
  • 人工智能芯片
    +關(guān)注

    關(guān)注

    1

    文章

    124

    瀏覽量

    31029

原文標(biāo)題:巨頭們的人工智能芯片研發(fā)得怎么樣了?

文章出處:【微信號(hào):eet-china,微信公眾號(hào):電子工程專輯】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評(píng)論

    相關(guān)推薦
    熱點(diǎn)推薦

    淺談人工智能(2)

    接前文《淺談人工智能(1)》。 (5)什么是弱人工智能、強(qiáng)人工智能以及超人工智能? 弱人工智能(Weak AI),也稱限制領(lǐng)域
    的頭像 發(fā)表于 02-22 08:24 ?127次閱讀
    淺談<b class='flag-5'>人工智能</b>(2)

    自然智能與人工智能融合如何重塑芯片設(shè)計(jì)

    人類大腦是所有處理器中最復(fù)雜的,能夠構(gòu)思出不可思議的創(chuàng)意,解決復(fù)雜、微妙的問題。相比之下,人工智能擅長快速分析海量數(shù)據(jù)并高效執(zhí)行任務(wù)。當(dāng)自然智能人工智能融合的結(jié)果,就是芯片設(shè)計(jì)領(lǐng)域正
    的頭像 發(fā)表于 01-15 13:58 ?519次閱讀

    嵌入式系統(tǒng)中的人工智能

    本文編譯自ElectronicDesign人工智能(AI)正徹底變革嵌入式系統(tǒng),改變技術(shù)融入日常生活的方式。如今的人工智能不再局限于執(zhí)行基礎(chǔ)任務(wù),它還被應(yīng)用于智能汽車、工業(yè)自動(dòng)化、醫(yī)療設(shè)備和
    的頭像 發(fā)表于 12-18 11:49 ?1039次閱讀
    嵌入式系統(tǒng)中<b class='flag-5'>的人工智能</b>

    微軟與新思科技分享智能人工智能技術(shù)的行業(yè)影響

    在2025年世界移動(dòng)通信大會(huì)(MWC 2025)上,微軟(Microsoft)與新思科技(Synopsys)兩家科技巨頭攜手登臺(tái),分享他們對人工智能(AI)發(fā)展的最新洞見、智能
    的頭像 發(fā)表于 11-30 09:48 ?410次閱讀

    人工智能+消費(fèi):技術(shù)賦能與芯片驅(qū)動(dòng)未來

    電子發(fā)燒友網(wǎng)站提供《人工智能+消費(fèi):技術(shù)賦能與芯片驅(qū)動(dòng)未來.pptx》資料免費(fèi)下載
    發(fā)表于 11-26 14:50 ?34次下載

    AI 芯片浪潮下,職場晉升新契機(jī)?

    方向,就明確涵蓋了人工智能芯片研發(fā)、部署與優(yōu)化技術(shù)崗位 。如果你從事 GPU 相關(guān)研發(fā)工作,在申報(bào)職稱時(shí),就需著重突出在圖形處理加速、大規(guī)模并行計(jì)算等方面的成果,因?yàn)?GPU 的高并
    發(fā)表于 08-19 08:58

    挖到寶!人工智能綜合實(shí)驗(yàn)箱,高校新工科的寶藏神器

    的深度學(xué)習(xí),構(gòu)建起從基礎(chǔ)到前沿的完整知識(shí)體系,一門實(shí)驗(yàn)箱就能滿足多門課程的學(xué)習(xí)實(shí)踐需求,既節(jié)省經(jīng)費(fèi)又不占地 。 五、代碼全開源,學(xué)習(xí)底層算法 所有實(shí)驗(yàn)全部開源,這對于想要深入學(xué)習(xí)人工智能技術(shù)的人來說
    發(fā)表于 08-07 14:30

    挖到寶!比鄰星人工智能綜合實(shí)驗(yàn)箱,高校新工科的寶藏神器!

    的深度學(xué)習(xí),構(gòu)建起從基礎(chǔ)到前沿的完整知識(shí)體系,一門實(shí)驗(yàn)箱就能滿足多門課程的學(xué)習(xí)實(shí)踐需求,既節(jié)省經(jīng)費(fèi)又不占地 。 五、代碼全開源,學(xué)習(xí)底層算法 所有實(shí)驗(yàn)全部開源,這對于想要深入學(xué)習(xí)人工智能技術(shù)的人來說
    發(fā)表于 08-07 14:23

    關(guān)于人工智能處理器的11個(gè)誤解

    應(yīng)用,以及哪些是真實(shí)情況而哪些只是炒作,仍存在諸多誤解。GPU是最佳的人工智能處理器盡管GPU在人工智能的實(shí)現(xiàn)過程中發(fā)揮了關(guān)鍵作用,而且如今它們的應(yīng)用也極為廣泛,但將其推
    的頭像 發(fā)表于 08-07 13:21 ?1072次閱讀
    關(guān)于<b class='flag-5'>人工智能</b>處理器的11個(gè)誤解

    愛芯元智亮相2025世界人工智能大會(huì)

    近日,2025年世界人工智能大會(huì)(WAIC 2025)正式開幕,愛芯元智作為行業(yè)領(lǐng)先的人工智能感知與邊緣計(jì)算芯片創(chuàng)新研發(fā)企業(yè),再次亮相展會(huì)。在這場為期3天的展會(huì)上,愛芯元智以“AI芯賦
    的頭像 發(fā)表于 08-01 10:41 ?1689次閱讀

    最新人工智能硬件培訓(xùn)AI 基礎(chǔ)入門學(xué)習(xí)課程參考2025版(大模型篇)

    人工智能大模型重塑教育與社會(huì)發(fā)展的當(dāng)下,無論是探索未來職業(yè)方向,還是更新技術(shù)儲(chǔ)備,掌握大模型知識(shí)都已成為新時(shí)代的必修課。從職場上輔助工作的智能助手,到課堂用于學(xué)術(shù)研究的智能工具,大模型正在工作生活
    發(fā)表于 07-04 11:10

    科大訊飛加速東南亞企業(yè)的人工智能應(yīng)用

    日前,科大訊飛在新加坡成功舉辦合作伙伴峰會(huì)暨創(chuàng)新產(chǎn)品發(fā)布會(huì)。這場匯聚關(guān)鍵合作伙伴、行業(yè)先驅(qū)和技術(shù)領(lǐng)袖的盛會(huì),不僅集中展示科大訊飛最新AI創(chuàng)新成果,更彰顯人工智能推動(dòng)企業(yè)業(yè)務(wù)轉(zhuǎn)型的決心。 活動(dòng)
    的頭像 發(fā)表于 05-06 09:39 ?912次閱讀

    開售RK3576 高性能人工智能主板

    ,HDMI-4K 輸出,支 持千兆以太網(wǎng),WiFi,USB 擴(kuò)展/重力感應(yīng)/RS232/RS485/IO 擴(kuò)展/I2C 擴(kuò)展/MIPI 攝像頭/紅外遙控 器等功能,豐富的接口,一個(gè)全新八核擁有超強(qiáng)性能的人工智能
    發(fā)表于 04-23 10:55

    AI人工智能隱私保護(hù)怎么

    在當(dāng)今科技飛速發(fā)展的時(shí)代,AI人工智能已經(jīng)深入到我們生活的方方面面,從醫(yī)療診斷到交通調(diào)度,從教育輔助到娛樂互動(dòng),其影響力無處不在。然而,隨著AI人工智能的廣泛應(yīng)用,其安全性問題也備受關(guān)注。那么,AI
    的頭像 發(fā)表于 03-11 09:46 ?1209次閱讀
    AI<b class='flag-5'>人工智能</b>隱私保護(hù)怎么<b class='flag-5'>樣</b>