91欧美超碰AV自拍|国产成年人性爱视频免费看|亚洲 日韩 欧美一厂二区入|人人看人人爽人人操aV|丝袜美腿视频一区二区在线看|人人操人人爽人人爱|婷婷五月天超碰|97色色欧美亚州A√|另类A√无码精品一级av|欧美特级日韩特级

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

關(guān)于AI芯片格局分析和介紹

lC49_半導(dǎo)體 ? 來(lái)源:djl ? 作者: 吳軍寧 ? 2019-09-02 17:31 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

如果說(shuō)2016年3月份AlphaGo與李世石的那場(chǎng)人機(jī)大戰(zhàn)只在科技界和圍棋界產(chǎn)生較大影響的話,那么2017年5月其與排名第一的世界圍棋冠軍柯潔的對(duì)戰(zhàn)則將人工智能技術(shù)推向了公眾視野。阿爾法狗(AlphaGo)是第一個(gè)擊敗人類職業(yè)圍棋選手、第一個(gè)戰(zhàn)勝圍棋世界冠軍的人工智能程序,由谷歌(Google)旗下DeepMind公司戴密斯·哈薩比斯領(lǐng)銜的團(tuán)隊(duì)開發(fā),其主要工作原理是“深度學(xué)習(xí)”。

其實(shí)早在2012年,深度學(xué)習(xí)技術(shù)就已經(jīng)在學(xué)術(shù)界引起了廣泛地討論。在這一年的ImageNet大規(guī)模視覺(jué)識(shí)別挑戰(zhàn)賽ILSVRC中,采用5個(gè)卷積層和3個(gè)全連接層的神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)AlexNet,取得了top-5(15.3%)的歷史最佳錯(cuò)誤率,而第二名的成績(jī)僅為26.2%。從此以后,就出現(xiàn)了層數(shù)更多、結(jié)構(gòu)更為復(fù)雜的神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu),如ResNet、GoogleNet、VGGNet和MaskRCNN等,還有去年比較火的生成式對(duì)抗網(wǎng)絡(luò)GAN。

關(guān)于AI芯片格局分析和介紹

不論是贏得視覺(jué)識(shí)別挑戰(zhàn)賽的AlexNet,還是擊敗圍棋冠軍柯潔的AlphaGo,它們的實(shí)現(xiàn)都離不開現(xiàn)代信息技術(shù)的核心——處理器,不論這個(gè)處理器是傳統(tǒng)的CPU,還是GPU,還是新興的專用加速部件NNPU(NNPU是Neural Network Processing Unit的簡(jiǎn)稱)。在計(jì)算機(jī)體系結(jié)構(gòu)國(guó)際頂級(jí)會(huì)議ISCA2016上有個(gè)關(guān)于體系結(jié)構(gòu)2030的小型研討會(huì),名人堂成員UCSB的謝源教授就對(duì)1991年以來(lái)在ISCA收錄的論文進(jìn)行了總結(jié),專用加速部件相關(guān)的論文收錄是在2008年開始,而在2016年達(dá)到了頂峰,超過(guò)了處理器、存儲(chǔ)器以及互聯(lián)結(jié)構(gòu)等三大傳統(tǒng)領(lǐng)域。而在這一年,來(lái)自中國(guó)科學(xué)院計(jì)算技術(shù)研究所的陳云霽、陳天石研究員課題組提交的《一種神經(jīng)網(wǎng)絡(luò)指令集》論文,更是ISCA2016最高得分論文。

關(guān)于AI芯片格局分析和介紹

在具體介紹AI芯片國(guó)內(nèi)外之前,看到這里有部分讀者或許會(huì)產(chǎn)生這樣的疑惑:這不都是在說(shuō)神經(jīng)網(wǎng)絡(luò)和深度學(xué)習(xí)嗎?那么我覺(jué)得有必要對(duì)人工智能和神經(jīng)網(wǎng)絡(luò)的概念進(jìn)行闡述,特別是2017年工信部發(fā)布的《促進(jìn)新一代人工智能產(chǎn)業(yè)發(fā)展三年行動(dòng)計(jì)劃(2018-2020年)》中,對(duì)發(fā)展目標(biāo)的描述很容易讓人覺(jué)得人工智能就是神經(jīng)網(wǎng)絡(luò),AI芯片就是神經(jīng)網(wǎng)絡(luò)芯片。

人工智能整體核心基礎(chǔ)能力顯著增強(qiáng),智能傳感器技術(shù)產(chǎn)品實(shí)現(xiàn)突破,設(shè)計(jì)、代工、封測(cè)技術(shù)達(dá)到國(guó)際水平,神經(jīng)網(wǎng)絡(luò)芯片實(shí)現(xiàn)量產(chǎn)并在重點(diǎn)領(lǐng)域?qū)崿F(xiàn)規(guī)模化應(yīng)用,開源開發(fā)平臺(tái)初步具備支撐產(chǎn)業(yè)快速發(fā)展的能力。

其實(shí)則不然。人工智能是一個(gè)很老很老的概念,而神經(jīng)網(wǎng)絡(luò)只不過(guò)是人工智能范疇的一個(gè)子集。早在1956年,被譽(yù)為“人工智能之父”的圖靈獎(jiǎng)得主約翰·麥卡錫就這樣定義人工智能:創(chuàng)造智能機(jī)器的科學(xué)與工程。而在1959年,Arthur Samuel給出了人工智能的一個(gè)子領(lǐng)域機(jī)器學(xué)習(xí)的定義,即“計(jì)算機(jī)有能力去學(xué)習(xí),而不是通過(guò)預(yù)先準(zhǔn)確實(shí)現(xiàn)的代碼”,這也是目前公認(rèn)的對(duì)機(jī)器學(xué)習(xí)最早最準(zhǔn)確的定義。而我們?nèi)粘K熘纳窠?jīng)網(wǎng)絡(luò)、深度學(xué)習(xí)等都屬于機(jī)器學(xué)習(xí)的范疇,都是受大腦機(jī)理啟發(fā)而發(fā)展得來(lái)的。另外一個(gè)比較重要的研究領(lǐng)域就是脈沖神經(jīng)網(wǎng)絡(luò),國(guó)內(nèi)具有代表的單位和企業(yè)是清華大學(xué)類腦計(jì)算研究中心和上海西井科技等。

關(guān)于AI芯片格局分析和介紹

好了,現(xiàn)在終于可以介紹AI芯片國(guó)內(nèi)外的發(fā)展現(xiàn)狀了,當(dāng)然這些都是我個(gè)人的一點(diǎn)觀察和愚見(jiàn),管窺之見(jiàn)權(quán)當(dāng)拋磚引玉。

國(guó)外

技術(shù)寡頭,優(yōu)勢(shì)明顯

由于具有得天獨(dú)厚的技術(shù)和應(yīng)用優(yōu)勢(shì),英偉達(dá)和谷歌幾乎占據(jù)了人工智能處理領(lǐng)域80%的市場(chǎng)份額,而且在谷歌宣布其Cloud TPU開放服務(wù)和英偉達(dá)推出自動(dòng)駕駛處理器Xavier之后,這一份額占比在2018年有望進(jìn)一步擴(kuò)大。其他廠商,如英特爾、特斯拉、ARM、IBM以及Cadence等,也在人工智能處理器領(lǐng)域占有一席之地。

關(guān)于AI芯片格局分析和介紹

當(dāng)然,上述這些公司的專注領(lǐng)域卻不盡相同。比如英偉達(dá)主要專注于GPU和無(wú)人駕駛領(lǐng)域,而谷歌則主要針對(duì)云端市場(chǎng),英特爾則主要面向計(jì)算機(jī)視覺(jué),Cadence則以提供加速神經(jīng)網(wǎng)絡(luò)計(jì)算相關(guān)IP為主。如果說(shuō)前述這些公司還主要偏向處理器設(shè)計(jì)等硬件領(lǐng)域,那么ARM公司則主要偏向軟件,致力于針對(duì)機(jī)器學(xué)習(xí)和人工智能提供高效算法庫(kù)。

關(guān)于AI芯片格局分析和介紹

注:上述表格中所給為截止到2017年各研制單位公開可查的最新數(shù)據(jù)。

獨(dú)占鰲頭——英偉達(dá)

在人工智能領(lǐng)域,英偉達(dá)可以說(shuō)是目前涉及面最廣、市場(chǎng)份額最大的公司,旗下產(chǎn)品線遍布自動(dòng)駕駛汽車、高性能計(jì)算、機(jī)器人、醫(yī)療保健、云計(jì)算、游戲視頻等眾多領(lǐng)域。其針對(duì)自動(dòng)駕駛汽車領(lǐng)域的全新人工智能超級(jí)計(jì)算機(jī)Xavier,用NVIDIA首席執(zhí)行官黃仁勛的話來(lái)說(shuō)就是“這是我所知道的 SoC 領(lǐng)域非常了不起的嘗試,我們長(zhǎng)期以來(lái)一直致力于開發(fā)芯片。”

Xavier是一款完整的片上系統(tǒng)(SoC),集成了被稱為 Volta 的全新 GPU 架構(gòu)、定制 8 核 CPU 架構(gòu)以及新的計(jì)算機(jī)視覺(jué)加速器。該處理器提供 20 TOPS(萬(wàn)億次運(yùn)算/秒)的高性能,而功耗僅為 20 瓦。單個(gè) Xavier 人工智能處理器包含 70 億個(gè)晶體管,采用最前沿的 16nm FinFET 加工技術(shù)進(jìn)行制造,能夠取代目前配置了兩個(gè)移動(dòng) SoC 和兩個(gè)獨(dú)立 GPU 的 DRIVE PX 2,而功耗僅僅是它的一小部分。

而在2018年拉斯維加斯CES展會(huì)上,NVIDIA又推出了三款基于Xavier的人工智能處理器,包括一款專注于將增強(qiáng)現(xiàn)實(shí)(AR)技術(shù)應(yīng)用于汽車的產(chǎn)品、一款進(jìn)一步簡(jiǎn)化車內(nèi)人工智能助手構(gòu)建和部署的DRIVE IX和一款對(duì)其現(xiàn)有自主出租車大腦——Pegasus的修改,進(jìn)一步擴(kuò)大自己的優(yōu)勢(shì)。

產(chǎn)學(xué)研的集大成者——谷歌

如果你只是知道谷歌的AlphaGo、無(wú)人駕駛和TPU等這些人工智能相關(guān)的產(chǎn)品,那么你還應(yīng)該知道這些產(chǎn)品背后的技術(shù)大牛們:谷歌傳奇芯片工程師Jeff Dean、谷歌云計(jì)算團(tuán)隊(duì)首席科學(xué)家、斯坦福大學(xué)AI實(shí)驗(yàn)室主管李飛飛、Alphabet董事長(zhǎng)John Hennessy和谷歌杰出工程師David Patterson。

時(shí)至今日,摩爾定律遇到了技術(shù)和經(jīng)濟(jì)上的雙重瓶頸,處理器性能的增長(zhǎng)速度越來(lái)越慢,然而社會(huì)對(duì)于計(jì)算能力的需求增速卻并未減緩,甚至在移動(dòng)應(yīng)用、大數(shù)據(jù)、人工智能等新的應(yīng)用興起后,對(duì)于計(jì)算能力、計(jì)算功耗和計(jì)算成本等提出了新的要求。與完全依賴于通用CPU及其編程模型的傳統(tǒng)軟件編寫模式不同,異構(gòu)計(jì)算的整個(gè)系統(tǒng)包含了多種基于特定領(lǐng)域架構(gòu)(Domain-Specific Architecture, DSA)設(shè)計(jì)的處理單元,每一個(gè)DSA處理單元都有負(fù)責(zé)的獨(dú)特領(lǐng)域并針對(duì)該領(lǐng)域做優(yōu)化,當(dāng)計(jì)算機(jī)系統(tǒng)遇到相關(guān)計(jì)算時(shí)便由相應(yīng)的DSA處理器去負(fù)責(zé)。而谷歌就是異構(gòu)計(jì)算的踐行者,TPU就是異構(gòu)計(jì)算在人工智能應(yīng)用的一個(gè)很好例子。

2017年發(fā)布的第二代TPU芯片,不僅加深了人工智能在學(xué)習(xí)和推理方面的能力,而且谷歌是認(rèn)真地要將它推向市場(chǎng)。根據(jù)谷歌的內(nèi)部測(cè)試,第二代芯片針對(duì)機(jī)器學(xué)習(xí)的訓(xùn)練速度能比現(xiàn)在市場(chǎng)上的圖形芯片(GPU)節(jié)省一半時(shí)間;第二代TPU包括了四個(gè)芯片,每秒可處理180萬(wàn)億次浮點(diǎn)運(yùn)算;如果將64個(gè)TPU組合到一起,升級(jí)為所謂的TPU Pods,則可提供大約11500萬(wàn)億次浮點(diǎn)運(yùn)算能力。

計(jì)算機(jī)視覺(jué)領(lǐng)域的攪局者——英特爾

英特爾作為世界上最大的計(jì)算機(jī)芯片制造商,近年來(lái)一直在尋求計(jì)算機(jī)以外的市場(chǎng),其中人工智能芯片爭(zhēng)奪成為英特爾的核心戰(zhàn)略之一。為了加強(qiáng)在人工智能芯片領(lǐng)域的實(shí)力,不僅以167億美元收購(gòu)FPGA生產(chǎn)商Altera公司,還以153億美元收購(gòu)自動(dòng)駕駛技術(shù)公司Mobileye,以及機(jī)器視覺(jué)公司Movidius和為自動(dòng)駕駛汽車芯片提供安全工具的公司Yogitech,背后凸顯這家在PC時(shí)代處于核心位置的巨頭面向未來(lái)的積極轉(zhuǎn)型。

Myriad X就是英特爾子公司Movidius在2017年推出的視覺(jué)處理器(VPU,vision processing unit),這是一款低功耗的系統(tǒng)芯片(SoC),用于在基于視覺(jué)的設(shè)備上加速深度學(xué)習(xí)和人工智能——如無(wú)人機(jī)、智能相機(jī)和VR / AR頭盔。Myriad X是全球第一個(gè)配備專用神經(jīng)網(wǎng)絡(luò)計(jì)算引擎的片上系統(tǒng)芯片(SoC),用于加速設(shè)備端的深度學(xué)習(xí)推理計(jì)算。該神經(jīng)網(wǎng)絡(luò)計(jì)算引擎是芯片上集成的硬件模塊,專為高速、低功耗且不犧牲精確度地運(yùn)行基于深度學(xué)習(xí)的神經(jīng)網(wǎng)絡(luò)而設(shè)計(jì),讓設(shè)備能夠?qū)崟r(shí)地看到、理解和響應(yīng)周圍環(huán)境。引入該神經(jīng)計(jì)算引擎之后,Myriad X架構(gòu)能夠?yàn)榛谏疃葘W(xué)習(xí)的神經(jīng)網(wǎng)絡(luò)推理提供1TOPS的計(jì)算性能。

執(zhí)“能效比”之牛耳——學(xué)術(shù)界

除了工業(yè)界和廠商在人工智能領(lǐng)域不斷推出新產(chǎn)品之外,學(xué)術(shù)界也在持續(xù)推進(jìn)人工智能芯片新技術(shù)的發(fā)展。

比利時(shí)魯汶大學(xué)的Bert Moons等在2017年頂級(jí)會(huì)議IEEE ISSCC上面提出了能效比高達(dá)10.0TOPs/W的針對(duì)卷積神經(jīng)網(wǎng)絡(luò)加速的芯片ENVISION,該芯片采用28nm FD-SOI技術(shù)。該芯片包括一個(gè)16位的RISC處理器核,1D-SIMD處理單元進(jìn)行ReLU和Pooling操作,2D-SIMD MAC陣列處理卷積層和全連接層的操作,還有128KB的片上存儲(chǔ)器。

關(guān)于AI芯片格局分析和介紹

韓國(guó)科學(xué)技術(shù)院KAIST的Dongjoo Shin等人在ISSCC2017上提出了一個(gè)針對(duì)CNN和RNN結(jié)構(gòu)可配置的加速器單元DNPU,除了包含一個(gè)RISC核之外,還包括了一個(gè)針對(duì)卷積層操作的計(jì)算陣列CP和一個(gè)針對(duì)全連接層RNN-LSTM操作的計(jì)算陣列FRP,相比于魯汶大學(xué)的Envision,DNPU支持CNN和RNN結(jié)構(gòu),能效比高達(dá)8.1TOPS/W。該芯片采用了65nm CMOS工藝。

關(guān)于AI芯片格局分析和介紹

相比較于魯汶大學(xué)和韓國(guó)科學(xué)技術(shù)院都針對(duì)神經(jīng)網(wǎng)絡(luò)推理部分的計(jì)算操作來(lái)說(shuō),普渡大學(xué)的Venkataramani S等人在計(jì)算機(jī)體系結(jié)構(gòu)頂級(jí)會(huì)議ISCA2017上提出了針對(duì)大規(guī)模神經(jīng)網(wǎng)絡(luò)訓(xùn)練的人工智能處理器SCALLDEEP。

該論文針對(duì)深度神經(jīng)網(wǎng)絡(luò)的訓(xùn)練部分進(jìn)行針對(duì)性優(yōu)化,提出了一個(gè)可擴(kuò)展服務(wù)器架構(gòu),且深入分析了深度神經(jīng)網(wǎng)絡(luò)中卷積層,采樣層,全連接層等在計(jì)算密集度和訪存密集度方面的不同,設(shè)計(jì)了兩種處理器core架構(gòu),計(jì)算密集型的任務(wù)放在了comHeavy核中,包含大量的2D乘法器和累加器部件,而對(duì)于訪存密集型任務(wù)則放在了memHeavy核中,包含大量SPM存儲(chǔ)器和tracker同步單元,既可以作為存儲(chǔ)單元使用,又可以進(jìn)行計(jì)算操作,包括ReLU,tanh等。而一個(gè)SCALEDEEP Chip則可以有不同配置下的兩類處理器核組成,然后再組成計(jì)算簇。

論文中所用的處理平臺(tái)包括7032個(gè)處理器tile。論文作者針對(duì)深度神經(jīng)網(wǎng)絡(luò)設(shè)計(jì)了編譯器,完成網(wǎng)絡(luò)映射和代碼生成,同時(shí)設(shè)計(jì)了設(shè)計(jì)空間探索的模擬器平臺(tái),可以進(jìn)行性能和功耗的評(píng)估,性能則得益于時(shí)鐘精確級(jí)的模擬器,功耗評(píng)估則從DC中提取模塊的網(wǎng)表級(jí)的參數(shù)模型。該芯片僅采用了Intel 14nm工藝進(jìn)行了綜合和性能評(píng)估,峰值能效比高達(dá)485.7GOPS/W。

關(guān)于AI芯片格局分析和介紹

關(guān)于AI芯片格局分析和介紹

國(guó)內(nèi)

百家爭(zhēng)鳴,各自為政

可以說(shuō),國(guó)內(nèi)各個(gè)單位在人工智能處理器領(lǐng)域的發(fā)展和應(yīng)用與國(guó)外相比依然存在很大的差距。由于我國(guó)特殊的環(huán)境和市場(chǎng),國(guó)內(nèi)人工智能處理器的發(fā)展呈現(xiàn)出百花齊放、百家爭(zhēng)鳴的態(tài)勢(shì),這些單位的應(yīng)用領(lǐng)域遍布股票交易、金融、商品推薦、安防、早教機(jī)器人以及無(wú)人駕駛等眾多領(lǐng)域,催生了大量的人工智能芯片創(chuàng)業(yè)公司,如地平線、深鑒科技、中科寒武紀(jì)等。盡管如此,國(guó)內(nèi)起步較早的中科寒武紀(jì)卻并未如國(guó)外大廠一樣形成市場(chǎng)規(guī)模,與其他廠商一樣,存在著各自為政的散裂發(fā)展現(xiàn)狀。

關(guān)于AI芯片格局分析和介紹

除了新興創(chuàng)業(yè)公司,國(guó)內(nèi)研究機(jī)構(gòu)如北京大學(xué)、清華大學(xué)、中國(guó)科學(xué)院等在人工智能處理器領(lǐng)域都有深入研究;而其他公司如百度和比特大陸等,2017年也有一些成果發(fā)布。

關(guān)于AI芯片格局分析和介紹

注:上述表格中所給為截止到2017年各研制單位公開可查的最新數(shù)據(jù)。

全球AI芯片界首個(gè)獨(dú)角獸——寒武紀(jì)

2017年8月,國(guó)內(nèi)AI芯片初創(chuàng)公司寒武紀(jì)宣布已經(jīng)完成1億美元A輪融資,戰(zhàn)略投資方可謂陣容豪華,阿里巴巴、聯(lián)想、科大訊飛等企業(yè)均參與投資。而其公司也成為全球AI芯片界首個(gè)獨(dú)角獸,受到國(guó)內(nèi)外市場(chǎng)廣泛關(guān)注。

寒武紀(jì)科技主要負(fù)責(zé)研發(fā)生產(chǎn)AI芯片,公司最主要的產(chǎn)品為2016年發(fā)布的寒武紀(jì)1A處理器(Cambricon-1A),是一款可以深度學(xué)習(xí)的神經(jīng)網(wǎng)絡(luò)專用處理器,面向智能手機(jī)、無(wú)人機(jī)、安防監(jiān)控、可穿戴設(shè)備以及智能駕駛等各類終端設(shè)備,在運(yùn)行主流智能算法時(shí)性能功耗比全面超越傳統(tǒng)處理器。目前已經(jīng)研發(fā)出1A、1H等多種型號(hào)。與此同時(shí),寒武紀(jì)也推出了面向開發(fā)者的寒武紀(jì)人工智能軟件平臺(tái) Cambricon NeuWare,包含開發(fā)、調(diào)試和調(diào)優(yōu)三大部分。

軟硬件協(xié)同發(fā)展的典范——深鑒科技

深鑒科技的聯(lián)合創(chuàng)始人韓松在不同場(chǎng)合曾多次提及軟硬件協(xié)同設(shè)計(jì)對(duì)人工智能處理器的重要性,而其在FPGA領(lǐng)域頂級(jí)會(huì)議FPGA2017最佳論文ESE硬件架構(gòu)就是最好的證明。該項(xiàng)工作聚焦于使用LSTM 進(jìn)行語(yǔ)音識(shí)別的場(chǎng)景,結(jié)合深度壓縮(Deep Compression)、專用編譯器以及 ESE 專用處理器架構(gòu),在中端的 FPGA 上即可取得比 Pascal Titan X GPU 高 3 倍的性能,并將功耗降低 3.5 倍。

關(guān)于AI芯片格局分析和介紹

在2017年10月的時(shí)候,深鑒科技推出了六款A(yù)I產(chǎn)品,分別是人臉檢測(cè)識(shí)別模組、人臉?lè)治鼋鉀Q方案、視頻結(jié)構(gòu)化解決方案、ARISTOTLE架構(gòu)平臺(tái),深度學(xué)習(xí)SDK DNNDK、雙目深度視覺(jué)套件。而在人工智能芯片方面,公布了最新的芯片計(jì)劃,由深鑒科技自主研發(fā)的芯片“聽濤”、“觀?!睂⒂?018年第三季度面市,該芯片采用臺(tái)積電28nm工藝,亞里士多德架構(gòu),峰值性能 3.7 TOPS/W。

對(duì)標(biāo)谷歌TPU——比特大陸算豐

作為比特幣獨(dú)角獸的比特大陸,在2015年開始涉足人工智能領(lǐng)域,其在2017年發(fā)布的面向AI應(yīng)用的張量處理器算豐Sophon BM1680,是繼谷歌TPU之后,全球又一款專門用于張量計(jì)算加速的專用芯片(ASIC),適用于CNN / RNN / DNN的訓(xùn)練和推理。

BM1680單芯片能夠提供2TFlops單精度加速計(jì)算能力,芯片由64 NPU構(gòu)成,特殊設(shè)計(jì)的NPU調(diào)度引擎(Scheduling Engine)可以提供強(qiáng)大的數(shù)據(jù)吞吐能力,將數(shù)據(jù)輸入到神經(jīng)元核心(Neuron Processor Cores)。BM1680采用改進(jìn)型脈動(dòng)陣列結(jié)構(gòu)。2018年比特大陸將發(fā)布第2代算豐AI芯片BM1682,計(jì)算力將有大幅提升。

百家爭(zhēng)鳴——百度、地平線及其他

在2017年的HotChips大會(huì)上,百度發(fā)布了XPU,這是一款256核、基于FPGA的云計(jì)算加速芯片,用于百度的人工智能、數(shù)據(jù)分析、云計(jì)算以及無(wú)人駕駛業(yè)務(wù)。在會(huì)上,百度研究員歐陽(yáng)劍表示,百度設(shè)計(jì)的芯片架構(gòu)突出多樣性,著重于計(jì)算密集型、基于規(guī)則的任務(wù),同時(shí)確保效率、性能和靈活性的最大化。

歐陽(yáng)劍表示:“FPGA是高效的,可以專注于特定計(jì)算任務(wù),但缺乏可編程能力。傳統(tǒng)CPU擅長(zhǎng)通用計(jì)算任務(wù),尤其是基于規(guī)則的計(jì)算任務(wù),同時(shí)非常靈活。GPU瞄準(zhǔn)了并行計(jì)算,因此有很強(qiáng)大的性能。XPU則關(guān)注計(jì)算密集型、基于規(guī)則的多樣化計(jì)算任務(wù),希望提高效率和性能,并帶來(lái)類似CPU的靈活性。

在2018年百度披露更多關(guān)于XPU的相關(guān)信息。

關(guān)于AI芯片格局分析和介紹

2017年12月底,人工智能初創(chuàng)企業(yè)地平線發(fā)布了中國(guó)首款全球領(lǐng)先的嵌入式人工智能芯片——面向智能駕駛的征程(Journey)1.0處理器和面向智能攝像頭的旭日(Sunrise)1.0處理器,還有針對(duì)智能駕駛、智能城市和智能商業(yè)三大應(yīng)用場(chǎng)景的人工智能解決方案?!靶袢?1.0”和“征程 1.0”是完全由地平線自主研發(fā)的人工智能芯片,具有全球領(lǐng)先的性能。

為了解決應(yīng)用場(chǎng)景中的問(wèn)題,地平線將算法與芯片做了強(qiáng)耦合,用算法來(lái)定義芯片,提升芯片的效率,在高性能的情況下可以保證它的低功耗、低成本。具體芯片參數(shù)尚無(wú)公開數(shù)據(jù)。

除了百度和地平線,國(guó)內(nèi)研究機(jī)構(gòu)如中國(guó)科學(xué)院、北京大學(xué)和清華大學(xué)也有人工智能處理器相關(guān)的成果發(fā)布。

北京大學(xué)聯(lián)合商湯科技等提出一種基于 FPGA 的快速 Winograd 算法,可以大幅降低算法復(fù)雜度,改善 FPGA 上的 CNN 性能。論文中的實(shí)驗(yàn)使用當(dāng)前最優(yōu)的多種 CNN 架構(gòu)(如 AlexNet 和 VGG16),從而實(shí)現(xiàn)了 FPGA 加速之下的最優(yōu)性能和能耗。在 Xilinx ZCU102 平臺(tái)上達(dá)到了卷積層平均處理速度 1006.4 GOP/s,整體 AlexNet 處理速度 854.6 GOP/s,卷積層平均處理速度 3044.7 GOP/s,整體 VGG16 的處理速度 2940.7 GOP/s。

關(guān)于AI芯片格局分析和介紹

中國(guó)科學(xué)院計(jì)算機(jī)體系結(jié)構(gòu)國(guó)家重點(diǎn)實(shí)驗(yàn)室在頂級(jí)會(huì)議HPCA2017上提出了一種基于數(shù)據(jù)流的神經(jīng)網(wǎng)絡(luò)處理器架構(gòu),以便適應(yīng)特征圖、神經(jīng)元和突觸等不同層級(jí)的并行計(jì)算,為了實(shí)現(xiàn)這一目標(biāo),該團(tuán)隊(duì)對(duì)單個(gè)處理單元PE進(jìn)行重新設(shè)計(jì),使得操作數(shù)可以直接通過(guò)橫向或縱向的總線從片上存儲(chǔ)器獲取,而非傳統(tǒng)PE只能從上至下或從左至右由相鄰單元獲取。該芯片采用了TMSC 65nm工藝,峰值性能為490.7 GOPs/W。

關(guān)于AI芯片格局分析和介紹

清華大學(xué)微納電子系魏少軍等2017年的VLSI國(guó)際研討會(huì)上提出了基于可重構(gòu)多模態(tài)混合的神經(jīng)計(jì)算芯片Thinker。Thinker芯片基于該團(tuán)隊(duì)長(zhǎng)期積累的可重構(gòu)計(jì)算芯片技術(shù),采用可重構(gòu)架構(gòu)和電路技術(shù),突破了神經(jīng)網(wǎng)絡(luò)計(jì)算和訪存的瓶頸,實(shí)現(xiàn)了高能效多模態(tài)混合神經(jīng)網(wǎng)絡(luò)計(jì)算。Thinker芯片具有高能效的突出優(yōu)點(diǎn),其能量效率相比目前在深度學(xué)習(xí)中廣泛使用的GPU提升了三個(gè)數(shù)量級(jí)。Thinker芯片支持電路級(jí)編程和重構(gòu),是一個(gè)通用的神經(jīng)網(wǎng)絡(luò)計(jì)算平臺(tái),可廣泛應(yīng)用于機(jī)器人、無(wú)人機(jī)、智能汽車、智慧家居、安防監(jiān)控和消費(fèi)電子等領(lǐng)域。該芯片采用了TSMC 65nm工藝,片上存儲(chǔ)為348KB,峰值性能為5.09TOPS/W。

新架構(gòu)新技術(shù)——憶阻器

2017年清華大學(xué)微電子所錢鶴、吳華強(qiáng)課題組在《自然通訊》(Nature Communications)在線發(fā)表了題為“運(yùn)用電子突觸進(jìn)行人臉?lè)诸悺保ā癋ace Classification using Electronic Synapses”)的研究成果,將氧化物憶阻器的集成規(guī)模提高了一個(gè)數(shù)量級(jí),首次實(shí)現(xiàn)了基于1024個(gè)氧化物憶阻器陣列的類腦計(jì)算。該成果在最基本的單個(gè)憶阻器上實(shí)現(xiàn)了存儲(chǔ)和計(jì)算的融合,采用完全不同于傳統(tǒng)“馮·諾依曼架構(gòu)”的體系,可以使芯片功耗降低到原千分之一以下。憶阻器被認(rèn)為是最具潛力的電子突觸器件,通過(guò)在器件兩端施加電壓,可以靈活地改變其阻值狀態(tài),從而實(shí)現(xiàn)突觸的可塑性。此外,憶阻器還具有尺寸小、操作功耗低、可大規(guī)模集成等優(yōu)勢(shì)。因此,基于憶阻器所搭建的類腦計(jì)算硬件系統(tǒng)具有功耗低和速度快的優(yōu)勢(shì),成為國(guó)際研究熱點(diǎn)。

在神經(jīng)形態(tài)處理器方面,最為著名的就是IBM在2014年推出的TrueNorth芯片,該芯片包括4096個(gè)核心和540萬(wàn)個(gè)晶體管,功耗70mW,模擬了一百萬(wàn)個(gè)神經(jīng)元和2.56億個(gè)突觸。而在2017年,英特爾也推出一款能模擬大腦工作的自主學(xué)習(xí)芯片Loihi,Loihi由128個(gè)計(jì)算核心構(gòu)成,每個(gè)核心集成了1024個(gè)人工神經(jīng)元,整個(gè)芯片擁有超過(guò)個(gè)13萬(wàn)個(gè)神經(jīng)元與1.3億個(gè)突觸連接,與人腦超過(guò)800億個(gè)神經(jīng)元相比,簡(jiǎn)直是小巫見(jiàn)大巫,Loihi的運(yùn)算規(guī)模僅比蝦腦復(fù)雜一點(diǎn)點(diǎn)而已。英特爾認(rèn)為該芯片適用于無(wú)人機(jī)與汽車自動(dòng)駕駛,紅綠燈自適應(yīng)路面交通狀況,用攝像頭尋找失蹤人口等任務(wù)。

而在神經(jīng)形態(tài)芯片研究領(lǐng)域,清華大學(xué)類腦計(jì)算研究中心施路平等在2015年就推出了首款類腦芯片—“天機(jī)芯”,該芯片世界首次將人工神經(jīng)網(wǎng)絡(luò)(Artificial Neural Networks, ANNs)和脈沖神經(jīng)網(wǎng)絡(luò)(Spiking Neural Networks,SNNs)進(jìn)行異構(gòu)融合,同時(shí)兼顧技術(shù)成熟并被廣泛應(yīng)用的深度學(xué)習(xí)模型與未來(lái)具有巨大前景的計(jì)算神經(jīng)科學(xué)模型,可用于諸如圖像處理、語(yǔ)音識(shí)別、目標(biāo)跟蹤等多種應(yīng)用開發(fā)。在類腦“自行”車演示平臺(tái)上,集成32個(gè)天機(jī)一號(hào)芯片,實(shí)現(xiàn)了面向視覺(jué)目標(biāo)探測(cè)、感知、目標(biāo)追蹤、自適應(yīng)姿態(tài)控制等任務(wù)的跨模態(tài)類腦信息處理實(shí)驗(yàn)。據(jù)悉,基于TSMC 28nm工藝的第二代天機(jī)芯片也即將推出,性能將會(huì)得到極大提升。

從ISSCC2018看人工智能芯片發(fā)展趨勢(shì)

在剛剛結(jié)束的計(jì)算機(jī)體系結(jié)構(gòu)頂級(jí)會(huì)議ISSCC2018,“Digital Systems: Digital Architectures and Systems”分論壇主席Byeong-Gyu Nam對(duì)人工智能芯片,特別是深度學(xué)習(xí)芯片的發(fā)展趨勢(shì)做了概括。深度學(xué)習(xí)依然今年大會(huì)最為熱門的話題。相比較于去年大多數(shù)論文都在討論卷積神經(jīng)網(wǎng)絡(luò)的實(shí)現(xiàn)問(wèn)題,今年則更加關(guān)注兩個(gè)問(wèn)題:其一,如果更高效地實(shí)現(xiàn)卷積神經(jīng)網(wǎng)絡(luò),特別是針對(duì)手持終端等設(shè)備;其二,則是關(guān)于全連接的非卷積神經(jīng)網(wǎng)絡(luò),如RNN和LSTM等。

關(guān)于AI芯片格局分析和介紹

同時(shí),為了獲得更高的能效比,越來(lái)越多的研究者把精力放在了低精度神經(jīng)網(wǎng)絡(luò)的設(shè)計(jì)和實(shí)現(xiàn),如1bit的神經(jīng)網(wǎng)絡(luò)。這些新型技術(shù),使得深度學(xué)習(xí)加速器的能效比從去年的幾十TOPS/W提升到了今年的上百TOPS/W。有些研究者也對(duì)數(shù)字+模擬的混合信號(hào)處理實(shí)現(xiàn)方案進(jìn)行了研究。對(duì)數(shù)據(jù)存取具有較高要求的全連接網(wǎng)絡(luò),有些研究者則借助3-D封裝技術(shù)來(lái)獲得更好的性能。

總結(jié)

對(duì)國(guó)產(chǎn)人工智能芯片的一點(diǎn)愚見(jiàn)

正如前文所述,在人工智能芯片領(lǐng)域,國(guó)外芯片巨頭占據(jù)了絕大部分市場(chǎng)份額,不論是在人才聚集還是公司合并等方面,都具有絕對(duì)的領(lǐng)先優(yōu)勢(shì)。而國(guó)內(nèi)人工智能初創(chuàng)公司則又呈現(xiàn)百家爭(zhēng)鳴、各自為政的紛亂局面;特別是每個(gè)初創(chuàng)企業(yè)的人工智能芯片都具有自己獨(dú)特的體系結(jié)構(gòu)和軟件開發(fā)套件,既無(wú)法融入英偉達(dá)和谷歌建立的生態(tài)圈,又不具備與之抗衡的實(shí)力。

國(guó)產(chǎn)人工智能芯片的發(fā)展,一如早年間國(guó)產(chǎn)通用處理器和操作系統(tǒng)的發(fā)展,過(guò)份地追求完全獨(dú)立、自主可控的怪圈,勢(shì)必會(huì)如眾多國(guó)產(chǎn)芯片一樣逐漸退出歷史舞臺(tái)。借助于X86的完整生態(tài),短短一年之內(nèi),兆芯推出的國(guó)產(chǎn)自主可控x86處理器,以及聯(lián)想基于兆芯CPU設(shè)計(jì)生產(chǎn)的國(guó)產(chǎn)計(jì)算機(jī)、服務(wù)器就獲得全國(guó)各地黨政辦公人員的高度認(rèn)可,并在黨政軍辦公、信息化等國(guó)家重點(diǎn)系統(tǒng)和工程中已獲批量應(yīng)用。

當(dāng)然,投身于X86的生態(tài)圈對(duì)于通用桌面處理器和高端服務(wù)器芯片來(lái)說(shuō)無(wú)可厚非,畢竟創(chuàng)造一個(gè)如Wintel一樣的生態(tài)鏈已絕非易事,我們也不可能遇見(jiàn)第二個(gè)喬布斯和蘋果公司。而在全新的人工智能芯片領(lǐng)域,對(duì)眾多國(guó)產(chǎn)芯片廠商來(lái)說(shuō),還有很大的發(fā)展空間,針對(duì)神經(jīng)網(wǎng)絡(luò)加速器最重要的就是找到一個(gè)具有廣闊前景的應(yīng)用領(lǐng)域,如華為海思麒麟處理器之于中科寒武紀(jì)的NPU;否則還是需要融入一個(gè)合適的生態(tài)圈。另外,目前大多數(shù)國(guó)產(chǎn)人工智能處理器都針對(duì)于神經(jīng)網(wǎng)絡(luò)計(jì)算進(jìn)行加速,而能夠提供單芯片解決方案的很少;微控制器領(lǐng)域的發(fā)展,ARM的Cortex-A系列和Cortex-M系列占據(jù)主角,但是新興的開源指令集架構(gòu)RISC-V也不容小覷,完全值得眾多國(guó)產(chǎn)芯片廠商關(guān)注。

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問(wèn)題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • 神經(jīng)網(wǎng)絡(luò)

    關(guān)注

    42

    文章

    4839

    瀏覽量

    107989
  • 人工智能
    +關(guān)注

    關(guān)注

    1819

    文章

    50177

    瀏覽量

    266164
  • AI芯片
    +關(guān)注

    關(guān)注

    17

    文章

    2135

    瀏覽量

    36817
收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評(píng)論

    相關(guān)推薦
    熱點(diǎn)推薦

    中興通訊崔麗分析全球AI產(chǎn)業(yè)競(jìng)爭(zhēng)格局變化

    1月22日,由《財(cái)經(jīng)》雜志主辦、《哈佛商業(yè)評(píng)論》承辦的“甦·新商業(yè)盛典2026”在香港舉行。中興通訊首席發(fā)展官崔麗受邀出席“AI產(chǎn)業(yè)全球格局與投資參考”主題圓桌對(duì)話,圍繞AI產(chǎn)業(yè)發(fā)展趨勢(shì)及相關(guān)能力建設(shè)等話題,分享了中興通訊的思考
    的頭像 發(fā)表于 01-26 10:34 ?750次閱讀

    VS680 HDMI AI分析解決方案 #目標(biāo)識(shí)別 #視頻翻譯 #AI #芯片

    AI
    深蕾半導(dǎo)體
    發(fā)布于 :2025年11月12日 10:29:33

    愛(ài)芯元智亮相2025全球AI芯片峰會(huì)

    2025全球AI芯片峰會(huì)(GACS 2025)近日在上海召開,愛(ài)芯元智聯(lián)合創(chuàng)始人、副總裁劉建偉出席活動(dòng),并于“大模型AI芯片專題論壇”發(fā)表主題演講,分享了公司如何憑借高智價(jià)比
    的頭像 發(fā)表于 09-26 15:49 ?1038次閱讀

    【「AI芯片:科技探索與AGI愿景」閱讀體驗(yàn)】+AI芯片到AGI芯片

    復(fù)制人類智能的AI---AGI。 走向AGI的五個(gè)層次發(fā)現(xiàn)階段: ①L1,聊天機(jī)器人:具備基礎(chǔ)的對(duì)話能力,能夠理解和回應(yīng)簡(jiǎn)單的文本輸入 ②L2,推理者:具備基本的邏輯推理能力,能夠分析復(fù)雜信息并進(jìn)行推斷
    發(fā)表于 09-18 15:31

    唯創(chuàng)知音AI語(yǔ)音交互芯片與模組介紹

    ,和WT3000A M06、WT3000A M07、WT3000A M08三款AI語(yǔ)音交互模組。 WT2606A AI語(yǔ)音交互芯片介紹 WT2606A是一款高性能存算一體
    的頭像 發(fā)表于 09-17 15:51 ?829次閱讀
    唯創(chuàng)知音<b class='flag-5'>AI</b>語(yǔ)音交互<b class='flag-5'>芯片</b>與模組<b class='flag-5'>介紹</b>

    【「AI芯片:科技探索與AGI愿景」閱讀體驗(yàn)】+AI的科學(xué)應(yīng)用

    和關(guān)聯(lián)性 AI驅(qū)動(dòng)科學(xué):研究和模擬人類思維和認(rèn)識(shí)過(guò)程。 本章節(jié)作者為我們講解了第五范式,介紹了科學(xué)發(fā)現(xiàn)的一般方法和流程等。一、科學(xué)發(fā)現(xiàn)的5個(gè)范式 第一范式:產(chǎn)生于公元1000年左右的阿拉伯世界和歐洲
    發(fā)表于 09-17 11:45

    【「AI芯片:科技探索與AGI愿景」閱讀體驗(yàn)】+化學(xué)或生物方法實(shí)現(xiàn)AI

    順序排列并存儲(chǔ)在毛細(xì)血管內(nèi)。 電石存儲(chǔ)器: 3、化學(xué)計(jì)算的總體現(xiàn)狀與前景 二、生物計(jì)算 1、用活細(xì)胞實(shí)現(xiàn)AI 作者第七章才會(huì)介紹類腦芯片,到時(shí)候我們?cè)僖黄鹦蕾p吧。 這里只是先給我們打了個(gè)基礎(chǔ)概念。 1
    發(fā)表于 09-15 17:29

    【「AI芯片:科技探索與AGI愿景」閱讀體驗(yàn)】+AI芯片的需求和挑戰(zhàn)

    ②Transformer引擎③NVLink Switch系統(tǒng)④機(jī)密計(jì)算⑤HBM FPGA: 架構(gòu)的主要特點(diǎn):可重構(gòu)邏輯和路由,可以快速實(shí)現(xiàn)各種不同形式的神經(jīng)網(wǎng)絡(luò)加速。 ASIC: 介紹了幾種ASIC AI芯片
    發(fā)表于 09-12 16:07

    【「AI芯片:科技探索與AGI愿景」閱讀體驗(yàn)】+可期之變:從AI硬件到AI濕件

    的不同。隨著AI熱潮的興起,大腦的抽象模型已被提煉成各種的AI算法,并使用半導(dǎo)體芯片技術(shù)加以實(shí)現(xiàn)。 而大腦是一個(gè)由無(wú)數(shù)神經(jīng)元通過(guò)突觸連接而成的復(fù)雜網(wǎng)絡(luò),是極其復(fù)雜和精密的。大腦在本質(zhì)上就是一臺(tái)濕潤(rùn)的軟組織
    發(fā)表于 09-06 19:12

    【「AI芯片:科技探索與AGI愿景」閱讀體驗(yàn)】+內(nèi)容總覽

    ,其中第一章是概論,主要介紹大模型浪潮下AI芯片的需求與挑戰(zhàn)。第二章和第三章分別介紹實(shí)現(xiàn)深度學(xué)習(xí)AI芯片
    發(fā)表于 09-05 15:10

    AI 芯片浪潮下,職場(chǎng)晉升新契機(jī)?

    在科技飛速發(fā)展的當(dāng)下,AI 芯片已然成為眾多行業(yè)變革的核心驅(qū)動(dòng)力。從互聯(lián)網(wǎng)巨頭的數(shù)據(jù)中心,到我們?nèi)粘J褂玫闹悄苁謾C(jī)、智能家居設(shè)備,AI 芯片的身影無(wú)處不在,深刻改變著產(chǎn)品形態(tài)與服務(wù)模式
    發(fā)表于 08-19 08:58

    【書籍評(píng)測(cè)活動(dòng)NO.64】AI芯片,從過(guò)去走向未來(lái):《AI芯片:科技探索與AGI愿景》

    》,講述了AI芯片的基礎(chǔ)知識(shí),包括原理、種類、廠商、產(chǎn)業(yè)等概況,展望新技術(shù)與研究應(yīng)用。 《AI芯片:前沿技術(shù)與創(chuàng)新未來(lái)》出版后獲得了“憶阻器之父”蔡少棠教授的力薦,當(dāng)時(shí)他認(rèn)為“這是一本
    發(fā)表于 07-28 13:54

    成都匯陽(yáng)投資關(guān)于芯片+AI 眼鏡核心公司

    ? ? ? 芯片堪稱 AI 眼鏡的 “大腦”, 在這一領(lǐng)域發(fā)揮著核心作用。AI 眼鏡需實(shí)時(shí)處理圖像、 語(yǔ)音等大量數(shù)據(jù), 芯片的算力決定了處理速度與效率, 強(qiáng)大算力能讓眼鏡迅速識(shí)別語(yǔ)音指
    的頭像 發(fā)表于 07-01 09:28 ?1137次閱讀

    Nordic收購(gòu) Neuton.AI 關(guān)于產(chǎn)品技術(shù)的分析

    示例和支持,方便開發(fā)者在 Nordic 的各類芯片上實(shí)現(xiàn)高效的邊緣 AI 應(yīng)用; 如果對(duì)這個(gè)AI人工智能應(yīng)用感興趣,請(qǐng)?jiān)u論區(qū)聯(lián)系我們.
    發(fā)表于 06-28 14:18

    AI芯片的發(fā)展歷程和市場(chǎng)格局

    人工智能早已悄然融入日常生活:手機(jī)應(yīng)用推薦你喜歡的視頻內(nèi)容、智能語(yǔ)音助手幫你安排當(dāng)天的日程、自動(dòng)駕駛汽車讓你的通勤更加輕松,而這些神奇的智能體驗(yàn)背后,都離不開一個(gè)至關(guān)重要的推手——AI芯片。
    的頭像 發(fā)表于 06-12 10:10 ?1963次閱讀