91欧美超碰AV自拍|国产成年人性爱视频免费看|亚洲 日韩 欧美一厂二区入|人人看人人爽人人操aV|丝袜美腿视频一区二区在线看|人人操人人爽人人爱|婷婷五月天超碰|97色色欧美亚州A√|另类A√无码精品一级av|欧美特级日韩特级

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

曦智科技發(fā)布最新高性能光子計算處理器—PACE

lPCU_elecfans ? 來源:電子發(fā)燒友網(wǎng) ? 作者:電子發(fā)燒友網(wǎng) ? 2021-12-25 10:54 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

電子發(fā)燒友網(wǎng)報道(文/梁浩斌)隨著納米制程的不斷往前推進(jìn),延續(xù)近50年的摩爾定律已經(jīng)日漸式微。AI、5G、物聯(lián)網(wǎng)等新興領(lǐng)域的蓬勃發(fā)展帶動了全球數(shù)據(jù)的爆炸式增長,對算力的需求增速遠(yuǎn)高于摩爾定律所預(yù)測的算力供給增速,傳統(tǒng)的電子芯片只能通過增大面積與功耗來完成更多的計算,已逐漸無法滿足日益增長的數(shù)據(jù)處理與節(jié)能要求。

在探索超越摩爾定律的路上,先進(jìn)制程已經(jīng)開始發(fā)揮作用,與此同時,由于具備高通量、低延時、低功耗的特性,用光代替電解決部分計算的也是突破現(xiàn)有瓶頸的途徑之一。而此前一直只存在于實驗室的光子芯片,最近有了新的進(jìn)展。

近日,曦智科技(Lightelligence)發(fā)布了其最新高性能光子計算處理器——PACE(Photonic Arithmetic Computing Engine,光子計算引擎)。

曦智科技創(chuàng)始人兼首席執(zhí)行官沈亦晨博士表示:“PACE的發(fā)布具有里程碑式的意義:它成功驗證了光子計算的優(yōu)越性,為集成電路產(chǎn)業(yè)提供了新的發(fā)展路徑?!?/p>

曦智科技成立于2017年,成立4年以來,公司總?cè)谫Y額已經(jīng)超過10億人民幣,在波士頓、上海、杭州、南京等地均設(shè)立了辦公室及實驗室,全球員工接近200人,中國員工超過100人。核心研發(fā)團(tuán)隊來自麻省理工學(xué)院,70%的芯片設(shè)計師擁有十年以上半導(dǎo)體從業(yè)經(jīng)驗。

2017年,沈亦晨博士以第一作者和通訊作者的身份在《自然-光子》雜志發(fā)表封面論文,開創(chuàng)性地提出了光子人工智能計算的新路徑。也正是由于這篇論文,在后來吸引了十多家初創(chuàng)公司相繼建立。

2019年4月,曦智科技推出了全球首款光子芯片原型板卡,成功將當(dāng)時占據(jù)半個實驗室的整個光子計算系統(tǒng)集成到了常規(guī)大小的板卡上,驗證了以光子替代電子進(jìn)行高性能計算的開創(chuàng)性想法。當(dāng)時的原型板卡上集成了100個光子器件,運行系統(tǒng)時鐘僅有100kHz。

兩年后的今天,這次發(fā)布的PACE已經(jīng)集成了10000個光子器件,運行系統(tǒng)時鐘更是達(dá)到了1GHz。跨越幾個數(shù)量級的性能提升,他們是如何做到的?

電子芯片現(xiàn)存的三大瓶頸

自2012年以來,神經(jīng)網(wǎng)絡(luò)和計算模型的大小就開始爆炸性增長,平均每3到4個月,計算模型的大小就會翻一倍。但持續(xù)增長的模型,明顯受到算力底層的限制,制約了人工智能的進(jìn)一步發(fā)展。

沈亦晨博士認(rèn)為,目前電子芯片的發(fā)展遇到了三個主要瓶頸:算力、數(shù)據(jù)傳輸和存儲。其中,算力瓶頸主要來源于隨著制程工藝接近物理極限導(dǎo)致的摩爾定律失效,以及功耗和發(fā)熱問題。

隨著晶體管尺寸越來越小,晶體管上的電子隧穿現(xiàn)象也愈發(fā)嚴(yán)重,因此即使將晶體管做得更小,單個晶體管在進(jìn)行運算時的功耗也無法進(jìn)一步降低。在這樣的前提下,業(yè)界有兩種解決路徑,單芯片面積增加或多芯片互聯(lián)。

但隨著面積增大,需要更長的銅導(dǎo)線進(jìn)行數(shù)據(jù)傳輸,而銅導(dǎo)線的發(fā)熱量和損耗與長度成正比,即芯片面積越大,發(fā)熱越大、功耗越高。

同樣,多芯片互聯(lián)同樣存在一些問題。首先片間互聯(lián)帶寬有限,即互聯(lián)效率低,其次銅導(dǎo)線依然會造成系統(tǒng)功耗提高,比如通過電將100個芯片或板卡互聯(lián)后,算力可能只比單個板卡提高10倍左右。

因此,沈亦晨博士認(rèn)為,光是最適合解決這些困境的底層技術(shù)方式。“首先,在數(shù)據(jù)搬運上面,光已在光通信領(lǐng)域充分證明其領(lǐng)先性和優(yōu)勢了。目前所有的長距離通信,包括數(shù)據(jù)中心里服務(wù)器和服務(wù)器之間的數(shù)據(jù)都是通過光纖代替銅導(dǎo)線進(jìn)行的。我們也認(rèn)為,光進(jìn)入到芯片去幫助運算是一個必然的方向?!?/p>

曦智光子計算的三個主要技術(shù)

前面說到光是解決目前電子芯片算力、數(shù)據(jù)傳輸和存儲三大瓶頸的底層技術(shù)方式。而從大數(shù)據(jù)、人工智能等應(yīng)用角度去看,越來越多的算力需求是來自于線性運算,而曦智發(fā)明的用光高效做線性計算的方式,就是光芯片的重要優(yōu)勢之一。

曦智將其技術(shù)分為三個部分:oMAC(通過光來做矩陣的乘積累加運算)、oNOC(片上光網(wǎng)絡(luò))、片間的光網(wǎng)絡(luò)。據(jù)沈亦晨博士介紹,oMAC是一種模擬計算,通過光模擬信號代替?zhèn)鹘y(tǒng)電子進(jìn)行數(shù)據(jù)處理,數(shù)據(jù)可以加載在光的強度或者相位上面,通過在波導(dǎo)里的傳播相互干涉,同時進(jìn)行運算。主要實現(xiàn)的方法是采用和現(xiàn)在電芯片制備工藝CMOS兼容的硅光工藝平臺,用光電協(xié)同設(shè)計來進(jìn)行光的矩陣乘法。

這里的優(yōu)勢是,首先,光的矩陣乘法并行能力更強,它能以更高的通量進(jìn)行運算。同時,它的能效可以媲美甚至優(yōu)于現(xiàn)在的電子芯片,因為光在做傳播的時候本身不會發(fā)熱。另外,它完成一個矩陣運算所要花的時間少,也就是延時遠(yuǎn)遠(yuǎn)低于電芯片的延時。最后,硅光的工藝對于工藝制程的要求相當(dāng)?shù)?,比?5或者45納米的CMOS工藝線就可以滿足現(xiàn)在光芯片、光計算所有的要求。硅光未來技術(shù)迭代不會需要對制程有特別的要求,更多是從其他方面進(jìn)行技術(shù)迭代,比如主頻、波長數(shù)量還有不同的模式。

而oNOC也就是片上光網(wǎng)絡(luò),主要通過用波導(dǎo)代替銅導(dǎo)線的方式,在片上進(jìn)行數(shù)據(jù)傳輸,包括實現(xiàn)片與片之間的光通信。還有比較大芯片上光的總線的通信,在光芯片上構(gòu)建一個固定通信網(wǎng)絡(luò)拓?fù)?,通過光相連,實現(xiàn)基于片上光網(wǎng)絡(luò)的數(shù)據(jù)交互。最后,采用一些波分復(fù)用的方式來傳播數(shù)據(jù),優(yōu)勢是帶寬更大,能耗更低,延時會遠(yuǎn)遠(yuǎn)優(yōu)于銅導(dǎo)線,并且對距離不敏感。

最后的片間光網(wǎng)絡(luò)即將上述片上光網(wǎng)絡(luò)進(jìn)一步拓展到多個板卡、更多服務(wù)器之間。通過光纖將芯片和芯片直接互聯(lián)起來,芯片之間數(shù)據(jù)通過光來傳輸。

全球唯一展示光子優(yōu)勢,PACE超3080百倍!

曦智認(rèn)為,光電混合計算最重要的技術(shù)演進(jìn)的點,就是不斷增加單個光芯片上的器件集成度。實際上,從最早的4x4乘法器,到64x64乘法器,再到目前光電混合2.5D封裝,曦智在四年時間里,已經(jīng)實現(xiàn)一萬個光器件集成在一塊芯片上。

也正因為集成度上的突破,PACE是曦智科技目前可以對外展示最新的可運作的計算處理器,是目前已知全球集成度最高的光子芯片,同時也是全球第一個展示出光子優(yōu)勢的計算系統(tǒng),能夠在一些有商業(yè)化應(yīng)用前景的算法上,比目前電子芯片提高數(shù)量級的優(yōu)勢。

那么光子計算的優(yōu)勢在什么領(lǐng)域能體現(xiàn)出來?NP-Complete Problem(多項式復(fù)雜程度非確定性問題,NPC)可以說是目前全球最難以高效解決的數(shù)學(xué)問題,比如生物信息里蛋白質(zhì)結(jié)構(gòu)的預(yù)測、物流交通調(diào)度、芯片設(shè)計、材料研發(fā)等都會應(yīng)用到。但目前NPC沒有多項式算法,只能用窮舉法逐個檢驗最終得到答案。但如果我們能夠有效解決其中一個問題,它也可以被映射到其他問題上去。

而由于光子芯片的特性,PACE可以通過重復(fù)矩陣乘法和巧妙利用受控噪聲組成的緊密回環(huán)來實現(xiàn)低延遲,于是在進(jìn)行NPC問題的計算時,PACE就可以相比GPU快上百倍。所以,PCAE在解決NPC問題上有比較多的商業(yè)應(yīng)用前景。

據(jù)了解,與英偉達(dá)RTX3080 GPU相比,在同時運行一樣的循環(huán)神經(jīng)網(wǎng)絡(luò)算法時,PACE所需時間只有3080的1%不到。

采用光電混合結(jié)構(gòu),基于現(xiàn)有生態(tài)打造

實際上,PACE的結(jié)構(gòu)由光芯片和電芯片這兩部分組成。電芯片上主要做數(shù)據(jù)的存儲,以及數(shù)?;旌系恼{(diào)度,光芯片上主要做數(shù)據(jù)的計算。這里可以理解為光芯片只是一個底層的硬件支持,而信息轉(zhuǎn)換和軟件相關(guān)的都采用電芯片進(jìn)行數(shù)字處理,所有指令、編譯、軟件,都會在數(shù)字電芯片上。所以與現(xiàn)有的數(shù)字芯片生態(tài)一樣,只是在底層計算端換成了光芯片。

作為光電混合的設(shè)計的芯片,可能有人會擔(dān)心在工藝上難以大規(guī)模量產(chǎn)。實際上,沈亦晨表示,硅光芯片采用的是CMOS工藝,這一點能解決90%最核心的問題。由于基本采用硅基的CMOS工藝,在電學(xué)、熱學(xué),包括仿真上都有相當(dāng)成熟的軟件可以直接使用。

而封裝層面,PACE上采用了芯片堆疊,也就是類似于HBM的2.5D、3D封裝方案。目前唯一不同的是,封裝方案上需要增加一個接口,將光源導(dǎo)入光芯片中。

光芯片商業(yè)化還有多遠(yuǎn)?

在談到這項技術(shù)的商業(yè)前景時,沈亦晨博士向記者強調(diào),光計算并不是只有光芯片,在可預(yù)見的未來里,都將會是和電子芯片深度結(jié)合的光電混合計算。光芯片相比于電芯片,它更多是承接主要任務(wù)的處理器,主要承接的是線性計算和數(shù)據(jù)網(wǎng)絡(luò)這兩個部分。但由電芯片發(fā)出指令的一個好處是它和目前現(xiàn)有的市場環(huán)境、軟件環(huán)境都是兼容的。

另外要注意的是,目前曦智的光電混合芯片,還不能用于消費者熟知的領(lǐng)域,比如PC、手機(jī)、編解碼芯片等,同時這也不是曦智科技考慮的范疇。而曦智科技在應(yīng)用場景的選擇上,會先切入大數(shù)據(jù),包括云計算、智能駕駛、金融上的量化交易、生物藥物研發(fā)等場景。

沈亦晨表示,作為一項顛覆性的技術(shù),本身一定需要經(jīng)歷漫長的商業(yè)化過程。他透露,在第一階段也就是2022年開始的一到三年內(nèi),對于算力、延時等痛點特別強的應(yīng)用場景開始落地,包括金融、大模型云服務(wù)、非AI的方向的優(yōu)化、高性能運算等。

而第二個階段會隨著產(chǎn)品落地,在不同應(yīng)用場景體現(xiàn)光計算優(yōu)勢后,將會投入更大規(guī)模團(tuán)隊做人工智能訓(xùn)練的市場。

第三階段曦智將會延伸到GPU,包括車載芯片等市場。

“這些都是我們覺得對于算力需求非常大的,但是需要一個更成熟的硬件、軟件體系和進(jìn)一步切入的市場?!币虼松蛞喑空J(rèn)為,技術(shù)商業(yè)化會是一個相當(dāng)漫長的過程,需要不斷地去改變、嘗試不同應(yīng)用場景和行業(yè)。

原文標(biāo)題:跨入光子時代?曦智科技發(fā)布光子計算處理器,運行特定算法性能超3080百倍!

文章出處:【微信公眾號:電子發(fā)燒友網(wǎng)】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。

審核編輯:彭菁

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • 處理器
    +關(guān)注

    關(guān)注

    68

    文章

    20282

    瀏覽量

    253095
  • 芯片
    +關(guān)注

    關(guān)注

    463

    文章

    54084

    瀏覽量

    467146
  • 物聯(lián)網(wǎng)
    +關(guān)注

    關(guān)注

    2947

    文章

    47911

    瀏覽量

    416157

原文標(biāo)題:?跨入光子時代?曦智科技發(fā)布光子計算處理器,運行特定算法性能超3080百倍!

文章出處:【微信號:elecfans,微信公眾號:電子發(fā)燒友網(wǎng)】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關(guān)推薦
    熱點推薦

    探索TDA54x Jacinto?處理器高性能與安全的完美融合

    探索TDA54x Jacinto?處理器高性能與安全的完美融合 在電子工程領(lǐng)域,處理器性能和安全性一直是設(shè)計的關(guān)鍵考量因素。今天,我們來深入了解一下TDA54x Jacinto?
    的頭像 發(fā)表于 03-06 16:50 ?1014次閱讀

    TDA7718B:高性能車載音頻處理器的卓越之選

    TDA7718B:高性能車載音頻處理器的卓越之選 在車載音頻領(lǐng)域,一款高性能的音頻處理器對于提升音質(zhì)、優(yōu)化用戶體驗至關(guān)重要。TDA7718B作為一款專門為汽車收音機(jī)應(yīng)用設(shè)計的
    的頭像 發(fā)表于 02-05 16:25 ?344次閱讀

    TDA7418:高性能3頻段汽車音頻處理器的深度解析

    TDA7418:高性能3頻段汽車音頻處理器的深度解析 在汽車音頻系統(tǒng)的設(shè)計中,一款優(yōu)秀的音頻處理器至關(guān)重要。TDA7418作為一款高性能的3頻段汽車音頻
    的頭像 發(fā)表于 01-05 18:15 ?1197次閱讀

    TDA7418:高性能3頻段汽車音頻處理器的深度剖析

    TDA7418:高性能3頻段汽車音頻處理器的深度剖析 在汽車音頻系統(tǒng)的設(shè)計中,一款優(yōu)秀的音頻處理器至關(guān)重要。TDA7418作為一款高性能的3頻段汽車音頻
    的頭像 發(fā)表于 12-28 15:50 ?819次閱讀

    TDA7419:高性能車載音頻處理器的卓越之選

    TDA7419:高性能車載音頻處理器的卓越之選 作為電子工程師,在車載音頻系統(tǒng)設(shè)計中,選擇一款合適的音頻處理器至關(guān)重要。TDA7419 是一款專門為車載收音機(jī)應(yīng)用設(shè)計的高性能信號
    的頭像 發(fā)表于 12-25 16:10 ?540次閱讀

    深入解析NXP S32G3:高性能汽車網(wǎng)絡(luò)處理器的技術(shù)洞察

    深入解析NXP S32G3:高性能汽車網(wǎng)絡(luò)處理器的技術(shù)洞察 在汽車電子領(lǐng)域,高性能、高安全性的處理器需求日益增長。NXP的S32G3系列處理器
    的頭像 發(fā)表于 12-24 16:45 ?537次閱讀

    S32Z2:安全可靠的高性能實時處理器

    S32Z2:安全可靠的高性能實時處理器 在汽車電子和工業(yè)控制等領(lǐng)域,高性能實時處理器的需求日益增長。今天我們要探討的NXP S32Z2處理器
    的頭像 發(fā)表于 12-24 11:10 ?420次閱讀

    S32E2:引領(lǐng)電動汽車控制與智能驅(qū)動的高性能實時處理器

    S32E2:引領(lǐng)電動汽車控制與智能驅(qū)動的高性能實時處理器 在電動汽車和智能驅(qū)動領(lǐng)域,高性能實時處理器的需求日益增長。NXP的S32E2處理器
    的頭像 發(fā)表于 12-24 11:10 ?372次閱讀

    探索i.MX RT1180:高性能處理器的技術(shù)剖析與應(yīng)用指南

    探索i.MX RT1180:高性能處理器的技術(shù)剖析與應(yīng)用指南 在當(dāng)今科技飛速發(fā)展的時代,高性能處理器在工業(yè)自動化、物聯(lián)網(wǎng)等眾多領(lǐng)域發(fā)揮著至關(guān)重要的作用。NXP Semiconducto
    的頭像 發(fā)表于 12-24 10:20 ?894次閱讀

    瀚海量子與沐股份達(dá)成戰(zhàn)略合作 量子計算軟件領(lǐng)軍者+高性能GPU芯片領(lǐng)軍者

    當(dāng)量子計算軟件領(lǐng)軍者遇上高性能GPU芯片領(lǐng)軍者,國產(chǎn)算力領(lǐng)域迎來一項重磅合作。 近日, 合肥瀚海量子科技有限公司(簡稱“瀚海量子”)與沐集成電路(上海)股份有限公司(簡稱“沐股份”
    的頭像 發(fā)表于 11-24 19:02 ?3237次閱讀

    知合計算:RISC-V架構(gòu)創(chuàng)新,阿基米德系列劍指高性能計算

    在2025 RISC-V中國峰會上,知合計算處理器設(shè)計總監(jiān)劉暢就高性能RISC-V處理器架構(gòu)探索與實踐進(jìn)行了精彩分享。 在以X86和ARM為代表的
    的頭像 發(fā)表于 07-18 14:17 ?2786次閱讀
    知合<b class='flag-5'>計算</b>:RISC-V架構(gòu)創(chuàng)新,阿基米德系列劍指<b class='flag-5'>高性能</b><b class='flag-5'>計算</b>

    芯來科技新一代RISC-V高性能處理器IP UX1030H 全面支持RVA23

    System Technology)正式發(fā)布其新一代高性能處理器IP —— UX1030H。 該產(chǎn)品嚴(yán)格遵循RVA23 Profile規(guī)范,全面支持虛擬化及向量計算擴(kuò)展,并在此基礎(chǔ)上
    的頭像 發(fā)表于 06-24 09:20 ?2841次閱讀
    芯來科技新一代RISC-V<b class='flag-5'>高性能</b><b class='flag-5'>處理器</b>IP UX1030H  全面支持RVA23

    Condor使用Cadence托管云服務(wù)開發(fā)高性能RISC-V微處理器

    Condor 是一家美國初創(chuàng)企業(yè),致力于開發(fā)高性能 RISC-V 微處理器。公司的目標(biāo)是通過創(chuàng)新技術(shù)徹底革新整個行業(yè),打破高性能計算的極限。
    的頭像 發(fā)表于 05-08 09:03 ?1170次閱讀

    光子 AI 處理器的核心原理及突破性進(jìn)展

    電子發(fā)燒友網(wǎng)(文 / 李彎彎)光子 AI 處理器,作為一種借助光子執(zhí)行信息處理與人工智能(AI)計算的新型硬件設(shè)備,正逐漸嶄露頭角。與傳統(tǒng)基
    的頭像 發(fā)表于 04-19 00:40 ?4297次閱讀

    智科技時隔八年再登《Nature》,光電混合計算架構(gòu)首次公開

    英國倫敦時間4月9日,全球頂級學(xué)術(shù)期刊《自然》(Nature)刊載了智科技的光電混合計算成果:《超低延遲大規(guī)模集成光子加速》(An integrated large-scale p
    發(fā)表于 04-10 09:50 ?1433次閱讀
     <b class='flag-5'>曦</b>智科技時隔八年再登《Nature》,光電混合<b class='flag-5'>計算</b>架構(gòu)首次公開