91欧美超碰AV自拍|国产成年人性爱视频免费看|亚洲 日韩 欧美一厂二区入|人人看人人爽人人操aV|丝袜美腿视频一区二区在线看|人人操人人爽人人爱|婷婷五月天超碰|97色色欧美亚州A√|另类A√无码精品一级av|欧美特级日韩特级

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

阿里云全光互聯(lián)架構(gòu),突破AI算力瓶頸

Carol Li ? 來源:電子發(fā)燒友網(wǎng) ? 作者:李彎彎 ? 2026-02-27 09:19 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

電子發(fā)燒友網(wǎng)報道(文/李彎彎)全球算力基建敘事生變,正從GPU時代邁向連接為王的通信時代。算力Scaling-law邊際效益放緩,芯片間連接通信成系統(tǒng)算力釋放的核心瓶頸,光互聯(lián)逐漸替代銅連接,成為構(gòu)建高性能AI網(wǎng)絡(luò)的關(guān)鍵。

近期阿里、騰訊均推出NPO(近封裝光學)重大成果,其中阿里云全光Scale-up網(wǎng)絡(luò)架構(gòu)UPN512通過光互連直接連接xPU與交換機,采用單層CLOS拓撲實現(xiàn)512顆xPU的全互聯(lián),該方案徹底消除機柜內(nèi)高速銅纜,顯著降低布線復雜度、散熱負擔、供電需求及運維成本,功耗降低50%,成本下降30%。

近封裝光學NPO技術(shù)優(yōu)勢

首先我們來看看什么是NPO及其優(yōu)勢。中國移動云能力中心此前發(fā)布過一份《云智算光互連發(fā)展報告》,該報告介紹,NPO的核心思想是,將光引擎非常靠近電芯片放置,但并不像CPO那樣與電芯片共封裝在同一基板或中介層上。它通常將光引擎安裝在同一基板上,通過極短的高性能電氣鏈路與電芯片相連,形成一個高度集成的系統(tǒng),如下圖所示。

NPO將光引擎與電芯片物理分離,避免了電芯片的高溫熱量直接沖擊光器件,散熱設(shè)計更簡單、高效。由于電芯片本身是巨大的熱源,工作時溫度很高,而激光器等光器件對溫度極其敏感,所以,光引擎與電芯片共封裝會導致波長漂移和性能下降。同時,由于光引擎未與電芯片共封裝,NPO在可維護性層面具有優(yōu)勢,如果光引擎失效,只需更換光引擎子模塊即可,避免了大量的維護成本。

相比激進的CPO技術(shù),NPO技術(shù)是一種更務實、風險更低的路徑。并且,NPO與傳統(tǒng)光模塊相比,其性能遠超傳統(tǒng)光模塊,其主要優(yōu)勢包括以下幾點:

lNPO的光引擎擁有更大的可布置面積和更靈活的走線方案,可以方便地使用LGA封裝,且有利于光引擎散熱;
lNPO不影響電芯片原有設(shè)計,只對PCB或基板做差異設(shè)計即可滿 足不同需求;
lNPO與電芯片解耦,能夠避免形成電芯片壟斷問題;
lNPO可單獨測試 TP1 的電信號質(zhì)量,可歸一化設(shè)備的驅(qū)動與固件,可測試性更好。

產(chǎn)業(yè)界正在形成共識,未來光互聯(lián)由Scale-up、Scale-out、Scale-across等多元網(wǎng)絡(luò)連接場景共同驅(qū)動,各技術(shù)路線長期共存、并行發(fā)展。

Scale-Up 即垂直擴展,通過向單個節(jié)點添加更多硬件提升處理能力。在 AI 大模型訓練里,它借助高速互聯(lián)技術(shù)將單個節(jié)點多塊 GPU 緊密相連,形成有超大共享顯存池的“超級節(jié)點”,讓單個模型能在統(tǒng)一顯存空間高效訓練,無需跨節(jié)點通信,是解決“內(nèi)存墻”瓶頸的關(guān)鍵。

Scale-Out 是水平擴展,通過增加節(jié)點組成集群提升整體處理能力。當單個“超級節(jié)點”算力不夠時,將成百上千個節(jié)點用高速網(wǎng)絡(luò)連接成龐大計算集群,讓模型訓練任務可并行分布在眾多 GPU 上。

Scale-Across(跨區(qū)域擴展)是應對超大規(guī)模 AI 計算需求提出的“第三大支柱”范式。隨著 AI 模型對算力需求爆炸式增長,單個數(shù)據(jù)中心在電力、散熱、空間上接近極限,Scale-Across 便是將不同城市、國家甚至大洲的多個數(shù)據(jù)中心用高速網(wǎng)絡(luò)連接,形成協(xié)同工作的“超級巨型工廠”。

隨著AI大模型向千億、萬億參數(shù)規(guī)模突破,訓練與推理場景的高并發(fā)數(shù)據(jù)傳輸需求呈指數(shù)級增長,Scaleup網(wǎng)絡(luò)作為支撐算力高效釋放的核心基礎(chǔ)設(shè)施,規(guī)模也在迅速擴大。目前,Scale out層面可插拔光模塊仍是首選,Scale up層面作為新興光模塊市場,技術(shù)高速迭代,NPO、CPO 等方案同步演進。

全球首款3.2T NPO模塊成功點亮

2025年10月,阿里云正式發(fā)布UPN512全光Scale-up架構(gòu)白皮書,提出基于單層以太網(wǎng)光互連的全新設(shè)計,旨在打造“大規(guī)模、高性能、高可靠、低成本、易擴展”的xPU互聯(lián)系統(tǒng)。
UPN512通過光互連直接連接xPU與交換機,采用單層CLOS拓撲實現(xiàn)512顆xPU全互聯(lián),還為擴展至1K +節(jié)點預留架構(gòu)空間。此方案消除機柜內(nèi)高速銅纜,大幅降低布線復雜度、散熱負擔、供電需求及運維成本。

NPO是UPN512架構(gòu)的核心使能技術(shù)。它將光電引擎靠近主芯片部署,采用線性直驅(qū)技術(shù),省去傳統(tǒng)DSP芯片,實現(xiàn)功耗降低50%以上、成本下降30%、端到端時延與銅互連相當,且供應鏈更安全可控。與LPO相比,NPO帶寬密度更高,對主芯片SerDes性能要求更低;和CPO相比,NPO采用標準LGA連接器,保持光模塊開放解耦特性,更易被用戶采納。

阿里云從3.2T NPO切入研發(fā),基于OIF標準封裝,在22.5mm×35.1mm尺寸內(nèi)實現(xiàn)3.2Tb/s傳輸帶寬。通過標準LGA連接器,光引擎與主芯片物理和電氣解耦,延續(xù)開放生態(tài)。該模塊支持硅光與VCSEL兩種技術(shù)路線,適配不同場景。

近日,阿里云宣布全球首款基于OIF標準封裝的3.2T NPO模塊成功點亮,標志著全光Scale-up進入工程落地新階段。該模塊基于兩顆16通道收發(fā)一體硅光芯片,搭配線性直驅(qū)Driver/TIA芯片,采用2D封裝工藝,具備快速量產(chǎn)潛力。其關(guān)鍵性能指標優(yōu)異:發(fā)送端光眼圖性能好,符合IEEE 802.3bs DR4標準,可與傳統(tǒng)帶DSP的DR4光模塊無縫互通;接收端在1E - 6誤碼率下,所有通道靈敏度優(yōu)于 - 5dBm;典型功耗約20W,低于同帶寬DSP方案。

阿里云將3.2T NPO技術(shù)率先應用于新一代國產(chǎn)四芯片交換機。該設(shè)備單機集成4顆25.6T國產(chǎn)交換芯片,總交換容量達102.4T,可平滑演進至409.6T平臺。目前,該交換機已完成整機上電與核心功能驗證,進入長期可靠性測試階段。

寫在最后

在算力需求持續(xù)增長的當下,全球算力基建正經(jīng)歷深刻變革。算力中心多元網(wǎng)絡(luò)連接場景驅(qū)動光互連技術(shù)發(fā)展。從目前的情況來看,可插拔光模塊在未來幾年仍是需求主力;NPO/CPO 在柜內(nèi)全光連接領(lǐng)域加速滲透,CPO進展超預期。此前市場對NPO較少關(guān)注,隨著近期阿里云、騰訊在NPO方面的動作和進展,其技術(shù)優(yōu)勢想必會更多的被業(yè)界關(guān)注。整體來看,光互連行業(yè)市場空間將持續(xù)擴大。
聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學習之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • 阿里云
    +關(guān)注

    關(guān)注

    3

    文章

    1038

    瀏覽量

    45708
  • AI算力
    +關(guān)注

    關(guān)注

    1

    文章

    143

    瀏覽量

    9884
收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關(guān)推薦
    熱點推薦

    時延小于1毫秒,工信部發(fā)布網(wǎng)絡(luò)重磅利好政策

    信號傳輸物理瓶頸限制,存在時延高、帶寬不足、擴展性差等問題,難以支撐未來百萬卡級智集群的規(guī)?;渴?。在此形勢下,光通信技術(shù)憑借超低時延、超大帶寬和協(xié)議透明性等優(yōu)勢,成為突破
    的頭像 發(fā)表于 10-20 07:17 ?1.1w次閱讀
    時延小于1毫秒,工信部發(fā)布<b class='flag-5'>全</b><b class='flag-5'>光</b><b class='flag-5'>算</b><b class='flag-5'>力</b>網(wǎng)絡(luò)重磅利好政策

    如何突破AI存儲墻?深度解析ONFI 6.0高速接口與Chiplet解耦架構(gòu)

    1. 行業(yè)核心痛點:AI“存儲墻”危機在大模型訓練與推理場景中,演進速度遠超存儲帶寬,計算與存儲之間的性能鴻溝(存儲墻)已成為限制系統(tǒng)能效的關(guān)鍵瓶頸。? Scale-up需求:單節(jié)
    發(fā)表于 01-29 17:32

    湘軍,讓變成生產(chǎn)?

    腦極體
    發(fā)布于 :2025年11月25日 22:56:58

    睿海光電推出新一代互聯(lián)解決方案 加速AI基礎(chǔ)設(shè)施升級

    睿海光電推出新一代互聯(lián)解決方案 加速AI基礎(chǔ)設(shè)施升級 ? 在全球
    的頭像 發(fā)表于 08-19 17:15 ?834次閱讀

    400G QSFP-DD SR4 模塊:構(gòu)筑 AI網(wǎng)絡(luò)的高速互聯(lián)核心

    在數(shù)字化轉(zhuǎn)型與 AI 需求爆發(fā)的疊加驅(qū)動下,400G QSFP-DD SR4 模塊憑借短距高效傳輸特性與全場景適配能力,已成為數(shù)據(jù)中心、
    的頭像 發(fā)表于 08-19 10:07 ?1023次閱讀

    睿海光電800G模塊助力全球AI基建升級

    在全球數(shù)字化轉(zhuǎn)型加速的背景下,超高速模塊作為數(shù)據(jù)中心與AI網(wǎng)絡(luò)的核心部件,正經(jīng)歷從400G向800G、1.6T的迭代浪潮。在這一賽道中,深圳市睿海光電科技有限公司(以下簡稱“睿海
    發(fā)表于 08-13 19:05

    睿海光電領(lǐng)航AI模塊:超快交付與全場景兼容賦能智時代——以創(chuàng)新實力助力全球客戶構(gòu)建高效底座

    一、AI革命催生光模塊新需求,睿海光電以技術(shù)優(yōu)勢搶占制高點 人工智能、超大規(guī)模數(shù)據(jù)中心和計算的高速發(fā)展,對光模塊的傳輸效率、兼容性及交付周期提出更高要求。作為全球
    發(fā)表于 08-13 19:03

    睿海光電以高效交付與廣泛兼容助力AI數(shù)據(jù)中心800G模塊升級

    引領(lǐng)AI時代網(wǎng)絡(luò)變革:睿海光電的核心競爭AI時代,數(shù)據(jù)中心正經(jīng)歷從傳統(tǒng)架構(gòu)AI工廠與AI
    發(fā)表于 08-13 19:01

    加速AI未來,睿海光電800G OSFP模塊重構(gòu)數(shù)據(jù)中心互聯(lián)標準

    在人工智能需求呈指數(shù)級增長的2025年,數(shù)據(jù)傳輸效率已成為制約AI發(fā)展的關(guān)鍵瓶頸。作為全球AI
    發(fā)表于 08-13 16:38

    AIGC基礎(chǔ)設(shè)施技術(shù)架構(gòu)與行業(yè)實踐

    AIGC基礎(chǔ)設(shè)施技術(shù)架構(gòu)與行業(yè)實踐 一、硬件層:AI的物理載體 芯片技術(shù)升級? 國際前沿
    的頭像 發(fā)表于 05-29 07:44 ?958次閱讀
    AIGC<b class='flag-5'>算</b><b class='flag-5'>力</b>基礎(chǔ)設(shè)施技術(shù)<b class='flag-5'>架構(gòu)</b>與行業(yè)實踐

    AI原生架構(gòu)升級:RAKsmart服務器在超大規(guī)模模型訓練中的突破

    近年來,隨著千億級參數(shù)模型的崛起,AI訓練對的需求呈現(xiàn)指數(shù)級增長。傳統(tǒng)服務器架構(gòu)在應對分布式訓練、高并發(fā)計算和顯存優(yōu)化等場景時逐漸顯露瓶頸
    的頭像 發(fā)表于 04-24 09:27 ?798次閱讀

    RAKsmart智能架構(gòu):異構(gòu)計算+低時延網(wǎng)絡(luò)驅(qū)動企業(yè)AI訓練范式升級

    AI大模型參數(shù)量突破萬億、多模態(tài)應用爆發(fā)的今天,企業(yè)AI訓練正面臨效率與成本的雙重挑戰(zhàn)。RAKsmart推出的智能
    的頭像 發(fā)表于 04-17 09:29 ?772次閱讀

    華為助力中國移動全面升級“九州”互聯(lián)網(wǎng)

    在中國移動大會期間,以“智啟新,安全筑基“為主題的智基礎(chǔ)設(shè)施及安全峰會成功舉辦。會上,中國移動聯(lián)合華為等重磅發(fā)布了《“九州”
    的頭像 發(fā)表于 04-14 16:46 ?1178次閱讀

    廣和通亮相阿里AI創(chuàng)造大展

    4月9日-12日,2025 AI“巨”場· 中國AI創(chuàng)造大展在北京首創(chuàng)·郎園Station盛大啟幕。作為阿里的重要合作伙伴,廣和通攜融合
    的頭像 發(fā)表于 04-12 14:09 ?1618次閱讀

    DeepSeek推動AI需求:800G模塊的關(guān)鍵作用

    集群的部署過程中,帶寬瓶頸成為制約發(fā)揮的關(guān)鍵因素,而光模塊的速率躍升成為突破這一瓶頸的核心
    發(fā)表于 03-25 12:00