91欧美超碰AV自拍|国产成年人性爱视频免费看|亚洲 日韩 欧美一厂二区入|人人看人人爽人人操aV|丝袜美腿视频一区二区在线看|人人操人人爽人人爱|婷婷五月天超碰|97色色欧美亚州A√|另类A√无码精品一级av|欧美特级日韩特级

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

讓大模型訓練更高效,奇異摩爾用互聯創(chuàng)新方案定義下一代AI計算

Felix分析 ? 來源:電子發(fā)燒友 ? 作者:吳子鵬 ? 2025-02-18 09:19 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

電子發(fā)燒友網報道(文/吳子鵬)近一段時間以來,DeepSeek現象級爆火引發(fā)產業(yè)對大規(guī)模數據中心建設的思考和爭議。在訓練端,DeepSeek以開源模型通過算法優(yōu)化(如稀疏計算、動態(tài)架構)降低了訓練成本,使得企業(yè)能夠以低成本實現高性能AI大模型的訓練;在推理端,DeepSeek加速了AI應用從訓練向推理階段的遷移。因此,有觀點稱,DeepSeek之后算力需求將放緩。不過,更多的國內外機構和研報認為,DeepSeek降低了AI應用的門檻,將加速AI大模型應用落地,吸引更多的企業(yè)進入這個賽道,算力需求仍將繼續(xù)增長,不過需求重心從“單卡峰值性能”轉向“集群能效優(yōu)化”。比如,SemiAnalysis預測,全球數據中心容量將從2023年的49GW增長至2026年的96GW,其中新建智算中心容量將占增量的85%。近日,全球四大巨頭(Meta、亞馬遜、微軟及)公布的2025 AI基礎設施支出總計超3000億美元,相比2024年增長30%。

6c96ba4d38a84d9c978060d22f882d77~tplv-tt-shrink:640:0.image?lk3s=06827d14&traceid=2025021809203605B197149BAFA09BCBEF&x-expires=2147483647&x-signature=yZgUXHDjzeN9KBAdjqZuPSzrOxM%3D

(數據來源:科技巨頭公開披露報告)

奇異摩爾創(chuàng)始人兼CEO田陌晨表示:“‘Scaling Law’依然在延續(xù)。從Transformer的獨領風騷到MoE專家模型的創(chuàng)新突圍,AI領域正邁向萬億、甚至十萬億參數規(guī)模的AI大模型訓練時代。DeepSeek-R1推理模型的問世離不開基礎模型Deepseek-V3的龐大訓練積累。在這一背景下,強大的算力集群依然是支撐AI的基石。而如何提高集群的線性加速比,一直是產業(yè)的核心話題。與此同時,AI算力網絡的重要性日益凸顯,它讓數據在集群中各個層面、各個維度上都能夠快速傳輸,實現各節(jié)點資源的高效調動。”

29c170f49d3c44fab54527cd154b4160~tplv-tt-shrink:640:0.image?lk3s=06827d14&traceid=2025021809203605B197149BAFA09BCBEF&x-expires=2147483647&x-signature=xba8BhHSj%2F48bYIdlDaPcMg%2F3PI%3D

(圖:奇異摩爾創(chuàng)始人兼CEO田陌晨)

為此,作為行業(yè)領先的AI網絡全棧式互聯產品及解決方案提供商,奇異摩爾給出了一套極具競爭力的解決方案——基于高性能RDMA和Chiplet技術,利用“Scale Out”“Scale Up”“Scale Inside”三大理念,提升算力基礎設施在網間、片間和片內的傳輸效率,為智能算力發(fā)展賦能。

Scale Out——打破系統(tǒng)傳輸瓶頸

DeepSeek的成功證明了開源模型相較于閉源模型具有一定的優(yōu)越性,隨著模型的智能化趨勢演進,模型體量的增加仍然會是行業(yè)發(fā)展的主要趨勢之一。為了完成千億、萬億參數規(guī)模AI大模型的訓練任務,通用的做法一般會采用Tensor并行(TP)、Pipeline并行(PP)、和Data并行(DP)策略來拆分訓練任務。隨著MoE(Mixture of Experts,混合專家)模型的出現,除了涉及上述并行策略外,還引入了專家并行(EP)。其中,EP和TP通信數據開銷較大,主要通過Scale Up互聯方式應對。DP和PP并行計算的通信開銷相對較小,主要通過Scale Out互聯方式應對。

因而,如下圖所示,當下主流的萬卡集群里存在兩種互聯域——GPU南向Scale Up互聯域(Scale Up Domain,SUD)和GPU北向Scale Out互聯域(Scale Out Domain,SOD)。田陌晨強調:“以Scale Up和Scale Out雙擎驅動方式構建大規(guī)模、高效的智算集群,是應對算力需求爆發(fā)的有效手段?!?/p>

263c2adff30c476b90dd8ad3a1bdc009~tplv-tt-shrink:640:0.image?lk3s=06827d14&traceid=2025021809203605B197149BAFA09BCBEF&x-expires=2147483647&x-signature=YuLsyb9H5%2FQ5R5mNcMS7KkcRD2s%3D

智算集群里的Scale Up和Scale Out

在這個集群網絡中,Scale Out專注于橫向/水平的擴展,強調通過增加更多計算節(jié)點實現集群規(guī)模的擴展。當前,遠程直接內存訪問(RDMA)已經成為構建Scale Out網絡的主流選擇。作為一種host-offload/host-bypass技術,RDMA提供了從一臺計算機內存到另一臺計算機內存的直接訪問,具有低延遲、高帶寬的特性,在大規(guī)模集群中扮演著重要的角色。如下圖所示,RDMA主要包含InfiniBand(IB)、基于以太網的RoCE和基于TCP/IP的iWARP。其中,IB和以太網RDMA是算力集群里應用最廣泛的技術。

d15a5d1be6934551ad5bd22f0dc36752~tplv-tt-shrink:640:0.image?lk3s=06827d14&traceid=2025021809203605B197149BAFA09BCBEF&x-expires=2147483647&x-signature=wOOH%2BrvfX2m%2BgMF9VacIsWGatKg%3D

RDMA應用和實現方式(來源:知乎 @Savir)

IB是專門為RDMA開發(fā)的一種網絡通信技術,具有高帶寬、低延遲等優(yōu)勢,且IB默認是無損網絡,無需特殊設置。得益于這些優(yōu)勢,過往IB在Scale Out網絡構建中占據主導地位。然而,IB需要專門支持該技術的網卡和交換機,價格是傳統(tǒng)網絡的5-10倍,成本相對較高,且IB交換機交期較長。同時,IB兼容性差,難以和大多數以太網設備兼容,例如網卡、線纜、交換機和路由器等,無法成為行業(yè)統(tǒng)一的發(fā)展路線。

隨著集群規(guī)模增大,以太網RDMA獲得了主流廠商的廣泛支持。以太網RDMA同樣具有高速率、高帶寬、CPU負載低等優(yōu)勢,在低時延和無損網絡特性方面也已經和IB性能持平。同時,以太網RDMA具有更好的開放性、兼容性和統(tǒng)一性,更利于做大規(guī)模的組網集群。從一些行業(yè)代表性案例來看,如字節(jié)跳動的萬卡集群,Meta公司的數萬卡集群,以及特斯拉希望打造的十萬卡集群,都一致選擇了以太網方案。此外,因為硬件通用和運維簡單,以太網RDMA方案更具性價比。

雖然以太網RDMA已經被公認是未來Scale Out的大趨勢,不過田陌晨指出:“如果是基于RoCEv2構建方案仍存在一些問題,比如亂序需要重傳,負載分擔不完美,存在Go-back-N問題,以及DCQCN 部署調優(yōu)復雜等。在萬卡和十萬卡集群中,業(yè)界需要增強型以太網RDMA以應對上述這些挑戰(zhàn),超以太網傳輸(Ultra Ethernet Transport,UET)便是下一代AI計算和HPC里的關鍵技術?!?/p>

為了能夠進一步發(fā)揮以太網和RDMA技術的潛能,博通、思科、Arista、微軟、Meta等公司牽頭成立了超以太網聯盟(UEC)。如下圖所示,在UEC規(guī)范1.0的預覽版本中,UEC從軟件API、運輸層、鏈路層、網絡安全和擁塞控制等方面對Transport Layer傳輸層做了全面的優(yōu)化,關鍵功能包括FEC(前向糾錯)統(tǒng)計、鏈路層重傳(LLR)、多路徑報文噴發(fā)、新一代擁塞控制、靈活排序、端到端遙測、交換機卸載等。根據AMD方面的數據,UEC就緒(UEC-ready)系統(tǒng)能夠提供比傳統(tǒng)RoCEv2系統(tǒng)高出5-6倍的性能。

477ef8656ef148938265a8de798618a5~tplv-tt-shrink:640:0.image?lk3s=06827d14&traceid=2025021809203605B197149BAFA09BCBEF&x-expires=2147483647&x-signature=Ey6jME9p8r24x7HpRQWnM8IfnvQ%3D

UEC規(guī)范1.0示意圖(來源:UEC)

田陌晨表示:“UEC是專門為AI網絡Scale Out互聯成立的國際聯盟,致力于通過Modernized RDMA優(yōu)化AI和HPC工作負載。借助UEC的關鍵性能,Scale Out網絡能夠充分利用系統(tǒng)內所有可用的傳輸路徑,并最小化網絡擁塞。當前基于RDMA RoCE的解決方案未來也可以通過踐行UEC聯盟的標準升級各自的以太網產品方案,打造更大規(guī)模的無損集群通信。”

奇異摩爾打造的Kiwi NDSA-SNIC AI原生智能網卡便是一款UEC就緒方案,性能比肩全球標桿ASIC產品。Kiwi NDSA SmartNIC提供領先行業(yè)的高性能,支持高達800Gbps的傳輸帶寬,提供低至μs級的數據傳輸延時,滿足當前數據中心行業(yè)400Gbps-800Gbps升級需求,可實現Tb級別萬卡集群間無損數據傳輸。

848133b43caf4d54ab9c65cd7f227a3d~tplv-tt-shrink:640:0.image?lk3s=06827d14&traceid=2025021809203605B197149BAFA09BCBEF&x-expires=2147483647&x-signature=PfgazJ9tk4e68ythKVeicelJjRs%3D

奇異摩爾Kiwi NDSA-SNIC AI原生智能網卡方案(來源:奇異摩爾)

借助UEC就緒RDMA中的路徑感知擁塞控制、有序消息傳遞、選擇性確認重傳、自適應路由及數據包噴灑等關鍵功能,Kiwi NDSA-SNIC能夠充分保障AI網絡間數據的穩(wěn)定傳輸。比如,Kiwi NDSA-SNIC提供的自適應路由及數據包噴灑功能可以充分發(fā)揮高速網絡的性能,支持高級分組噴灑,提供多路徑數據包傳送和細粒度負載平衡,有效應對傳輸擁塞。相同用例還有:通過有序消息傳遞(In-Order Message Delivery)來降低系統(tǒng)延遲,通過路徑感知擁塞控制(Path Aware Congestion Control)來優(yōu)化多個路徑的數據包流,等等。

此外,Kiwi NDSA-SNIC還擁有很多其他的關鍵特性。比如,Kiwi NDSA-SNIC具有出色的高并發(fā)特性,支持多達數百萬個隊列對,可擴展內存空間達到GB;Kiwi NDSA-SNIC具有可編程性,可應對各種網絡任務加速,為Scale Out網絡帶來持續(xù)創(chuàng)新的功能,并保證與未來的行業(yè)標準無縫兼容。

綜合而言,奇異摩爾的Kiwi NDSA-SNIC AI原生智能網卡是一個擁有高性能、可編程的Scale Out網絡引擎,將開啟AI網絡 Scale Out發(fā)展的新篇章。田陌晨稱:“當前,奇異摩爾已經成為UEC聯盟成員。隨著以太網逐漸過渡到超以太網,奇異摩爾愿攜手聯盟伙伴共同探討并踐行Scale Out相關標準的制定和完善,并第一時間為行業(yè)帶來性能領先的UEC方案,推動AI網絡 Scale Out技術向前發(fā)展。”

b15b3b9a0f5648d3a62ff8046fc63175~tplv-tt-shrink:640:0.image?lk3s=06827d14&traceid=2025021809203605B197149BAFA09BCBEF&x-expires=2147483647&x-signature=9EU7g0iUH%2FQKYBjEafOX3UKOU14%3D

奇異摩爾UEC會員(來源:UEC官網)

Scale Up——讓計算芯片配合更高效

和橫向/水平擴展的Scale Out不同,Scale Up是垂直/向上擴展,目標是打造機內高帶寬互聯的超節(jié)點。上述提到,TP張量并行以及EP專家并行需要更高的帶寬和更低的時延來進行全局同步。通過Scale Up的方式,將更多的算力芯片GPU集中到一個節(jié)點上,是非常有效的應對方式。如今的Scale Up實際上就是一個以超高帶寬為核心的機內GPU-GPU組網方式,還有一個名稱是超帶寬域(HBD,High Bandwidth Domain)。

英偉達GB200 NVL72的推出引領著國內外AI網絡生態(tài)對HBD技術的廣泛探討。英偉達GB200NVL72服務器是一個典型的超大HBD,實現了36組GB200(36個Grace CPU,72個B200 GPU)之間的超高帶寬互聯。在這個HBD系統(tǒng)里,第五代 NVLink是最關鍵的,它能夠提供GPU-GPU之間雙向1.8TB的傳輸速率,使得這個HBD系統(tǒng)可以作為一個大型GPU去使用,訓練效率相較于H100系統(tǒng)提升了4倍,能效提升了25倍。

4623031122df473aaa201f438b9490d3~tplv-tt-shrink:640:0.image?lk3s=06827d14&traceid=2025021809203605B197149BAFA09BCBEF&x-expires=2147483647&x-signature=rNVB%2Bl5iEhgvRSiotHKWCLrEBzI%3D

NVL72互聯架構(來源:英偉達)

和IB一樣,NVLink也是由英偉達主導,雖然性能強勁但是生態(tài)封閉,只服務于英偉達的高端GPU。由于沒有NVLink和NVSwitch這樣的技術,此前其他廠商主要采用full mesh或者cube-mesh結構,以8卡互聯為主,而16-32卡互聯是下一代方案。

DeepSeek事件引發(fā)了業(yè)界對于上述NVLink和HBD需求的不同預期。但中長期發(fā)展來看,相比軟件迭代速度以小時來計算,硬件的迭代則是以年為計算的循序漸進過程,不會一蹴而就。據SemiAnalysis預計大型模型的標準只會隨著未來的模型發(fā)布而繼續(xù)升高,但從經濟效用上來說,其所對應的硬件必須堅持使用并有效 4-6 年,而不僅僅是直到下一個模型發(fā)布。

對此,田陌晨認為:“未來MoE模型的進階路線在一定程度上存在不確定性,創(chuàng)新隨時可能發(fā)生。但國產AI網絡的生態(tài)閉環(huán)勢在必行。英偉達NVLink和Cuda的護城河仍然存在,首先要解決Scale Up互聯國產替代方案有沒有的問題,再來看做到哪種程度。未來隨著國產大模型、芯片架構等軟硬件生態(tài)的協同發(fā)展,有望逐步實現國產算力閉環(huán)?!?/p>

如今,科技巨頭正聯合生態(tài)上下游在GPU-GPU高效互聯方面主要分為兩個流派:內存語義和消息語義。內存語義Load/Store/Atomic是GPU內部總線傳輸的原生語義,英偉達NVLink便是基于內存語義,對標NVLink的UAlink等也是基于這種語義;消息語義則是采用類似Scale Out的DMA語義Send/Read/Write,將數據進行打包傳輸,亞馬遜和Tenstorrent等公司便是基于消息語義打造Scale Up互聯方案。

內存語義和消息語義各有千秋。內存語義是GPU內部傳輸的原生語義,處理器負擔更小,在數據包體量小時效率更高;消息語義采用數據打包的方式,隨著數據包體量變大,性能逐漸追上了內存語義,隨著AI大模型體量增大,這一點也非常重要。

不過,田陌晨指出:“無論是內存語義還是消息語義,對于廠商而言,都面臨一些共性的挑戰(zhàn),比如傳統(tǒng)GPU直出將IO集成在GPU內部,性能提升受到了光罩尺寸的嚴格限制,留給IO的空間非常有限,IO密度提升困難;Scale Up網絡和數據傳輸協議復雜,計算芯片廠商大都缺乏相關經驗,尤其是開發(fā)交換機芯片的經驗;除NVLink之外,其他Scale Up協議并不成熟且不統(tǒng)一,協議迭代對計算芯片迭代造成了巨大的困擾?!?/p>

19c2ad540362416fa1830704d5ef84c9~tplv-tt-shrink:640:0.image?lk3s=06827d14&traceid=2025021809203605B197149BAFA09BCBEF&x-expires=2147483647&x-signature=SlH%2Bfou8K9TL1ElQmk5jEpcf7JQ%3D

GPU IO集成在GPU內部(來源:奇異摩爾)

為了能夠更好地應對上述挑戰(zhàn),產業(yè)界提出了一種創(chuàng)新的GPU直出方式——計算和IO分離。奇異摩爾NDSA-G2G互聯方案便是這條技術路徑里非常有競爭力的一款方案。

借助NDSA-G2G可以實現計算芯粒和IO芯粒解耦,通過通用芯?;ヂ摷夹gUCIe進行互聯。這樣做的好處是,只需要犧牲一點點的芯片面積(小百分之幾),就可以將寶貴的中介層資源近乎100%用于計算,并按照客戶的需求靈活地增加IO芯粒的數量,且計算芯粒和IO芯??梢曰诓煌墓に嚰夹g。再加上IO芯粒的復用特性,能夠顯著提升高性能計算芯片的性能和性價比。

NDSA-G2G的第二大優(yōu)勢是提升IO密度和性能,具有高帶寬、低延時和高并發(fā)的特性。在高帶寬方面,基于NDSA-G2G芯粒,可以實現1TB級別的網絡層吞吐量,TB級的GPU側吞吐量;在低延時方面,NDSA-G2G芯粒提供百ns級的數據傳輸延時和ns級D2D數據傳輸延時;在高并發(fā)方面,該產品支持多達數百萬個隊列對,可擴展系統(tǒng)中的內存資源。也就是說,借助奇異摩爾NDSA-G2G芯粒能夠賦能國產AI芯片實現自主突圍,構建性能媲美英偉達NVSwitch+NVLink的Scale Up方案。

dacce002ca3647ca8b9122ea5000ffda~tplv-tt-shrink:640:0.image?lk3s=06827d14&traceid=2025021809203605B197149BAFA09BCBEF&x-expires=2147483647&x-signature=6G%2FZScwG1gcLpiro%2FWkcM05s%2BXg%3D

Kiwi NDSA-G2G 產品示意圖(來源:奇異摩爾)

NDSA-G2G的第三大優(yōu)勢是具有出色的靈活性。如上所述,目前Scale Up技術路線并不統(tǒng)一,且智算中心廠商在協議方面大都采用自有協議,或者自己主導的聯盟協議。這就導致高性能計算芯片需要在設計時考慮未來2~3年,甚至是3~5年的協議發(fā)展,具有非常大的挑戰(zhàn)。NDSA-G2G以計算芯粒和IO芯粒分離的方式讓IO芯??梢造`活升級,同時NASG-G2G基于具有可編程性,可以支持目前市面上各種IO協議。這種靈活性讓高性能計算芯片廠商可以從容應對當前Scale Up技術路線不統(tǒng)一且協議混亂的挑戰(zhàn)。

同時,田陌晨也呼吁:“希望科技行業(yè)在Scale Up方向上能夠擁抱一種開放而統(tǒng)一的物理接口,實現更好的協同發(fā)展,這也是打造國產自主可控算力底座的關鍵一步。”

Scale Inside——全面提升計算芯片傳輸效率

在Scale Out和Scale Up 高速發(fā)展的過程中,作為算力基礎單元,Scale Inside的進度也沒有落下,并致力于通過先進封裝技術彌補摩爾定律速度放緩的影響。在整個智算系統(tǒng)里,更高算力的計算芯片能夠進一步提升Scale Up和Scale Out的性能水平,使得AI大模型的訓練更加高效。

當前,單顆高性能計算芯片的成本已經非??植溃S著制程工藝進一步精進,這一數字還將繼續(xù)飆升,因而Chiplet技術得到了廣泛的重視。Chiplet技術允許通過混合封裝的方式打造高性能計算芯片,也就是說計算單元和IO、存儲等其他功能單元可以選擇不同的工藝實現,具有極高的靈活性,允許廠商根據自己的需求進行定制芯粒,不僅能夠顯著降低芯片設計和制造的成本,良率也能夠得到很大的改善。

在Scale Inside方向上,奇異摩爾能夠提供豐富的Chiplet技術方案,包括Kiwi Link UCIe Die2Die接口IP、Central IO Die,3D Base Die系列等。其中,Kiwi Link全系列支持UCIe標準,具有業(yè)界領先的高帶寬、低功耗、低延時特性,并支持多種封裝類型。Kiwi Link支持高達16~32 GT/s的傳輸速率和低至ns級的傳輸延遲,支持Multi-Protocol多協議,包括PCIe、CXL和Streaming。

6a80c69986d44a1b8c00bf9628454b25~tplv-tt-shrink:640:0.image?lk3s=06827d14&traceid=2025021809203605B197149BAFA09BCBEF&x-expires=2147483647&x-signature=oy%2FEsd4pzekthZPq94pNy28kGDE%3D

Kiwi Fabric互聯架構(來源:奇異摩爾)

綜合而言,奇異摩爾的解決方案能夠從“Scale Out”“Scale Up”“Scale Inside”三大角度,推動AI大模型訓練效率的提升。在Scale Out方面,奇異摩爾已經是超以太網聯盟UEC的成員,能夠在第一時間響應UEC規(guī)范1.0以及后續(xù)規(guī)范;在Scale Up方面,奇異摩爾NDSA-G2G芯粒不僅能夠幫助科技公司打造媲美英偉達NVSwitch+NVLink性能的Scale Up方案,適配各種技術路線和協議,也正在引領計算芯片的設計革新;在Scale Inside方案,奇異摩爾的Kiwi Link UCIe Die2Die接口IP、Central IO Die、3D Base Die系列等方案能夠幫助廠商打造具有高效傳輸能力的高性能計算芯片。

這些方案很好地踐行了奇異摩爾公司的使命——以互聯為中心,依托Chiplet和RDMA技術,構筑AI高性能計算的基石?!皩τ趪aAI大模型和國產AI芯片產業(yè)而言,奇異摩爾的方案是新質生產力的代表,有著更大的潛能值得去挖掘。為實現國產AI芯片產業(yè)的‘中國夢’,奇異摩爾不僅提供支持最前沿協議的IO芯粒,以實現高速率、高帶寬、低時延的傳輸表現,還在Chiplet路線上獨辟蹊徑,用創(chuàng)新的芯片架構助力打造更高性能的AI芯片。奇異摩爾愿與國內公司攜手,為國產AI芯片產業(yè)發(fā)展添磚加瓦,共同勾畫國產AI發(fā)展的廣闊藍圖。”田陌晨最后說。

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規(guī)問題,請聯系本站處理。 舉報投訴
收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關推薦
    熱點推薦

    奇異摩爾Networking for AI生態(tài)沙龍成功舉辦

    近日,中國信息通信研究院華東分院與行業(yè)領先的AI網絡全棧式互聯產品及解決方案提供商——奇異摩爾聯合舉辦的“聚力向芯 算涌無界 Network
    的頭像 發(fā)表于 10-09 12:45 ?806次閱讀

    【「AI芯片:科技探索與AGI愿景」閱讀體驗】+第二章 實現深度學習AI芯片的創(chuàng)新方法與架構

    、Transformer 模型的后繼者 二、創(chuàng)新方法實現深度學習AI芯片 1、基于開源RISC-V的AI加速器 RISC-V是
    發(fā)表于 09-12 17:30

    【「AI芯片:科技探索與AGI愿景」閱讀體驗】+工藝創(chuàng)新將繼續(xù)維持著摩爾神話

    。那該如何延續(xù)摩爾神話呢? 工藝創(chuàng)新將是其途徑之,芯片中的晶體管結構正沿著摩爾定律指出的方向一代代演進,本段加速半導體的微型化和進
    發(fā)表于 09-06 10:37

    摩爾線程“AI工廠”:五大核心技術支撐,打造大模型訓練超級工廠

    演講中表示,為應對生成式AI爆發(fā)式增長下的大模型訓練效率瓶頸,摩爾線程將通過系統(tǒng)級工程創(chuàng)新,構建新一代
    的頭像 發(fā)表于 07-28 11:28 ?4561次閱讀
    <b class='flag-5'>摩爾</b>線程“<b class='flag-5'>AI</b>工廠”:五大核心技術支撐,打造大<b class='flag-5'>模型</b><b class='flag-5'>訓練</b>超級工廠

    摩爾線程“AI工廠”:以系統(tǒng)級創(chuàng)新定義一代AI基礎設施

    演講中表示,為應對生成式AI爆發(fā)式增長下的大模型訓練效率瓶頸,摩爾線程將通過系統(tǒng)級工程創(chuàng)新,構建新一代
    發(fā)表于 07-28 10:34 ?2810次閱讀
    <b class='flag-5'>摩爾</b>線程“<b class='flag-5'>AI</b>工廠”:以系統(tǒng)級<b class='flag-5'>創(chuàng)新定義</b>新<b class='flag-5'>一代</b><b class='flag-5'>AI</b>基礎設施

    歌爾展出前沿創(chuàng)新方案,破譯AI眼鏡“聲學密碼”

    7月17日至19日,歌爾首屆創(chuàng)新大會在歌爾濰坊總部和歌爾青島全球研發(fā)總部同步舉行。會上展出Video、Audio、AI等領域百余前沿技術成果,其中多項聲學創(chuàng)新方案AI眼鏡帶來更優(yōu)質聲
    的頭像 發(fā)表于 07-21 09:57 ?8294次閱讀
    歌爾展出前沿<b class='flag-5'>創(chuàng)新方案</b>,破譯<b class='flag-5'>AI</b>眼鏡“聲學密碼”

    【開源獲獎案例】AI智能交互新方案:基于T5L智能屏的AI DeepSeek大模型

    ——來自迪文開發(fā)者論壇本期為大家推送迪文開發(fā)者論壇獲獎開源案例——AI智能交互新方案:基于T5L智能屏的AIDeepSeek大模型。該方案通過T5L串口與
    的頭像 發(fā)表于 07-12 09:02 ?1076次閱讀
    【開源獲獎案例】<b class='flag-5'>AI</b>智能交互<b class='flag-5'>新方案</b>:基于T5L智能屏的<b class='flag-5'>AI</b> DeepSeek大<b class='flag-5'>模型</b>

    奇異摩爾邀您相約2025中國AI算力大會

    在2025中國AI算力大會上,奇異摩爾首席網絡架構專家葉棟將帶來“AI原生時代 —共筑超節(jié)點的網絡基礎架構”的主題演講,分享國內外超節(jié)點解決方案
    的頭像 發(fā)表于 06-17 17:49 ?1537次閱讀

    英特爾與面壁智能宣布建立戰(zhàn)略合作伙伴關系,共同研發(fā)端側原生智能座艙,定義下一代車載AI

    今日,英特爾與面壁智能簽署合作備忘錄。雙方宣布達成戰(zhàn)略級合作伙伴關系,旨在打造端側原生智能座艙,定義下一代車載AI。目前,雙方已合作推出“英特爾&面壁智能車載大模型GUI智能體”,將端
    的頭像 發(fā)表于 04-23 21:46 ?1163次閱讀
    英特爾與面壁智能宣布建立戰(zhàn)略合作伙伴關系,共同研發(fā)端側原生智能座艙,<b class='flag-5'>定義</b><b class='flag-5'>下一代</b>車載<b class='flag-5'>AI</b>

    LPO 光模塊:下一代數據中心網絡的節(jié)能高效新選擇

    LPO(線性可插拔光模塊)是面向數據中心高速互聯的低功耗創(chuàng)新方案,通過摒棄傳統(tǒng) DSP 芯片,采用線性模擬技術直接驅動光器件,實現信號傳輸效率與能效的雙重突破。該技術具備四大優(yōu)勢:能效低、延遲低
    的頭像 發(fā)表于 04-21 17:14 ?2790次閱讀

    首創(chuàng)開源架構,天璣AI開發(fā)套件端側AI模型接入得心應手

    應用開發(fā)不用“等平臺”,徹底釋放開發(fā)效率和模型接入自由度。 自DeepSeek橫空出世以來,這種更適合端側部署,回答效率更高效訓練模式快速引爆了AI行業(yè),主流大
    發(fā)表于 04-13 19:52

    適用于數據中心和AI時代的800G網絡

    持續(xù)優(yōu)化800G網絡解決方案,為下一代1.6T數據中心鋪平道路,助力數據中心迎接更高性能、更智能化的時代挑戰(zhàn)。 ? *文章來源于飛速(FS)社區(qū) ?
    發(fā)表于 03-25 17:35

    摩爾線程GPU原生FP8計算助力AI訓練

    并行訓練和推理,顯著提升了訓練效率與穩(wěn)定性。摩爾線程是國內率先原生支持FP8計算精度的國產GPU企業(yè),此次開源不僅為AI
    的頭像 發(fā)表于 03-17 17:05 ?1531次閱讀
    <b class='flag-5'>摩爾</b>線程GPU原生FP8<b class='flag-5'>計算</b>助力<b class='flag-5'>AI</b><b class='flag-5'>訓練</b>

    Imagination與瑞薩攜手,重新定義GPU在下一代汽車中的角色

    汽車架構正在經歷場巨大的變革,傳統(tǒng)的分布式架構正逐漸被更具有成本效益的集中式模型所取代。僅這點變化便將顯著提升下一代汽車SoC的計算需求;而當同時考慮高級駕駛輔助系統(tǒng)、軟件
    的頭像 發(fā)表于 03-12 08:33 ?804次閱讀
    Imagination與瑞薩攜手,重新<b class='flag-5'>定義</b>GPU在<b class='flag-5'>下一代</b>汽車中的角色

    訓練好的ai模型導入cubemx不成功怎么處理?

    訓練好的ai模型導入cubemx不成功咋辦,試了好幾個模型壓縮了也不行,ram占用過大,有無解決方案
    發(fā)表于 03-11 07:18