2023年6月17日,由紹興市人民政府主辦的 2023 中國(guó)(紹興)集成電路產(chǎn)業(yè)峰會(huì)隆重舉行,“ChatGPT風(fēng)向下的集成電路新趨勢(shì)”論壇及集成電路項(xiàng)目路演也同期舉行,為百余位產(chǎn)業(yè)從業(yè)者提供深入了解行業(yè)發(fā)展動(dòng)態(tài)和交流合作的機(jī)會(huì)。沐曦首席解決方案架構(gòu)師付軒受邀參會(huì)并發(fā)表演講。
付軒在“ChatGPT風(fēng)向下的集成電路新趨勢(shì)”論壇中發(fā)表主題為《蹄急而步穩(wěn):ChatGPT與高性能GPU戰(zhàn)略概覽》的主題演講,分析了ChatGPT的應(yīng)用特點(diǎn)及軟硬件需求,指出以ChatGPT為代表的大模型發(fā)展需要大的通用算力與矩陣算力作為支撐,并且作為基于GPU生態(tài)發(fā)展起來(lái)的模型,對(duì)GPU顯存、GPU間互聯(lián)通信、通用GPU編程框架及軟件生態(tài)等多方面均有很高的要求。因此,作為算力底座的GPU不僅需要算得快,還要算得準(zhǔn)、算得穩(wěn),不僅要提供高效計(jì)算,還要保證結(jié)果準(zhǔn)確,并且靈活可靠。
對(duì)此,可以采取以下策略:首先,針對(duì)ChatGPT大模型訓(xùn)練,大集群3D并行是一種有效方式,能夠集張量并行、流水并行和數(shù)據(jù)并行為一體,與只有數(shù)據(jù)并行的小模型相比,是一種完全不同的復(fù)雜并行結(jié)構(gòu)。在大模型推理方面,推理精度要求高,延遲容忍度高,帶來(lái)越來(lái)越多的云端高算力推理需求,更適合在數(shù)據(jù)中心中運(yùn)行,也符合“東數(shù)西算”的戰(zhàn)略規(guī)劃。同時(shí),基于高性能GPU生態(tài)的算法創(chuàng)新實(shí)現(xiàn)算子提速并極大減少顯存消耗,通用算力與矩陣算力的高效協(xié)作實(shí)現(xiàn)算子融合加速,穩(wěn)定可靠的千卡大集群、GPU軟硬件結(jié)合、“訓(xùn)推一體”優(yōu)化保障訓(xùn)練和推理的精度,均是能夠使大模型計(jì)算實(shí)現(xiàn)快、準(zhǔn)、穩(wěn)的可行性措施。
沐曦作為一家提供全棧GPU芯片及解決方案的企業(yè),其旗艦產(chǎn)品曦云C500系列通用GPU采用沐曦自研IP,能夠提供強(qiáng)大的多精度混合算力,同時(shí)配以大容量存儲(chǔ)和新一代高速IO接口及多卡互聯(lián)技術(shù),不論在矩陣算力、通用算力還是顯存規(guī)格方面均可全面支持大模型推理和訓(xùn)練,并廣泛應(yīng)用于人工智能、數(shù)據(jù)中心以及教育和科研等多種場(chǎng)景。同時(shí),沐曦自主研發(fā)的MXMACA軟件棧能夠全面兼容主流GPU生態(tài),為客戶提供軟硬件一體的應(yīng)用解決方案。目前,曦云MXC500芯片已于2023年6月13日成功回片點(diǎn)亮,預(yù)計(jì)將于今年年底實(shí)現(xiàn)量產(chǎn)。
總的來(lái)說(shuō),ChatGPT對(duì)于硬件和軟件均有需求,我們要更好地利用現(xiàn)有的GPU生態(tài),發(fā)揮通用算力與矩陣算力的全面優(yōu)勢(shì),做好算子的算法創(chuàng)新和加速。同時(shí),在做千卡大集群時(shí),單節(jié)點(diǎn)內(nèi)的多GPU互聯(lián)也是必須的。此外,當(dāng)前各種大模型創(chuàng)新層出不窮,我們要把各種各樣的大模型遷移到曦云C500上來(lái),因此生態(tài)兼容也至關(guān)重要。做到以上幾點(diǎn),大模型就能夠更好地在國(guó)內(nèi)實(shí)現(xiàn)高效迭代與應(yīng)用落地。
關(guān)于沐曦
沐曦致力于為異構(gòu)計(jì)算提供安全可靠的GPU芯片及解決方案,打造全棧GPU芯片產(chǎn)品,推出MXN系列GPU(曦思)用于AI推理,MXC系列GPU(曦云)用于AI訓(xùn)練及通用計(jì)算,以及MXG系列GPU(曦彩)用于圖形渲染,滿足數(shù)據(jù)中心對(duì)“高能效”及“高通用性”的算力需求。沐曦產(chǎn)品均采用完全自主研發(fā)的GPU IP,擁有完全自主的指令集和架構(gòu),配以兼容主流GPU生態(tài)的完整軟件棧(MXMACA),具備高能效和高通用性的天然優(yōu)勢(shì),能夠?yàn)榭蛻魳?gòu)建軟硬件一體的全面生態(tài)解決方案,是“雙碳”背景下推動(dòng)數(shù)據(jù)中心建設(shè)和產(chǎn)業(yè)數(shù)字化、智能化轉(zhuǎn)型升級(jí)的算力基石。
-
集成電路
+關(guān)注
關(guān)注
5453文章
12578瀏覽量
374735 -
gpu
+關(guān)注
關(guān)注
28文章
5199瀏覽量
135534 -
ChatGPT
+關(guān)注
關(guān)注
31文章
1598瀏覽量
10297
原文標(biāo)題:沐曦付軒:蹄急而步穩(wěn),GPU助力ChatGPT快、準(zhǔn)、穩(wěn)全面發(fā)展
文章出處:【微信號(hào):沐曦MetaX,微信公眾號(hào):沐曦MetaX】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。
發(fā)布評(píng)論請(qǐng)先 登錄
沐曦股份曦云C系列GPU全面適配通義千問Qwen3.5三款新模型
沐曦股份曦云C系列GPU深度適配通義千問Qwen3.5模型
沐曦曦云C500/C550 GPU產(chǎn)品適配智譜GLM-OCR模型
沐曦曦云C500/C550 GPU產(chǎn)品適配PaddleOCR-VL-1.5模型
沐曦股份正式推出曦索X系列全新GPU品牌與產(chǎn)品線
大曉機(jī)器人與沐曦股份簽署戰(zhàn)略合作協(xié)議
沐曦股份曦云C系列GPU Day 0適配智譜GLM-4.6V多模態(tài)大模型
DLInfer聯(lián)手沐曦股份實(shí)現(xiàn)數(shù)據(jù)生成場(chǎng)景的實(shí)際落地
沐曦付軒:蹄急而步穩(wěn),GPU助力ChatGPT快、準(zhǔn)、穩(wěn)全面發(fā)展
評(píng)論