中文无码一区在线观看,成人A片日版日本色导航

電子發(fā)燒友網(wǎng)報道（文/莫婷婷）隨著生成式AI應(yīng)用的爆發(fā)式增長，數(shù)據(jù)中心對高效、低成本、低功耗AI推理能力的需求急劇上升。高通憑借其在移動計算和通信領(lǐng)域的技術(shù)積累，正試圖通過差異化戰(zhàn)略，在價值數(shù)千億美元的數(shù)據(jù)中心市場中搶占一席之地。

就在10月28日，高通面向數(shù)據(jù)中心連發(fā)兩款A(yù)I芯片，AI200 和 AI250 芯片，打造下一代 AI 推理優(yōu)化解決方案。這一舉措不僅標(biāo)志著高通在AI基礎(chǔ)設(shè)施領(lǐng)域的拓展，也被業(yè)內(nèi)視為其對英偉達在AI數(shù)據(jù)中心市場發(fā)起挑戰(zhàn)的關(guān)鍵一步。

支持768 GB LPDDR，高通AI芯片性能、架構(gòu)與能效全面突破

此次發(fā)布的AI200和AI250基于高通的Hexagon神經(jīng)處理單元(NPU)技術(shù)，并針對大型語言模型（LLM）、多模態(tài)模型（LMM）及實時AI推理任務(wù)進行了深度優(yōu)化，可實現(xiàn)快速數(shù)據(jù)中心生成式 AI 推理，預(yù)計分別將于2026年和2027年上市。

高通介紹，AI200 是機架級AI推理解決方案，主打高內(nèi)存帶寬與低總擁有成本（TCO），旨在為大型語言和多模態(tài)模型（LLM、LMM）、推理和其他 AI 工作負載提供較低的TCO和優(yōu)化的性能。

該芯片單卡支持高達768GB的LPDDR內(nèi)存，遠超當(dāng)前市場上主流競品。作為對比，英偉達H100 GPU單卡最大顯存為80GB HBM3，GB300每個GPU配備288GBHBM3e內(nèi)存，不到AI200的一半；AMD MI300X也僅提供192GB HBM3內(nèi)存。這意味著在處理超大規(guī)模模型時，AI200無需頻繁進行數(shù)據(jù)交換或模型切分，顯著提升了推理效率。

另一個值得關(guān)注的數(shù)據(jù)是，相較于HBM，LPDDR在制造成本上帶來的優(yōu)勢。目前來看HBM的生產(chǎn)成本大約是LPDDR的2-3倍，這使得AI200能夠在保持高性能的同時，大幅降低單位算力的成本支出，適合需要長期運行、高吞吐量的云服務(wù)提供商和企業(yè)客戶。

在AI200是對現(xiàn)有市場精準(zhǔn)打擊的同時，高通AI250則是一次顛覆性的技術(shù)創(chuàng)新。

AI250 引入了基于近內(nèi)存計算的創(chuàng)新內(nèi)存架構(gòu)，這一設(shè)計提供超過 10 倍的有效內(nèi)存帶寬和更低的功耗，對于AI推理這類高度依賴數(shù)據(jù)流動的任務(wù)而言，這意味著更低的延遲和更高的能效比。此外，AI250支持分解式AI推理，實現(xiàn)更靈活的資源調(diào)度與利用率優(yōu)化，同時滿足客戶的性能和成本要求。

基于AI200 和 AI250 芯片的機架解決方案均具有直接液體冷卻以提高熱效率、用于縱向擴展的 PCIe、用于橫向擴展的以太網(wǎng)，支持160kW機架級功耗管理，滿足現(xiàn)代數(shù)據(jù)中心對可擴展性與熱管理的嚴(yán)苛要求。此外，二者均支持機密計算，確保敏感AI工作負載在執(zhí)行過程中的數(shù)據(jù)安全。

高通在官方通告中，特別指出兩款產(chǎn)品都支持較低的總體擁有成本（TCO）。TCO指的是在設(shè)備采購、運維等整個生命周期需要投入的成本，已經(jīng)成為客戶決策的關(guān)鍵指標(biāo)之一，直面初創(chuàng)企業(yè)或新興市場等對預(yù)算敏感型客戶群體。

此外，AI數(shù)據(jù)中心產(chǎn)業(yè)對綠色AI和可持續(xù)算力的需求。在TCO中，電力成本占一半左右，已成為云服務(wù)商的支出大項。而高通強調(diào)“每瓦每美元”的性能指標(biāo)，正好直擊產(chǎn)業(yè)痛點。

“借助高通 AI200 和 AI250，我們正在重新定義機架級 AI 推理的可能性。這些創(chuàng)新的新型人工智能基礎(chǔ)設(shè)施解決方案使客戶能夠以前所未有的總體擁有成本部署生成式人工智能，同時保持現(xiàn)代數(shù)據(jù)中心所需的靈活性和安全性”，高通技術(shù)公司邊緣解決方案和數(shù)據(jù)中心技術(shù)規(guī)劃高級副總裁兼總經(jīng)理 Durga Malladi表示。

高通的戰(zhàn)略升級：以AI推理為核心向數(shù)據(jù)中心擴張

長期以來，高通被視為“智能手機芯片之王”，驍龍系列處理器幾乎定義了安卓旗艦手機的標(biāo)準(zhǔn)。然而，隨著智能手機市場趨于飽和，高通開始加速多元化布局，先后進入PC、汽車、工業(yè)等領(lǐng)域，就在今年2月，高通正式推出“躍龍”品牌，面向工業(yè)場景。如今，AI數(shù)據(jù)中心成為其下一個戰(zhàn)略高地。

從高通的通告中可以看到，面向AI數(shù)據(jù)中心，高通已經(jīng)有著清晰的技術(shù)路線圖與商業(yè)化落地計劃。

高通已明確宣布，將每年推進一次數(shù)據(jù)中心AI芯片路線圖更新，持續(xù)迭代性能與能效。AI200計劃于2026年上市，AI250將于2027年量產(chǎn)，形成穩(wěn)定的產(chǎn)品節(jié)奏。

在商業(yè)化進展方面，今年5月，高通宣布與沙特阿拉伯的Humain公司合作，為其新建的區(qū)域性AI數(shù)據(jù)中心提供AI推理芯片，該項目預(yù)計將部署最多可使用200兆瓦電力的系統(tǒng)，相當(dāng)于一座中等城市全年數(shù)據(jù)中心的用電總量，能夠支撐數(shù)十萬臺服務(wù)器的AI運算能力。此次合作成為高通在國家級AI基建項目中獲得大規(guī)模訂單，具有象征意義。

在開發(fā)者生態(tài)方面，為了打破生態(tài)的壁壘，高通在軟件層面也下足功夫。高通表示AI200和AI250配備了完整的高通AI軟件棧，兼容主流AI框架，并支持一鍵式模型部署。開發(fā)者無需重寫代碼即可將已訓(xùn)練好的模型遷移至高通平臺，極大降低了采用門檻專為無摩擦采用和快速創(chuàng)新而設(shè)計。

高通AI芯片的發(fā)布，被視為其正式向英偉達所在的AI數(shù)據(jù)中心領(lǐng)域的統(tǒng)治地位發(fā)起挑戰(zhàn)的標(biāo)志性開端。英偉達憑借其強大的CUDA生態(tài)、領(lǐng)先的GPU架構(gòu)，且在AI訓(xùn)練領(lǐng)域的先發(fā)優(yōu)勢，在數(shù)據(jù)中心市場占據(jù)了超過90%的絕對主導(dǎo)地位，已成為全球主流云服務(wù)商和AI企業(yè)構(gòu)建大模型訓(xùn)練平臺的“標(biāo)配”。

而生成式AI從訓(xùn)練階段大規(guī)模轉(zhuǎn)向部署和推理應(yīng)用，云天勵飛副總裁羅憶預(yù)計，國產(chǎn)大模型推理算力需求將在2026年超越訓(xùn)練需求。因此AI推理芯片正逐漸成為AI領(lǐng)域的關(guān)鍵，這為后來者提供了錯位競爭的戰(zhàn)略窗口，而高通正是抓住了這一關(guān)鍵轉(zhuǎn)折點。

與英偉達以通用GPU為核心、兼顧訓(xùn)練與推理的路線不同，高通選擇了專注AI推理賽道的差異化戰(zhàn)略，并非在英偉達最擅長的訓(xùn)練戰(zhàn)場上正面硬剛，而是精準(zhǔn)切入更具規(guī)模潛力的推理環(huán)節(jié)，基于高通在高吞吐、低延遲等技術(shù)的優(yōu)勢，通過專用架構(gòu)、能效優(yōu)化和成本控制，構(gòu)建起一條競爭路徑。

未來，在AI數(shù)據(jù)中心這片充滿機遇與挑戰(zhàn)的市場中，高通會有哪些表現(xiàn)，AI200與AI250芯片能否在2026年如期量產(chǎn)并順利導(dǎo)入主流企業(yè)中，又能否在軟件生態(tài)上贏得開發(fā)者的廣泛支持，都將成為關(guān)鍵。

聲明：本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人，不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用，如有內(nèi)容侵權(quán)或者其他違規(guī)問題，請聯(lián)系本站處理。舉報投訴