91欧美超碰AV自拍|国产成年人性爱视频免费看|亚洲 日韩 欧美一厂二区入|人人看人人爽人人操aV|丝袜美腿视频一区二区在线看|人人操人人爽人人爱|婷婷五月天超碰|97色色欧美亚州A√|另类A√无码精品一级av|欧美特级日韩特级

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

在AI基礎(chǔ)設(shè)施中部署大語(yǔ)言模型的三大舉措

穎脈Imgtec ? 2026-02-09 16:28 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

文:Gartner研究副總裁周玲


中國(guó)企業(yè)機(jī)構(gòu)已逐步在生產(chǎn)環(huán)境中運(yùn)行或者計(jì)劃運(yùn)行大語(yǔ)言模型,但在AI基礎(chǔ)設(shè)施的生產(chǎn)部署與高效運(yùn)營(yíng)方面仍面臨諸多挑戰(zhàn)。目前,中國(guó)正加速提升其生成式AI能力,覆蓋大語(yǔ)言模型、軟件開發(fā)、生態(tài)集成與硬件革新。隨著DeepSeek、通義千問(wèn)(Qwen)等高性價(jià)比模型日益普及和本地部署的深入推進(jìn),越來(lái)越多的中國(guó)企業(yè)將重心放在數(shù)據(jù)隱私、數(shù)據(jù)主權(quán)、安全性、可擴(kuò)展性和低延遲等核心需求上。2025年Gartner首席信息官(CIO)和技術(shù)高管調(diào)研顯示,2025年中國(guó)企業(yè)計(jì)劃大幅增加在生成式AI和AI領(lǐng)域的技術(shù)投資,其平均增幅分別達(dá)到40.3%和33.3%(見圖1),這一數(shù)據(jù)表明,相關(guān)技術(shù)將在短期內(nèi)得到廣泛采用。

3e6abd4c-0591-11f1-96ea-92fbcf53809c.png

Gartner預(yù)測(cè),到2028年,中國(guó)70%的大型企業(yè)將為大語(yǔ)言模型在AI基礎(chǔ)設(shè)施上的部署建立完善的治理框架,而2025年這一比例不足10%。

然而,要成功實(shí)現(xiàn)大語(yǔ)言模型在AI基礎(chǔ)設(shè)施中的生產(chǎn)部署并非易事,需要制定復(fù)雜的技術(shù)、運(yùn)維和治理戰(zhàn)略,以確保模型達(dá)到性能指標(biāo)(例如GPU算力利用率),同時(shí)保障數(shù)據(jù)安全與合規(guī)。

中國(guó)企業(yè)與全球企業(yè)的一個(gè)關(guān)鍵區(qū)別在于,其更傾向于在本地AI基礎(chǔ)設(shè)施環(huán)境中部署大語(yǔ)言模型,這對(duì)I&O團(tuán)隊(duì)提出了更高要求,需要他們對(duì)重要AI基礎(chǔ)設(shè)施技術(shù)棧有更深入的理解。AI基礎(chǔ)設(shè)施是指AI應(yīng)用構(gòu)建、測(cè)試、訓(xùn)練與部署所需的最新、最先進(jìn)的硬軟件技術(shù)棧。

為了在新的AI基礎(chǔ)設(shè)施上成功實(shí)現(xiàn)大語(yǔ)言模型的生產(chǎn)部署,企業(yè)應(yīng)從以下三個(gè)方面著手:構(gòu)建全面的生產(chǎn)發(fā)布策略;制定健全的治理框架;并加強(qiáng)與法律、安全、AI、數(shù)據(jù)團(tuán)隊(duì)及生態(tài)伙伴的緊密協(xié)作。這些舉措為大語(yǔ)言模型在生產(chǎn)環(huán)境中的高效運(yùn)行提供了堅(jiān)實(shí)的保障。


構(gòu)建全面的部署戰(zhàn)略

隨著企業(yè)開始在AI基礎(chǔ)設(shè)施上部署大語(yǔ)言模型,I&O領(lǐng)導(dǎo)者所面臨的壓力日益增大,需要幫助AI開發(fā)人員和工程師在全企業(yè)范圍內(nèi)以更快的速度、更大的規(guī)模來(lái)推進(jìn)AI項(xiàng)目的開發(fā)和部署。與此同時(shí),針對(duì)不同用戶和應(yīng)用場(chǎng)景不斷涌現(xiàn)的各種AI工具和服務(wù),顯著增加了評(píng)估與選擇的難度和復(fù)雜性。此外,傳統(tǒng)的生產(chǎn)發(fā)布策略與流程已無(wú)法有效支持大語(yǔ)言模型在AI基礎(chǔ)設(shè)施中的生產(chǎn)部署需求。因此,I&O領(lǐng)導(dǎo)者亟需制定完善的生產(chǎn)發(fā)布戰(zhàn)略,以保障部署工作的順利進(jìn)行。

然而,要為大語(yǔ)言模型在AI基礎(chǔ)設(shè)施上的部署構(gòu)建一套穩(wěn)健的戰(zhàn)略,就需要從整體視角出發(fā),包括適配AI基礎(chǔ)設(shè)施環(huán)境、為特定場(chǎng)景設(shè)計(jì)架構(gòu)、實(shí)施技術(shù)優(yōu)化以及確保符合監(jiān)管框架要求。

中國(guó)的I&O領(lǐng)導(dǎo)者應(yīng):

使部署策略與企業(yè)數(shù)字化轉(zhuǎn)型戰(zhàn)略保持一致

按照使用場(chǎng)景構(gòu)建多層次部署架構(gòu)以優(yōu)化性能

優(yōu)化模型與推理以提升效率

使用云原生技術(shù)實(shí)現(xiàn)靈活調(diào)度

加強(qiáng)合規(guī)并強(qiáng)化安全管理

建立全鏈路監(jiān)控與成本控制機(jī)制


制定穩(wěn)健的部署治理流程

大語(yǔ)言模型已經(jīng)從研究原型轉(zhuǎn)變?yōu)槎喾N任務(wù)的關(guān)鍵核心組件,包括客戶支持AI智能體、法律文檔摘要、代碼生成或測(cè)試工具、企業(yè)級(jí)代理型AI用例以及多模態(tài)應(yīng)用等領(lǐng)域。然而,大語(yǔ)言模型在AI基礎(chǔ)設(shè)施中的生產(chǎn)部署需要解決如下幾個(gè)固有挑戰(zhàn):

資源密集

非確定性行為與提示敏感

延遲與吞吐限制

安全與隱私

因此,為了成功將大語(yǔ)言模型部署到AI基礎(chǔ)設(shè)施的生產(chǎn)環(huán)境中,中國(guó)的I&O部門必須建立一套穩(wěn)健的治理流程,采取切實(shí)可行的步驟促進(jìn)資源管理、持續(xù)監(jiān)控以及敏捷更新。比如:

提前規(guī)劃并進(jìn)行試點(diǎn)

確定產(chǎn)品部署位置

建立高效的資源管理

在大語(yǔ)言模型生產(chǎn)發(fā)布流程中嵌入安全治理與提示治理

管理版本并執(zhí)行A/B測(cè)試

采用持續(xù)集成/持續(xù)交付流程

實(shí)施生產(chǎn)監(jiān)控


促進(jìn)關(guān)鍵利益相關(guān)方之間的緊密協(xié)作

部署大語(yǔ)言模型十分復(fù)雜,要求業(yè)務(wù)、法務(wù)、安全以及AI與數(shù)據(jù)團(tuán)隊(duì)以協(xié)同一致的方式共同工作。過(guò)去各自獨(dú)立的部門如今必須從大語(yǔ)言模型項(xiàng)目的啟動(dòng)階段就開展合作,以確保技術(shù)開發(fā)能夠反映法律和安全方面的考量。建立跨職能的AI治理委員會(huì)至關(guān)重要,成員應(yīng)包括法務(wù)、安全、數(shù)據(jù)工程與數(shù)據(jù)科學(xué)、產(chǎn)品管理、軟件開發(fā)以及高管層的代表。

文章來(lái)源:Gartner

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問(wèn)題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • AI
    AI
    +關(guān)注

    關(guān)注

    91

    文章

    39689

    瀏覽量

    301294
  • 人工智能
    +關(guān)注

    關(guān)注

    1817

    文章

    50088

    瀏覽量

    265191
  • 語(yǔ)言模型
    +關(guān)注

    關(guān)注

    0

    文章

    571

    瀏覽量

    11310
收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評(píng)論

    相關(guān)推薦
    熱點(diǎn)推薦

    華為推動(dòng)電信云加速向AI基礎(chǔ)設(shè)施演進(jìn)

    隨著AI技術(shù)持續(xù)突破,人工智能正成為全球產(chǎn)業(yè)升級(jí)的核心驅(qū)動(dòng)力。從通用大模型到行業(yè)智能應(yīng)用,AI已成為新一輪科技變革和產(chǎn)業(yè)升級(jí)的核心驅(qū)動(dòng)力。業(yè)界正加快推進(jìn)體系化探索,圍繞AI
    的頭像 發(fā)表于 02-27 09:43 ?163次閱讀

    模型 ai coding 比較

    方裁判更客觀 樣本量說(shuō)明:當(dāng)前樣本量30題,統(tǒng)計(jì)意義有限,建議后續(xù)擴(kuò)大到100+題 數(shù)據(jù)污染風(fēng)險(xiǎn):評(píng)估經(jīng)典題目被模型訓(xùn)練集見過(guò)的可能性 6. 環(huán)境一致性維度 所有模型完全相同的環(huán)
    發(fā)表于 02-19 13:43

    AI端側(cè)部署開發(fā)(SC171開發(fā)套件V3)2026版

    AI端側(cè)部署開發(fā)(SC171開發(fā)套件V3)2026版 序列 課程名稱 視頻課程時(shí)長(zhǎng) 視頻課程鏈接 課件鏈接 工程源碼 1 Fibo AI Stack模型轉(zhuǎn)化指南 27分19秒 http
    發(fā)表于 01-15 10:31

    亞馬遜云科技推出全新的Amazon AI Factories 將客戶現(xiàn)有基礎(chǔ)設(shè)施轉(zhuǎn)化為高性能AI環(huán)境

    亞馬遜云科技2025 re:Invent全球大會(huì)上,宣布推出全新的Amazon AI Factories,助力企業(yè)將現(xiàn)有基礎(chǔ)設(shè)施轉(zhuǎn)化為高性能的AI環(huán)境。
    的頭像 發(fā)表于 12-13 13:44 ?716次閱讀

    使用瑞薩RUHMI工具實(shí)現(xiàn)AI模型部署過(guò)程

    AI無(wú)處不在。你部署AI,你的競(jìng)爭(zhēng)對(duì)手也部署AI
    的頭像 發(fā)表于 10-17 10:00 ?2759次閱讀
    使用瑞薩RUHMI工具實(shí)現(xiàn)<b class='flag-5'>AI</b><b class='flag-5'>模型</b><b class='flag-5'>部署</b>過(guò)程

    GlobalData與華為探討AI對(duì)網(wǎng)絡(luò)基礎(chǔ)設(shè)施的機(jī)遇與挑戰(zhàn)

    GlobalData 研究總監(jiān)Emir Halilovic 與華為數(shù)據(jù)通信產(chǎn)品線NCE數(shù)據(jù)通信領(lǐng)域總裁王輝共同探討了人工智能(AI)對(duì)網(wǎng)絡(luò)基礎(chǔ)設(shè)施帶來(lái)的機(jī)遇(高性能網(wǎng)絡(luò)需求、AI增強(qiáng)的網(wǎng)絡(luò)能力
    的頭像 發(fā)表于 10-14 14:24 ?591次閱讀

    科士達(dá)全棧解決方案亮相2025 ODCC,驅(qū)動(dòng)綠色AI智算基礎(chǔ)設(shè)施革新

    2025年開放數(shù)據(jù)中心大會(huì)(ODCC)于9月9日-11日北京國(guó)際會(huì)議中心盛大啟幕。本屆峰會(huì)以“擁抱AI變革,點(diǎn)燃算網(wǎng)引擎”為主題,聚焦AI爆發(fā)背景下算力基礎(chǔ)設(shè)施面臨的能效、
    的頭像 發(fā)表于 09-17 15:40 ?1234次閱讀
    科士達(dá)全棧解決方案亮相2025 ODCC,驅(qū)動(dòng)綠色<b class='flag-5'>AI</b>智算<b class='flag-5'>基礎(chǔ)設(shè)施</b>革新

    ai_cube訓(xùn)練模型最后部署失敗是什么原因?

    ai_cube訓(xùn)練模型最后部署失敗是什么原因?文件保存路徑里也沒(méi)有中文 查看AICube/AI_Cube.log,看看報(bào)什么錯(cuò)?
    發(fā)表于 07-30 08:15

    摩爾線程“AI工廠”:以系統(tǒng)級(jí)創(chuàng)新定義新一代AI基礎(chǔ)設(shè)施

    演講中表示,為應(yīng)對(duì)生成式AI爆發(fā)式增長(zhǎng)下的大模型訓(xùn)練效率瓶頸,摩爾線程將通過(guò)系統(tǒng)級(jí)工程創(chuàng)新,構(gòu)建新一代AI訓(xùn)練基礎(chǔ)設(shè)施,致力于為AGI時(shí)代打造生產(chǎn)先進(jìn)
    發(fā)表于 07-28 10:34 ?2794次閱讀
    摩爾線程“<b class='flag-5'>AI</b>工廠”:以系統(tǒng)級(jí)創(chuàng)新定義新一代<b class='flag-5'>AI</b><b class='flag-5'>基礎(chǔ)設(shè)施</b>

    Arm如何助力AI基礎(chǔ)設(shè)施變革

    眾所周知,人工智能 (AI) 有望革新人類活動(dòng)的方方面面。然而,要充分釋放這一潛力,就必須面對(duì)一個(gè)基本事實(shí):支撐傳統(tǒng)計(jì)算的基礎(chǔ)設(shè)施已無(wú)法滿足未來(lái) AI 發(fā)展的需求。
    的頭像 發(fā)表于 07-03 14:29 ?960次閱讀

    歐洲聯(lián)手NVIDIA打造AI基礎(chǔ)設(shè)施

    NVIDIA 于近日宣布,其正在攜手歐洲各國(guó)、科技和行業(yè)領(lǐng)導(dǎo)者,共同建造 NVIDIA Blackwell AI 基礎(chǔ)設(shè)施,以強(qiáng)化數(shù)字主權(quán)、支撐經(jīng)濟(jì)增長(zhǎng),并推動(dòng)歐洲大陸成為 AI 工業(yè)革命的領(lǐng)導(dǎo)者。
    的頭像 發(fā)表于 06-16 14:25 ?1422次閱讀

    企業(yè)部署AI模型怎么做

    當(dāng)下,AI模型已成為驅(qū)動(dòng)決策自動(dòng)化、服務(wù)智能化與產(chǎn)品創(chuàng)新的核心引擎。然而,企業(yè)面對(duì)動(dòng)輒數(shù)百億參數(shù)的大模型部署時(shí),常陷入算力不足、響應(yīng)延遲高、成本失控等困境。如何突破瓶頸,實(shí)現(xiàn)高效、穩(wěn)
    的頭像 發(fā)表于 06-04 09:26 ?883次閱讀

    首創(chuàng)開源架構(gòu),天璣AI開發(fā)套件讓端側(cè)AI模型接入得心應(yīng)手

    模型全鏈路分析功能,針對(duì)AI應(yīng)用開發(fā)的大痛點(diǎn)逐個(gè)擊破。 當(dāng)前AI應(yīng)用開發(fā)者使用開發(fā)工具時(shí)會(huì)面臨一個(gè)很頭疼的問(wèn)題,種類多、功能不聚合、過(guò)
    發(fā)表于 04-13 19:52

    PoE交換機(jī)如何助力智慧城市基礎(chǔ)設(shè)施建設(shè)?

    簡(jiǎn)化部署流程,降低基礎(chǔ)設(shè)施成本。借助PoE交換機(jī),城市規(guī)劃者和網(wǎng)絡(luò)管理員可以高效位置部署設(shè)備,而無(wú)需受到電源插座可用性的限制。 PoE 交換機(jī)
    發(fā)表于 03-25 10:20

    英偉達(dá)與xAI簽AI基建協(xié)議 加入全球人工智能基礎(chǔ)設(shè)施投資合作伙伴聯(lián)盟

    共同發(fā)起。他們計(jì)劃建立300億美元的私募股權(quán)資本,并期望能夠撬動(dòng)超1000億美元的投資;以共同建設(shè)數(shù)據(jù)中心和其他AI基礎(chǔ)設(shè)施。? 美東時(shí)間周,微軟和貝萊德宣布了一項(xiàng)重要合作事項(xiàng);英
    的頭像 發(fā)表于 03-20 13:58 ?1150次閱讀