91欧美超碰AV自拍|国产成年人性爱视频免费看|亚洲 日韩 欧美一厂二区入|人人看人人爽人人操aV|丝袜美腿视频一区二区在线看|人人操人人爽人人爱|婷婷五月天超碰|97色色欧美亚州A√|另类A√无码精品一级av|欧美特级日韩特级

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫(xiě)文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

RAG、MCP與智能體:大模型落地的三道關(guān)

工程師高培 ? 來(lái)源:工程師高培 ? 作者:工程師高培 ? 2026-03-19 13:55 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

大模型能力越來(lái)越強(qiáng),但落地沒(méi)那么快。從單次對(duì)話到多步任務(wù),中間隔著系統(tǒng)工程。這篇文章聊三個(gè)繞不開(kāi)的技術(shù)方向:RAG、MCP和智能體。

一、RAG:讓模型學(xué)會(huì)翻資料

大模型的知識(shí)截止于訓(xùn)練時(shí)刻,這是天生局限。RAG的思路很簡(jiǎn)單:用戶提問(wèn)時(shí),先從知識(shí)庫(kù)里檢索相關(guān)內(nèi)容,再讓模型基于這些資料生成答案。

數(shù)據(jù)分片是關(guān)鍵第一步。文檔切太碎,上下文割裂;切太整,檢索不精準(zhǔn)。技術(shù)手冊(cè)按章節(jié)切,問(wèn)答對(duì)按條目切,不同類(lèi)型策略不同。分片后生成向量,存入向量數(shù)據(jù)庫(kù)。

檢索不是終點(diǎn)。召回的片段需要排序篩選。兩階段檢索常見(jiàn):先用向量召回一批,再用重排模型精排。重排能更細(xì)粒度判斷相關(guān)性,但計(jì)算成本高。

指令理解很關(guān)鍵?!霸趺磁洹焙汀芭溴e(cuò)了怎么辦”指向不同文檔。只匹配關(guān)鍵詞容易跑偏,有的系統(tǒng)會(huì)在檢索前加一層意圖識(shí)別。

進(jìn)階方向是GraphRAG——用知識(shí)圖譜組織信息。實(shí)體關(guān)系預(yù)先抽取,檢索時(shí)沿著圖譜走,能回答更復(fù)雜的問(wèn)題。比如“A和B合作過(guò)哪些項(xiàng)目”,文檔片段難拼湊,圖譜能直接列出來(lái)。

二、MCP:讓模型學(xué)會(huì)用工具

大模型不能直接操作外部系統(tǒng),這是硬傷。不能查數(shù)據(jù)庫(kù),不能調(diào)API,不能執(zhí)行代碼。MCP這類(lèi)協(xié)議解決的,就是模型與外部世界交互的問(wèn)題。

MCP定義客戶端-服務(wù)器架構(gòu)。模型作為客戶端,通過(guò)標(biāo)準(zhǔn)協(xié)議調(diào)用各種工具服務(wù)器。工具服務(wù)器封裝數(shù)據(jù)庫(kù)查詢、代碼執(zhí)行、API調(diào)用等能力。模型只需知道“有什么工具、怎么調(diào)用”,實(shí)現(xiàn)由服務(wù)器完成。

工具描述要規(guī)范。每個(gè)工具需清晰的名稱、描述、參數(shù)列表。模型根據(jù)問(wèn)題判斷調(diào)用哪個(gè)、填什么參數(shù),描述不清容易選錯(cuò)。有的團(tuán)隊(duì)會(huì)寫(xiě)few-shot樣例幫助理解。

多步驟任務(wù)要管理。復(fù)雜問(wèn)題常需多次工具調(diào)用,且后面依賴前面?!安槟彻救ツ?duì)I收,再和同行比”,需先查數(shù)據(jù)庫(kù)拿到數(shù)據(jù),再調(diào)分析工具對(duì)比。MCP支持任務(wù)鏈?zhǔn)秸{(diào)用,中間結(jié)果可在上下文傳遞。

安全是底線。工具調(diào)用可能帶來(lái)風(fēng)險(xiǎn)。協(xié)議通常支持沙盒隔離、權(quán)限控制。敏感操作需用戶二次確認(rèn),或限定特定環(huán)境執(zhí)行。

Google新推出的A2A協(xié)議也值得關(guān)注,它關(guān)注多智能體協(xié)作:一個(gè)智能體可把子任務(wù)委派給另一個(gè),任務(wù)狀態(tài)可同步,為構(gòu)建復(fù)雜多智能體系統(tǒng)提供了標(biāo)準(zhǔn)化基礎(chǔ)。

三、智能體:從回答問(wèn)題到完成任務(wù)

RAG讓模型能查資料,MCP讓模型能調(diào)工具,兩者結(jié)合,就能做出真正干活的智能體。

智能體與問(wèn)答系統(tǒng)的區(qū)別在于:它有狀態(tài),能規(guī)劃,能執(zhí)行多步驟任務(wù)。“幫我訂下周去上海的機(jī)票”需要查時(shí)間、比價(jià)格、填信息、下單支付。每一步可能調(diào)用不同工具,過(guò)程中可能要追問(wèn)用戶。

任務(wù)規(guī)劃是核心。模型需把大目標(biāo)拆解成可執(zhí)行子任務(wù)。有的用CoT提示工程讓模型一步步想,有的用專(zhuān)門(mén)規(guī)劃器把拆解和調(diào)用分離。規(guī)劃質(zhì)量直接影響成功率。

記憶管理要分層。多輪對(duì)話里,用戶可能中途修改需求,或同一個(gè)智能體處理多個(gè)任務(wù)。短期記憶緩存最近幾輪,長(zhǎng)期記憶存儲(chǔ)用戶偏好。MemGPT等框架把記憶做成層級(jí)結(jié)構(gòu),重要信息持久化,臨時(shí)信息隨對(duì)話過(guò)期。

多模態(tài)支持很實(shí)用。用戶可能發(fā)截圖問(wèn)“這按鈕為什么點(diǎn)不了”,或語(yǔ)音描述故障。多模態(tài)智能體需對(duì)齊文本、圖像、音頻信息,跨模態(tài)理解后統(tǒng)一決策。模態(tài)對(duì)齊和融合是底層關(guān)鍵技術(shù)。

群體智能是更高階形態(tài)。單個(gè)智能體能力有限,復(fù)雜任務(wù)需多角色協(xié)作。AutoGen等框架支持多智能體協(xié)同:一個(gè)負(fù)責(zé)計(jì)劃,一個(gè)執(zhí)行,一個(gè)質(zhì)檢,互相討論修正。多智能體通信需高效消息傳遞和任務(wù)狀態(tài)同步,集中訓(xùn)練、分散執(zhí)行是常見(jiàn)范式。

四、從原型到產(chǎn)品還有多遠(yuǎn)

RAG、MCP、智能體,每項(xiàng)單看都不陌生,但整合到產(chǎn)品里會(huì)碰到一連串工程問(wèn)題。

速度。多步推理意味著多次模型調(diào)用,延遲累加。緩存策略、負(fù)載均衡、推理加速,每一層都得優(yōu)化。

穩(wěn)定性。模型生成不穩(wěn)定,同樣輸入可能不同輸出。用在自動(dòng)化流程需加校驗(yàn)和兜底。置信度低于閾值時(shí)觸發(fā)人工接管,關(guān)鍵操作后讓用戶確認(rèn)。

成本。模型調(diào)用次數(shù)多,API開(kāi)銷(xiāo)不小。蒸餾模型、本地部署、小型模型處理常規(guī)任務(wù)、復(fù)雜問(wèn)題交給大模型,都是控制成本的手段。

評(píng)估。怎么判斷智能體做得好不好?不能只看單次回答質(zhì)量,要看任務(wù)完成率、多輪對(duì)話成功率、資源消耗。領(lǐng)域不同,指標(biāo)需定制。

大模型的能力邊界還在擴(kuò)展,但技術(shù)關(guān)注點(diǎn)正從“模型多強(qiáng)”轉(zhuǎn)向“系統(tǒng)多穩(wěn)”。RAG讓知識(shí)庫(kù)活起來(lái),MCP讓工具鏈打通,智能體讓自動(dòng)化升級(jí)。這三塊拼圖拼起來(lái),才可能做出真正落地的應(yīng)用。

工程師高培覺(jué)得理論是骨架,落地才是血肉。

審核編輯 黃宇

聲明:本文內(nèi)容及配圖由入駐作者撰寫(xiě)或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問(wèn)題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • 智能體
    +關(guān)注

    關(guān)注

    1

    文章

    506

    瀏覽量

    11616
  • MCP
    MCP
    +關(guān)注

    關(guān)注

    0

    文章

    292

    瀏覽量

    15037
  • 大模型
    +關(guān)注

    關(guān)注

    2

    文章

    3684

    瀏覽量

    5212
收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評(píng)論

    相關(guān)推薦
    熱點(diǎn)推薦

    RAG(檢索增強(qiáng)生成)原理與實(shí)踐

    持續(xù)迭代 :基于用戶反饋和評(píng)估結(jié)果不斷改進(jìn) 選擇合適的工具棧 :根據(jù)實(shí)際需求選擇Embedding模型、向量數(shù)據(jù)庫(kù)和LLM RAG技術(shù)正在快速發(fā)展,掌握其原理與實(shí)踐,將幫助你構(gòu)建更智能、更可靠的AI應(yīng)用。
    發(fā)表于 02-11 12:46

    鴻蒙智能上/下架、升級(jí)流程介紹

    編輯后再次提交上架申請(qǐng)。 上架前注意事項(xiàng): 受隱私風(fēng)險(xiǎn)影響,當(dāng)前暫不支持上架包含私有云插件及私有MCP插件的個(gè)人智能。僅支持頁(yè)面調(diào)試能力。 智能
    發(fā)表于 02-10 10:38

    開(kāi)發(fā)智能配置-內(nèi)容合規(guī)

    智能上架前,需完成“人工智能生成合成內(nèi)容標(biāo)識(shí)”和“大模型備案信息”填寫(xiě) ,以供平臺(tái)審核;可在智能
    發(fā)表于 02-07 11:44

    使用NVIDIA Nemotron模型構(gòu)建語(yǔ)音驅(qū)動(dòng)RAG智能

    構(gòu)建智能不僅僅是“調(diào)用 API”,而是需要將檢索、語(yǔ)音、安全和推理組件整合在一起,使其像一個(gè)統(tǒng)一并互相協(xié)同的系統(tǒng)一樣運(yùn)行。每一層都有自己的接口、延遲限制和集成挑戰(zhàn),一旦跨過(guò)簡(jiǎn)單的原型就會(huì)開(kāi)始感受到這些挑戰(zhàn)。
    的頭像 發(fā)表于 01-14 09:28 ?501次閱讀
    使用NVIDIA Nemotron<b class='flag-5'>模型</b>構(gòu)建語(yǔ)音驅(qū)動(dòng)<b class='flag-5'>RAG</b><b class='flag-5'>智能</b><b class='flag-5'>體</b>

    端側(cè)大模型上車(chē):從“語(yǔ)音助手”到“車(chē)內(nèi) AI 智能”的躍遷革命

    2025年,智能汽車(chē)的座艙不再只是“語(yǔ)音助手”的舞臺(tái),而是一個(gè)搭載生成式AI和大語(yǔ)言模型(LLM)的智能。從云端示范到車(chē)內(nèi)落地,這一跨越不
    的頭像 發(fā)表于 01-13 09:10 ?518次閱讀

    智能設(shè)計(jì)模式和智能框架,你會(huì)了么?

    ,DeepResearch種模式,以實(shí)現(xiàn)靈活的任務(wù)執(zhí)行 。 DataJuicer 智能是一個(gè)數(shù)據(jù)專(zhuān)員,由 數(shù)據(jù)處理智能,代碼開(kāi)發(fā)
    的頭像 發(fā)表于 11-12 16:30 ?1262次閱讀
    多<b class='flag-5'>智能</b><b class='flag-5'>體</b>設(shè)計(jì)模式和<b class='flag-5'>智能</b><b class='flag-5'>體</b>框架,你會(huì)了么?

    RAG實(shí)踐:一文掌握大模型RAG過(guò)程

    RAG(Retrieval-Augmented Generation,檢索增強(qiáng)生成), 一種AI框架,將傳統(tǒng)的信息檢索系統(tǒng)(例如數(shù)據(jù)庫(kù))的優(yōu)勢(shì)與生成式大語(yǔ)言模型(LLM)的功能結(jié)合在一起。不再
    的頭像 發(fā)表于 10-27 18:23 ?1611次閱讀
    <b class='flag-5'>RAG</b>實(shí)踐:一文掌握大<b class='flag-5'>模型</b><b class='flag-5'>RAG</b>過(guò)程

    圖解AI核心技術(shù):大模型、RAG智能MCP

    和使用AI。 大模型 Transformer vs. Mixture of Experts 混合專(zhuān)家 (MoE) 是一種流行的架構(gòu),它使用不同的“專(zhuān)家”來(lái)改進(jìn) Transformer 模型。 下圖解釋了
    的頭像 發(fā)表于 10-21 09:48 ?799次閱讀
    圖解AI核心技術(shù):大<b class='flag-5'>模型</b>、<b class='flag-5'>RAG</b>、<b class='flag-5'>智能</b><b class='flag-5'>體</b>、<b class='flag-5'>MCP</b>

    曠視借助大模型智能推動(dòng)算法落地

    當(dāng)下,AI技術(shù)繁榮無(wú)比,但無(wú)數(shù)企業(yè)卻陷入“叫好不叫座”的困境:算法模型很先進(jìn),但一到真實(shí)的行業(yè)場(chǎng)景中就“水土不服”。問(wèn)題究竟出在哪?大模型智能的興起,又為我們提供了怎樣的新解題思路
    的頭像 發(fā)表于 10-11 14:04 ?629次閱讀

    【內(nèi)測(cè)活動(dòng)同步開(kāi)啟】這么?。窟@么強(qiáng)?新一代大模型MCP開(kāi)發(fā)板來(lái)啦!

    ,將碰撞出怎樣的智能火花?關(guān)注并私信獲得內(nèi)測(cè)資格! 視頻: 「Arcs-Mini」聆思打造全新大模型MCP開(kāi)發(fā)板小巧機(jī)身,蘊(yùn)含強(qiáng)大能量 實(shí)現(xiàn)真人般自然對(duì)話體驗(yàn),會(huì)感知、會(huì)表達(dá)、會(huì)表情、懂共情,獨(dú)家人聲濾
    發(fā)表于 09-25 11:47

    開(kāi)普云「開(kāi)悟智核」:極致性價(jià)比的智能機(jī),破局大模型應(yīng)用難題

    當(dāng)下,AI一機(jī)憑借開(kāi)箱即用、數(shù)據(jù)可控等優(yōu)勢(shì),成為行業(yè)大模型落地的重要載體之一。然而實(shí)際應(yīng)用時(shí),用戶卻面臨諸多問(wèn)題:算力成本與性能難以平衡;非滿血版模型存在“幻覺(jué)”、精度低等問(wèn)題;由于
    的頭像 發(fā)表于 06-09 10:34 ?1168次閱讀
    開(kāi)普云「開(kāi)悟智核」:極致性價(jià)比的<b class='flag-5'>智能</b><b class='flag-5'>體</b>一<b class='flag-5'>體</b>機(jī),破局大<b class='flag-5'>模型</b>應(yīng)用難題

    AI耳機(jī)邁入智能時(shí)代,2037年65%應(yīng)用將為智能驅(qū)動(dòng)

    近期發(fā)布的TWS耳機(jī)。隨著智能的到來(lái),AI耳機(jī)行業(yè)進(jìn)入新的發(fā)展階段。 ? 基礎(chǔ)NLP 大模型能力差距縮小,2037 年65% 應(yīng)用將為智能
    的頭像 發(fā)表于 05-24 01:15 ?7239次閱讀
    AI耳機(jī)邁入<b class='flag-5'>智能</b><b class='flag-5'>體</b>時(shí)代,2037年65%應(yīng)用將為<b class='flag-5'>智能</b><b class='flag-5'>體</b>驅(qū)動(dòng)

    在Cherry Studio中快速使用markitdown MCP Server?

    作者:算力魔方創(chuàng)始人/英特爾創(chuàng)新大使劉力 Cherry Studio是一款跨平臺(tái)的集成了AI大模型和知識(shí)庫(kù)、網(wǎng)絡(luò)搜索、MCP服務(wù)器等相關(guān)工具桌面客戶端應(yīng)用程序,方便用戶配置出自己的AI智能
    的頭像 發(fā)表于 05-15 10:39 ?1557次閱讀
    在Cherry Studio中快速使用markitdown <b class='flag-5'>MCP</b> Server?

    如何用FastMCP快速開(kāi)發(fā)自己的MCP Server?

    的感受到了基于AI大模型MCP可以非常方便的構(gòu)建自己的AI智能工作流。在此基礎(chǔ)上,不少讀者咨詢,如何將自己已有的工具或函數(shù),制作成MCP
    的頭像 發(fā)表于 05-07 16:07 ?2892次閱讀
    如何用FastMCP快速開(kāi)發(fā)自己的<b class='flag-5'>MCP</b> Server?

    學(xué)習(xí)智能開(kāi)發(fā)

    智能是大模型的應(yīng)用落地,正在學(xué)習(xí)中,這本書(shū)太及時(shí)了,非常想看看。
    發(fā)表于 03-27 15:48