91欧美超碰AV自拍|国产成年人性爱视频免费看|亚洲 日韩 欧美一厂二区入|人人看人人爽人人操aV|丝袜美腿视频一区二区在线看|人人操人人爽人人爱|婷婷五月天超碰|97色色欧美亚州A√|另类A√无码精品一级av|欧美特级日韩特级

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

AI智能體終結(jié)運(yùn)維"狼來了"

jf_73420541 ? 來源:jf_73420541 ? 作者:jf_73420541 ? 2025-06-09 10:12 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

序言 “狼來了”

"叮咚!CPU使用率超過90%!"

"叮咚!內(nèi)存占用達(dá)到80%!"

"叮咚!連接池資源空閑數(shù)低于5%!"

凌晨3點(diǎn),我們的老演員,運(yùn)維工程師小李,再次被釘釘機(jī)器人中監(jiān)控的Prometheus的告警吵醒,他盯著手機(jī)屏幕,眼神呆滯,本著“小心駛得萬年船,不可讓一個(gè)故障漏網(wǎng)”的原則,他還是艱難地對(duì)抗了睡意,把所有系統(tǒng)健康指標(biāo)進(jìn)行逐一排查,如期所料,又是一起誤報(bào)。

“悠悠蒼天,何薄于我?這玩意監(jiān)控了個(gè)寂寞呀?!?/p>


告警對(duì)于廣大運(yùn)維人員來說,真的是又愛又恨,不用長時(shí)間監(jiān)控系統(tǒng)有異常之后通知運(yùn)維人員,極大的節(jié)省了時(shí)間,但隨著設(shè)備規(guī)模的大量增加,原本較少誤報(bào)突然呈現(xiàn)了爆炸式的增長,從而使得“狼來了”式的告警逐漸降低了運(yùn)維人員的警惕閾值,從而使得正真的故障狼來了之時(shí),運(yùn)維人員可能還蒙在鼓里,毫無反應(yīng)。


前章 “AI智能體”

AI時(shí)代,是否有更好的解決方案?熱烈歡迎本場的主角“AI智能體”上線。

AI智能體,通常是指能夠感知環(huán)境、自主決策并執(zhí)行動(dòng)作以實(shí)現(xiàn)特定目標(biāo)的一類人工智能系統(tǒng)。該系統(tǒng)結(jié)合了感知、推理、學(xué)習(xí)和行動(dòng)能力,可以獨(dú)立或在人工協(xié)同指導(dǎo)下完成任務(wù)。




那么如何通過構(gòu)建AI智能體來處理Prometheus的告警呢?基本可以遵循如下的功能模塊來處置。

wKgZO2hGQuaAfpNjAADkWkughGQ187.png

▍一、感知模塊

負(fù)責(zé)接收和處理來自環(huán)境的各類信息,為后續(xù)決策提供所需的數(shù)據(jù)支持。該部分的準(zhǔn)確性和敏感度會(huì)直接影響到后續(xù)的處理。常見的感知模塊一般可以使用如下方式:

文本感知:NLP模型(BERT/GPT)

圖像感知:CV模型(YOLO/ResNet)

語音感知:ASR系統(tǒng)


▍二、認(rèn)知引擎

負(fù)責(zé)記錄相關(guān)故障處置的上下文信息及對(duì)應(yīng)處置經(jīng)驗(yàn)。按照信息存活時(shí)間及相關(guān)信息的固化特征可以分為:

短期記憶:對(duì)話上下文管理(LSTM/Transformer)

長期記憶:一般使用知識(shí)圖譜、向量數(shù)據(jù)庫

在構(gòu)建對(duì)應(yīng)的認(rèn)知記憶過程需要遵循嚴(yán)格的標(biāo)準(zhǔn),比如在AI智能體在處理Prometheus告警時(shí),需要考慮如下的因素:

歷史性:異常指標(biāo)是否在相同周期內(nèi)出現(xiàn)

全局性:異常指標(biāo)在集群架構(gòu)下影響力

價(jià)值性:何種嚴(yán)重程度需要提示為告警,把小李從床上拉起來

基礎(chǔ)信息:持續(xù)時(shí)間、嚴(yán)重程度

關(guān)聯(lián)關(guān)系:服務(wù)組來源信息


同時(shí)對(duì)于告警的處置結(jié)果執(zhí)行方式也分為三個(gè)星級(jí):

一星告警:"嗯。"(記錄日志完事)

二星告警:"嗯?"(發(fā)個(gè)Slack消息)

三星告警:"??!"(打電話+發(fā)短信+在辦公室拉防空警報(bào))


▍三、決策中心

該模塊通過綜合考慮各種因素,運(yùn)用邏輯推理和概率統(tǒng)計(jì)等方法,做出最優(yōu)決策。在大模型逐漸成熟的當(dāng)下,該部分主要由各大模型來扮演,如DeepSeek、GPT等,相關(guān)介紹材料很多,在此不再贅述。


▍四、執(zhí)行模塊

依據(jù)決策中心提供的處理意見完成對(duì)應(yīng)處理工作,設(shè)計(jì)的核心是完成與相關(guān)業(yè)務(wù)系統(tǒng)的交互與聯(lián)動(dòng),通??梢酝ㄟ^如下方式完成:

API調(diào)用:OpenAPI規(guī)范封裝

RPA操作:Playwright/Airflow集成

執(zhí)行模塊是最終呈現(xiàn)處置的關(guān)鍵部分,最終來衡量AI智能體在過程中非人工介入程度,與工具的對(duì)接的豐富度及耦合度決定了執(zhí)行的準(zhǔn)確性。


▍五、反饋系統(tǒng)

實(shí)現(xiàn)系統(tǒng)的持續(xù)自我優(yōu)化,通過計(jì)算關(guān)鍵指標(biāo)(如任務(wù)完成率、耗時(shí))來進(jìn)行效果評(píng)估。常見的模型更新:

在線學(xué)習(xí):Bandit算法實(shí)時(shí)調(diào)整策略

離線訓(xùn)練:每周全量數(shù)據(jù)retraining


終章 “不看廣告,看療效”

▍第一回合:CPU使用率告警

Prometheus:"報(bào)!CPU沖到95%了!"

AI:"淡定,這是每日?qǐng)?bào)表生成時(shí)間,你家CPU在996呢"

結(jié)果:標(biāo)記為"預(yù)期波動(dòng)",Slack發(fā)個(gè)已處理消息


▍第二回合:磁盤空間不足

Prometheus:"急急急!/var只剩5%了!"

AI:"(查看歷史記錄)發(fā)現(xiàn)這個(gè)分區(qū)每周三都會(huì)這樣...等等,日志輪轉(zhuǎn)腳本又睡懶覺了?"

結(jié)果:自動(dòng)觸發(fā)日志清理腳本,并在Jira創(chuàng)建工單:"日志輪轉(zhuǎn)腳本又雙叒叕偷懶了"


▍第三回合:數(shù)據(jù)庫連接池耗盡

Prometheus:"藥丸!連接池100%了!"

AI:"(0.1秒內(nèi)掃描全鏈路)前端流量激增→促銷活動(dòng)忘了限流→這不是故障,這是KPI在發(fā)光??!"

結(jié)果:自動(dòng)擴(kuò)容數(shù)據(jù)庫實(shí)例+@市場部:"親,下次搞活動(dòng)記得提前說哦~"


寫在最后:AI不是終點(diǎn),而是起點(diǎn)

記?。?/p>

再智能的AI也干不過寫bug的程序員

再精準(zhǔn)的過濾也擋不住老板的突發(fā)奇想

最好的監(jiān)控系統(tǒng)也永遠(yuǎn)有一個(gè)會(huì)罵“這什么破AI”的幕后運(yùn)維小李


在完成該文章的過程中,消耗了作者4杯咖啡和12次對(duì)Prometheus的告警的親切問候。

審核編輯 黃宇

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • cpu
    cpu
    +關(guān)注

    關(guān)注

    68

    文章

    11281

    瀏覽量

    225077
  • AI
    AI
    +關(guān)注

    關(guān)注

    91

    文章

    39820

    瀏覽量

    301485
  • 智能體
    +關(guān)注

    關(guān)注

    1

    文章

    477

    瀏覽量

    11608
收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評(píng)論

    相關(guān)推薦
    熱點(diǎn)推薦

    從"替代人力"到"智能協(xié)同":履帶式巡檢機(jī)器人的產(chǎn)業(yè)躍遷

    2026年的工業(yè)智能化轉(zhuǎn)型浪潮中,一個(gè)顯著的趨勢(shì)正在形成——工業(yè)巡檢機(jī)器人正從單純的"人力替代工具"升級(jí)為具備感知、決策與協(xié)同能力的"
    的頭像 發(fā)表于 02-05 10:42 ?264次閱讀

    選EtherCAT模塊,別只看價(jià)格,先看"體檢報(bào)告"

    ±8kV靜電、±2kV浪涌、-42℃極寒、1500V高壓—這不是極限運(yùn)動(dòng),而是DPort-ECT模塊的出廠"必修課"。本文詳解工業(yè)級(jí)EtherCAT從站如何通過嚴(yán)苛測(cè)試關(guān)
    的頭像 發(fā)表于 02-04 11:46 ?265次閱讀
    選EtherCAT模塊,別只看價(jià)格,先看&<b class='flag-5'>amp</b>;<b class='flag-5'>amp</b>;<b class='flag-5'>quot</b>;體檢報(bào)告&<b class='flag-5'>amp</b>;<b class='flag-5'>amp</b>;<b class='flag-5'>quot</b>;

    ZM82:一顆國產(chǎn)模組,如何讓傳統(tǒng)路燈變&amp;amp;quot;聰明&amp;amp;quot;?

    架構(gòu),普遍面臨能源利用率低、調(diào)控手段單一、故障響應(yīng)滯后等痛點(diǎn),運(yùn)環(huán)節(jié)更需投入大量人力巡檢。在&quot;雙碳&quot;戰(zhàn)略與智慧城市建設(shè)的雙重驅(qū)動(dòng)下,構(gòu)建高效、
    的頭像 發(fā)表于 01-29 11:46 ?197次閱讀
    ZM82:一顆國產(chǎn)模組,如何讓傳統(tǒng)路燈變&<b class='flag-5'>amp</b>;<b class='flag-5'>amp</b>;<b class='flag-5'>quot</b>;聰明&<b class='flag-5'>amp</b>;<b class='flag-5'>amp</b>;<b class='flag-5'>quot</b>;?

    L3試點(diǎn)落地,和芯星通如何成為車企突圍的&amp;amp;quot;隱形守護(hù)者&amp;amp;quot;?

    當(dāng)長安汽車與北汽極狐拿到中國首批L3級(jí)自動(dòng)駕駛準(zhǔn)入許可的那一刻,整個(gè)產(chǎn)業(yè)鏈等待多年的&quot;靴子&quot;終于落地。在這個(gè)責(zé)任主體從駕駛員轉(zhuǎn)向車企的關(guān)鍵轉(zhuǎn)折下,系統(tǒng)可靠性成為真正的&quot
    的頭像 發(fā)表于 01-04 12:03 ?546次閱讀
    L3試點(diǎn)落地,和芯星通如何成為車企突圍的&<b class='flag-5'>amp</b>;<b class='flag-5'>amp</b>;<b class='flag-5'>quot</b>;隱形守護(hù)者&<b class='flag-5'>amp</b>;<b class='flag-5'>amp</b>;<b class='flag-5'>quot</b>;?

    &amp;quot;Access violation&amp;quot; 錯(cuò)誤,復(fù)位位置,重新打印

    &quot;Access violation&quot; 錯(cuò)誤
    的頭像 發(fā)表于 11-08 07:16 ?548次閱讀

    地?zé)岚l(fā)電環(huán)網(wǎng)柜局放監(jiān)測(cè)設(shè)備:清潔能源電網(wǎng)的&amp;amp;quot;安全衛(wèi)士&amp;amp;quot;

    的局部放電問題,直接影響系統(tǒng)供電穩(wěn)定性。地?zé)岚l(fā)電環(huán)網(wǎng)柜局放監(jiān)測(cè)設(shè)備通過非接觸式檢測(cè)技術(shù)與智能算法結(jié)合,為清潔能源電網(wǎng)構(gòu)筑起一道主動(dòng)防御體系。技術(shù)原理:破解局部放電的&quot;電磁密碼&quot;地?zé)岚l(fā)電
    的頭像 發(fā)表于 07-16 10:15 ?583次閱讀
    地?zé)岚l(fā)電環(huán)網(wǎng)柜局放監(jiān)測(cè)設(shè)備:清潔能源電網(wǎng)的&<b class='flag-5'>amp</b>;<b class='flag-5'>amp</b>;<b class='flag-5'>quot</b>;安全衛(wèi)士&<b class='flag-5'>amp</b>;<b class='flag-5'>amp</b>;<b class='flag-5'>quot</b>;

    為什么GNSS/INS組合被譽(yù)為導(dǎo)航界的&amp;amp;quot;黃金搭檔&amp;amp;quot;?

    在導(dǎo)航技術(shù)領(lǐng)域,GNSS(全球?qū)Ш叫l(wèi)星系統(tǒng))和INS(慣性導(dǎo)航系統(tǒng))的結(jié)合,一直被業(yè)界譽(yù)為&quot;黃金搭檔&quot;。它們優(yōu)勢(shì)互補(bǔ),克服了單一系統(tǒng)的局限性,為高精度、高可靠性的導(dǎo)航提供了完美
    的頭像 發(fā)表于 07-09 17:12 ?967次閱讀
    為什么GNSS/INS組合被譽(yù)為導(dǎo)航界的&<b class='flag-5'>amp</b>;<b class='flag-5'>amp</b>;<b class='flag-5'>quot</b>;黃金搭檔&<b class='flag-5'>amp</b>;<b class='flag-5'>amp</b>;<b class='flag-5'>quot</b>;?

    CFCF2025光連接大會(huì)——武漢昊衡科技OLI光纖微裂紋檢測(cè)儀,守護(hù)光纖網(wǎng)絡(luò)的&amp;amp;quot;安全衛(wèi)士&amp;amp;quot;

    AI技術(shù)、5G通信、數(shù)據(jù)中心高速發(fā)展的今天,光纖網(wǎng)絡(luò)如同通信系統(tǒng)的&quot;神經(jīng)網(wǎng)絡(luò)&quot;,承載著海量數(shù)據(jù)的傳輸重任。然而,光纖在鋪設(shè)、運(yùn)
    的頭像 發(fā)表于 06-11 17:29 ?1277次閱讀
    CFCF2025光連接大會(huì)——武漢昊衡科技OLI光纖微裂紋檢測(cè)儀,守護(hù)光纖網(wǎng)絡(luò)的&<b class='flag-5'>amp</b>;<b class='flag-5'>amp</b>;<b class='flag-5'>quot</b>;安全衛(wèi)士&<b class='flag-5'>amp</b>;<b class='flag-5'>amp</b>;<b class='flag-5'>quot</b>;

    人形機(jī)器人為什么要定制? ——揭秘工業(yè)場景的&amp;quot;千面需求&amp;quot;

    核心洞察:標(biāo)準(zhǔn)化機(jī)器人難以破解工業(yè)場景的&quot;需求碎片化&quot;困局。富唯智能通過?&quot;五大模塊柔性架構(gòu)+零代碼中樞&quot
    的頭像 發(fā)表于 06-10 17:19 ?1273次閱讀
    人形機(jī)器人為什么要定制? ——揭秘工業(yè)場景的&<b class='flag-5'>amp</b>;<b class='flag-5'>quot</b>;千面需求&<b class='flag-5'>amp</b>;<b class='flag-5'>quot</b>;

    倉儲(chǔ)界的&amp;quot;速效救心丸&amp;quot;,Ethercat轉(zhuǎn)PROFINET網(wǎng)關(guān)實(shí)戰(zhàn)案例

    實(shí)戰(zhàn)案例,Ethercat轉(zhuǎn)PROFINET網(wǎng)關(guān),倉儲(chǔ)界的&quot;速效救心丸&quot;
    的頭像 發(fā)表于 05-11 10:32 ?780次閱讀
    倉儲(chǔ)界的&<b class='flag-5'>amp</b>;<b class='flag-5'>quot</b>;速效救心丸&<b class='flag-5'>amp</b>;<b class='flag-5'>quot</b>;,Ethercat轉(zhuǎn)PROFINET網(wǎng)關(guān)實(shí)戰(zhàn)案例

    電纜局部放電在線監(jiān)測(cè):守護(hù)電網(wǎng)安全的&amp;amp;quot;黑科技&amp;amp;quot;

    文章由山東華科信息技術(shù)有限公司提供在萬家燈火的背后,有一張覆蓋全國的&quot;能源神經(jīng)網(wǎng)絡(luò)&quot;晝夜不息地運(yùn)轉(zhuǎn)。電纜作為電力輸送的&quot;主動(dòng)脈&quot;,其健康狀況直接
    的頭像 發(fā)表于 04-14 18:12 ?970次閱讀
    電纜局部放電在線監(jiān)測(cè):守護(hù)電網(wǎng)安全的&<b class='flag-5'>amp</b>;<b class='flag-5'>amp</b>;<b class='flag-5'>quot</b>;黑科技&<b class='flag-5'>amp</b>;<b class='flag-5'>amp</b>;<b class='flag-5'>quot</b>;

    煉油廠開閉所局放監(jiān)測(cè):為能源樞紐裝上&amp;amp;quot;智能安全閥&amp;amp;quot;

    &quot;,可能點(diǎn)燃易燃?xì)怏w,引發(fā)連鎖爆炸。傳統(tǒng)監(jiān)測(cè)手段在防爆環(huán)境下捉襟見肘,而局放在線監(jiān)測(cè)系統(tǒng)正為煉油廠筑起智能安全屏障。一、局放隱患:煉油廠開閉所的&quot;定時(shí)炸彈&quot
    的頭像 發(fā)表于 04-09 16:41 ?861次閱讀
    煉油廠開閉所局放監(jiān)測(cè):為能源樞紐裝上&<b class='flag-5'>amp</b>;<b class='flag-5'>amp</b>;<b class='flag-5'>quot</b>;<b class='flag-5'>智能</b>安全閥&<b class='flag-5'>amp</b>;<b class='flag-5'>amp</b>;<b class='flag-5'>quot</b>;

    隧道管廊變壓器局放在線監(jiān)測(cè):為地下&amp;amp;quot;電力心臟&amp;amp;quot;裝上智能聽診器

    可能因老化、受潮產(chǎn)生局部放電,如同潛伏的&quot;電蝕暗流&quot;,持續(xù)威脅著電力輸送的安全。如何為這顆&quot;心臟&quot;裝上智能
    的頭像 發(fā)表于 04-09 16:37 ?880次閱讀
    隧道管廊變壓器局放在線監(jiān)測(cè):為地下&<b class='flag-5'>amp</b>;<b class='flag-5'>amp</b>;<b class='flag-5'>quot</b>;電力心臟&<b class='flag-5'>amp</b>;<b class='flag-5'>amp</b>;<b class='flag-5'>quot</b>;裝上<b class='flag-5'>智能</b>聽診器

    &amp;quot;看不見的運(yùn)&amp;quot;才是真智能!物聯(lián)技術(shù)讓光伏電站自己&amp;quot;看病&amp;quot;

    程瑜 187 0211 2087 安科瑞電氣股份有限公司 上海嘉定 201801 摘要 :文章旨在探討基于物聯(lián)網(wǎng)技術(shù)的分布式光伏電站運(yùn)管理系統(tǒng)的設(shè)計(jì)與優(yōu)化。首先,分析物聯(lián)網(wǎng)技術(shù)在光伏電站中
    的頭像 發(fā)表于 03-20 17:02 ?826次閱讀
    &<b class='flag-5'>amp</b>;<b class='flag-5'>quot</b>;看不見的<b class='flag-5'>運(yùn)</b><b class='flag-5'>維</b>&<b class='flag-5'>amp</b>;<b class='flag-5'>quot</b>;才是真<b class='flag-5'>智能</b>!物聯(lián)技術(shù)讓光伏電站自己&<b class='flag-5'>amp</b>;<b class='flag-5'>quot</b>;看病&<b class='flag-5'>amp</b>;<b class='flag-5'>quot</b>;

    力合微電子攜手中山古鎮(zhèn)政府開啟&amp;amp;quot;智光互聯(lián)&amp;amp;quot;新紀(jì)元 共筑全球智能照明產(chǎn)業(yè)高地

    企業(yè),力合微電子將以電力線通信(PLC)技術(shù)為核心引擎,賦能&quot;中國燈飾之都&quot;的智能化轉(zhuǎn)型,開啟照明產(chǎn)業(yè)與物聯(lián)網(wǎng)深度融合的新篇章。此次合作是力合微電子深化智能生態(tài)的重
    的頭像 發(fā)表于 03-19 09:47 ?1111次閱讀
    力合微電子攜手中山古鎮(zhèn)政府開啟&<b class='flag-5'>amp</b>;<b class='flag-5'>amp</b>;<b class='flag-5'>quot</b>;智光互聯(lián)&<b class='flag-5'>amp</b>;<b class='flag-5'>amp</b>;<b class='flag-5'>quot</b>;新紀(jì)元 共筑全球<b class='flag-5'>智能</b>照明產(chǎn)業(yè)高地