91欧美超碰AV自拍|国产成年人性爱视频免费看|亚洲 日韩 欧美一厂二区入|人人看人人爽人人操aV|丝袜美腿视频一区二区在线看|人人操人人爽人人爱|婷婷五月天超碰|97色色欧美亚州A√|另类A√无码精品一级av|欧美特级日韩特级

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

TECS OpenStack資源池虛機(jī)殘留導(dǎo)致網(wǎng)元異常的問題處理

中興文檔 ? 來源:中興文檔 ? 2025-03-03 09:42 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

故障現(xiàn)象

某運(yùn)營商TECS資源池的一臺主機(jī)內(nèi)存故障,進(jìn)行關(guān)機(jī)、內(nèi)存更換操作,虛機(jī)自動遷移到其他主機(jī)上,同時(shí)做了其他虛擬機(jī)的手動遷移操作。后續(xù)在TECS上出現(xiàn)虛機(jī)內(nèi)核異常告警,如下圖所示。

942c8290-f40f-11ef-9310-92fbcf53809c.png

故障分析

1. 檢查告警,確認(rèn)是一臺虛擬機(jī)的多次告警,如下圖所示。

944e21ac-f40f-11ef-9310-92fbcf53809c.png

2. 經(jīng)排查,服務(wù)器SRV-09有內(nèi)存更換和下電操作,00:39 虛機(jī)全部自動遷移成功,其中包含了XXX0012虛機(jī),同時(shí)還包括其他網(wǎng)元的虛機(jī),其他網(wǎng)元未出現(xiàn)異常。

3. 現(xiàn)場進(jìn)行虛機(jī)重啟、遷移等操作,未成功恢復(fù)XXX00012虛機(jī)。分析虛機(jī)CPU都沖高到100%,虛機(jī)操作系統(tǒng)顯示軟鎖,如下圖所示。

9485e0b0-f40f-11ef-9310-92fbcf53809c.png

4. 經(jīng)操作系統(tǒng)分析,是有大量外部報(bào)文沖擊導(dǎo)致CPU沖高到100%,系統(tǒng)得不到調(diào)度。

5. 將該網(wǎng)元中除XXX00012外的其他虛機(jī)都shutdown后,再重啟XXX00012虛機(jī),XXX00012虛擬機(jī)恢復(fù)正常。

6. 逐一開啟其他虛機(jī),發(fā)現(xiàn)XXX00012虛機(jī)異常,其余虛機(jī)均正常啟動。3分鐘后XXX00012虛機(jī)CPU再次沖高到100%。

7. 分析XXX00012虛機(jī),發(fā)現(xiàn)該虛機(jī)存在I/O Error,數(shù)據(jù)盤不能正常讀寫,如下圖所示。

94916b24-f40f-11ef-9310-92fbcf53809c.png

8. 分析虛機(jī)殘留問題,原主機(jī)SRV-09故障下電后,虛機(jī)自動遷移,第一次自動遷移失敗,自動遷移落地的節(jié)點(diǎn)是SRV-10,如下圖所示。

94a8e088-f40f-11ef-9310-92fbcf53809c.png

9. SRV-10節(jié)點(diǎn)上因?yàn)閹捹Y源不足落地失敗,XXX00012虛機(jī)重新自動遷移到SRV-12,自動遷移成功,如下圖所示。

94cc0842-f40f-11ef-9310-92fbcf53809c.png

10. 自動遷移異常導(dǎo)致虛機(jī)實(shí)例在SRV-10和SRV-12同時(shí)啟動,如下圖所示。

94f0ad00-f40f-11ef-9310-92fbcf53809c.png

11. 綜上分析,產(chǎn)生該問題的原因是殘留虛機(jī),導(dǎo)致網(wǎng)元異常。

故障處理

1. 關(guān)閉SRV-12服務(wù)器上XXX0012虛機(jī),同時(shí)刪除SRV-10服務(wù)器上該虛機(jī)殘留的實(shí)例。

2. 重啟XXX0012虛機(jī),虛機(jī)啟動正常,CPU恢復(fù)正常。觀察半小時(shí)未再出現(xiàn)異常。

3. 總結(jié):異地重生階段建議不要做其他互斥或者相同的操作,容易造成集群中數(shù)據(jù)不一致等問題。

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報(bào)投訴
  • 內(nèi)核
    +關(guān)注

    關(guān)注

    4

    文章

    1467

    瀏覽量

    42859
  • cpu
    cpu
    +關(guān)注

    關(guān)注

    68

    文章

    11274

    瀏覽量

    224911
  • 內(nèi)存
    +關(guān)注

    關(guān)注

    9

    文章

    3208

    瀏覽量

    76350
  • 主機(jī)
    +關(guān)注

    關(guān)注

    0

    文章

    1053

    瀏覽量

    36740
  • 虛擬機(jī)
    +關(guān)注

    關(guān)注

    1

    文章

    972

    瀏覽量

    30458

原文標(biāo)題:TECS OpenStack-資源池虛機(jī)殘留導(dǎo)致網(wǎng)元異常的問題處理

文章出處:【微信號:ztedoc,微信公眾號:中興文檔】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關(guān)推薦
    熱點(diǎn)推薦

    RCS融合通信系統(tǒng)設(shè)計(jì)方案解析

    TECS主要由以下部分組成:OpenStack自身的組件,OpenStack部署相關(guān)組件,以及擴(kuò)展的HA、自動部署與管理、系統(tǒng)管理(軟、硬件資源管理)等組件,
    發(fā)表于 07-01 15:45 ?3738次閱讀
    RCS融合通信系統(tǒng)設(shè)計(jì)方案解析

    OpenStack資源調(diào)度和現(xiàn)狀分析

    OpenStack云端的資源調(diào)度和優(yōu)化剖析2016-07-03 19:12 作者簡介:胡曉亮,目前就職于IBM Platform Computing 系統(tǒng)科技部云計(jì)算部門,擔(dān)任云計(jì)算開發(fā)部工程師。自
    發(fā)表于 10-10 10:44 ?0次下載
    <b class='flag-5'>OpenStack</b><b class='flag-5'>資源</b>調(diào)度和現(xiàn)狀分析

    電力云資源的建立

    國家電網(wǎng)公司從2010年開始建設(shè)電力云資源,存儲域作為資源的必須部分,設(shè)計(jì)和實(shí)現(xiàn)存儲域是資源
    發(fā)表于 11-27 17:33 ?0次下載
    電力云<b class='flag-5'>資源</b><b class='flag-5'>池</b>的建立

    OpenStack云平臺監(jiān)控?cái)?shù)據(jù)采集及處理的實(shí)踐與優(yōu)化

    本文介紹了在OpenStack云平臺中通過Ceilometer采集云平臺中虛擬機(jī)、磁盤、網(wǎng)絡(luò)等資源的使用數(shù)據(jù),并通過Gnocchi處理、儲存和索引數(shù)據(jù)的實(shí)踐。
    的頭像 發(fā)表于 12-25 18:38 ?2822次閱讀

    線程池中如何獲取和處理異常

    在實(shí)際開發(fā)中,我們常常會用到線程,但任務(wù)一旦提交到線程之后,如果發(fā)生異常之后,怎么處理?
    的頭像 發(fā)表于 10-24 15:44 ?2018次閱讀

    TECS資源池上報(bào)網(wǎng)絡(luò)流程異常告警的問題處理

    資源TECS上報(bào)網(wǎng)絡(luò)流程異常告警,告警單次持續(xù)15秒-4分鐘之間。
    的頭像 發(fā)表于 06-07 09:41 ?1922次閱讀
    <b class='flag-5'>TECS</b><b class='flag-5'>資源</b>池上報(bào)網(wǎng)絡(luò)流程<b class='flag-5'>異常</b>告警的問題<b class='flag-5'>處理</b>

    TECS資源池上報(bào)存儲設(shè)備離線的問題處理

    資源在運(yùn)行過程中出現(xiàn)存儲設(shè)備離線告警,通過底層cinder service-list命令查看,確認(rèn)存儲state為down狀態(tài)。
    的頭像 發(fā)表于 06-07 09:44 ?1474次閱讀
    <b class='flag-5'>TECS</b><b class='flag-5'>資源</b>池上報(bào)存儲設(shè)備離線的問題<b class='flag-5'>處理</b>

    TECS資源SSH控制節(jié)點(diǎn)機(jī)提示connection refused的問題處理

    某局點(diǎn)現(xiàn)場TECS控制節(jié)點(diǎn)的TECSClient平面使用雙棧配置,同時(shí)使用IPv4和IPv6。
    的頭像 發(fā)表于 06-07 09:47 ?1605次閱讀
    <b class='flag-5'>TECS</b><b class='flag-5'>資源</b><b class='flag-5'>池</b>SSH控制節(jié)點(diǎn)<b class='flag-5'>虛</b><b class='flag-5'>機(jī)</b>提示connection refused的問題<b class='flag-5'>處理</b>

    TECS資源池上報(bào)BFD會話DOWN和網(wǎng)絡(luò)流量異常告警的問題處理

    資源TECS上報(bào)BFD會話DOWN告警和網(wǎng)絡(luò)流量異常告警,持續(xù)時(shí)間1秒至6分鐘不等,如下圖所示。
    的頭像 發(fā)表于 06-07 09:49 ?2504次閱讀
    <b class='flag-5'>TECS</b><b class='flag-5'>資源</b>池上報(bào)BFD會話DOWN和網(wǎng)絡(luò)流量<b class='flag-5'>異常</b>告警的問題<b class='flag-5'>處理</b>

    資源后端存儲服務(wù)狀態(tài)異常的問題處理

    故障現(xiàn)象某資源在巡檢過程中檢查服務(wù)狀態(tài),其中云盤后端的服務(wù)狀態(tài)為down,如下圖所示,影響虛擬機(jī)云盤的生命周期管理操作。
    的頭像 發(fā)表于 09-20 11:06 ?1592次閱讀
    <b class='flag-5'>資源</b><b class='flag-5'>池</b>后端存儲服務(wù)狀態(tài)<b class='flag-5'>異常</b>的問題<b class='flag-5'>處理</b>

    資源虛擬機(jī)時(shí)鐘跳變異常的問題處理

    資源在運(yùn)行過程中一臺虛擬機(jī)出現(xiàn)業(yè)務(wù)異常,通過查看日志和異常記錄,判斷為虛擬機(jī)發(fā)生時(shí)鐘跳變問題
    的頭像 發(fā)表于 09-20 11:08 ?2541次閱讀
    <b class='flag-5'>資源</b><b class='flag-5'>池</b>虛擬機(jī)時(shí)鐘跳變<b class='flag-5'>異常</b>的問題<b class='flag-5'>處理</b>

    TECS OpenStack資源時(shí)間同步失敗的故障分析

    某運(yùn)營商TECS OpenStack資源,在當(dāng)前告警中顯示“時(shí)鐘同步失敗”,以10分鐘整數(shù)倍為間隔上報(bào)“時(shí)間同步失敗”告警,持續(xù)時(shí)間30秒-1分鐘不等。
    的頭像 發(fā)表于 03-03 10:09 ?1122次閱讀
    <b class='flag-5'>TECS</b> <b class='flag-5'>OpenStack</b><b class='flag-5'>資源</b><b class='flag-5'>池</b>時(shí)間同步失敗的故障分析

    TECS OpenStack資源機(jī)寫磁盤時(shí)延高告警的問題處理

    某運(yùn)營商TECS資源,在當(dāng)前告警中顯示“機(jī)寫磁盤時(shí)延高告警”,如下圖所示。告警統(tǒng)計(jì)總體平均10分鐘左右自動恢復(fù)。
    的頭像 發(fā)表于 03-21 09:36 ?1013次閱讀
    <b class='flag-5'>TECS</b> <b class='flag-5'>OpenStack</b><b class='flag-5'>資源</b><b class='flag-5'>池</b><b class='flag-5'>虛</b><b class='flag-5'>機(jī)</b>寫磁盤時(shí)延高告警的問題<b class='flag-5'>處理</b>

    TECS OpenStack資源主機(jī)磁盤分區(qū)使用率過高的問題處理

    某運(yùn)營商TECS資源池上報(bào)“主機(jī)磁盤分區(qū)使用率過高”的告警,如下圖所示。
    的頭像 發(fā)表于 03-21 09:47 ?1015次閱讀
    <b class='flag-5'>TECS</b> <b class='flag-5'>OpenStack</b><b class='flag-5'>資源</b><b class='flag-5'>池</b>主機(jī)磁盤分區(qū)使用率過高的問題<b class='flag-5'>處理</b>

    TECS OpenStack資源虛擬機(jī)網(wǎng)絡(luò)二層地址無法互通的問題處理

    某運(yùn)營商TECS OpenStack使用主機(jī)overlay SDN方案組網(wǎng),運(yùn)維人員在創(chuàng)建虛擬機(jī)測試虛擬機(jī)網(wǎng)絡(luò)狀態(tài)時(shí)發(fā)現(xiàn)問題:在其中一臺主機(jī)上創(chuàng)建兩臺同網(wǎng)段虛擬
    的頭像 發(fā)表于 06-12 09:28 ?875次閱讀
    <b class='flag-5'>TECS</b> <b class='flag-5'>OpenStack</b><b class='flag-5'>資源</b><b class='flag-5'>池</b>虛擬<b class='flag-5'>機(jī)</b>網(wǎng)絡(luò)二層地址無法互通的問題<b class='flag-5'>處理</b>