666IDC高防服務器 全年24小時30秒售后回復 有問題找我 

    概述:獨立經營福州,福州,福州,電信高防機房 高防服務器咨詢QQ:97533890 九七五三三八九零 TEL:19906907316 服務器“異常”的幾個可能性預警請重視! 提到服務器宕機檢測,大家會想到,宕機
    本信息已過期,發布者可在"已發商機"里點擊"重發"。

    刷新時間:
    2022-03-16 10:47:34 點擊12765次
    銷售服務區域:
    全國
    收費:
    • 1850
    聯系電話:
    18759554972
    信用:4.0  隱性收費:4.0
    描述:4.0  產品質量:4.0
    物流:4.0  服務態度:4.0
    默認4分 我要打分
    獨立經營福州,福州,福州,電信高防機房
    高防服務器咨詢QQ:97533890 九七五三三八九零   TEL:19906907316

    服務器“異常”的幾個可能性預警請重視!
    提到服務器宕機檢測,大家會想到,宕機能夠很快知道,這個有什么可做的?實際上,很多時候服務器宕機,并不總是被及時感知。服務器宕機,ping或者ssh這是最簡單的做法,但真正的工程實踐,沒這么簡單。
    想要獲知服務器宕機怎么辦?可以通過服務器宕機實時檢測:
    1)發現宕機
    2)提前告警。
    3)告知宕機的詳細原因,如硬件故障,內核bug,網絡異常等等。
    4)自動報修生成工單。
    我們知道,進行全網物理機宕機準確探測與實時發現,可以給宕機分析提供第一現場,獲取第一現場的日志。也可以盡早將宕機數據推送給業務或運營感知并處理,如自動報修,業務遷移等,從而盡可能將業務影響降到最低。
    更重要的是,準確的宕機發現數據可以為宕機預測提供準確的標注數據,為后期宕機預測提供數據基礎,并且這些數據提供給運營部門進行整體分析,提升處理效率。
    那么,如何可以準確發現宕機,減少誤報呢?我們可以有以下操作,比如:
    心跳源檢測異常
    顧名思義,通過心跳源,初步發現異常。通常心跳變化會有三類消息,update消息,delete消息和insert消息。心跳邏輯在于,正常情況下SA服務端與NC建立長連接,每數秒緩存一次心跳,每幾分鐘打包上報一次,但當NC異常時,長連接感知后,立即上報異常,并修改路由表。所以心跳異常做到秒級感知。
    update消息,在有心跳發生變化情況下都會有,心跳異常和心跳恢復正常時都會發起,是主要的心跳來源。
    delete消息,在心跳異常,并且SA判斷ping不通,且ssh不通情況下發起,刪除該條消息,避免延遲太長。
    insert消息,在新增加機器, 或者重裝后重新上位的機器發起,該消息對宕機發現價值不大,配合uptime使用。
    心跳源檢測任務邏輯,主要是監聽并緩存uptime消息,同時避免時間窗內多次消息沖突,導致信息被覆蓋。
    異常排除
    排除非物理機器,將系統中暫時不關注的VM等產生的異常信息排除掉。
    排除非業務狀態的機器,如裝機狀態中的,包括生產中,維修中,遷移中,重裝中,銷毀中,重啟中,無管控狀態,只監控正常狀態的機器。
    排除非正在工作的機器,如非working狀態機器。
    網絡干擾排除
    宕機分析中,較多誤報是由于網絡問題干擾,無法準確判斷出物理機是否宕機,有可能是網絡問題。
    排除上聯網絡設備異常導致的誤報,包括機房斷網演練,小面積網絡故障,上聯網絡故障,如通過探測丟包情況,使用一些邏輯初步判斷網絡問題。
    服務器本身未丟包的誤報,除了需要過濾出網絡問題,還要通過丟包數據分析,過濾掉SA誤報問題, SA異常會上報心跳異常,被誤理解為宕機。
     icmp及tcp丟包分析,icmp采集頻率為固定數秒,tcp采集頻率固定數秒,包括多個不同大小包(16,32,64,128,256等)的丟包情況,根據分析時間窗內兩項數據的丟包情況
    特殊情況干擾排除
    個別機房有時候會出現大面積風暴式的無故心跳異常,同時網絡ping包異常,但上聯網絡設備ping包正常,這種誤報,一般根據具體case具體進行針對性的分析。如根據監控每個機房的上報頻率,排除干擾。
    進一步識別誤報
    至此,大部分干擾已經過濾掉,但仍有一部分誤報隱藏其中。比如心跳異常,ping異常,都合乎宕機判斷的邏輯,會導致誤判成宕機,如導致網卡被打爆,或者重試率高,這種是業務原因導致網絡異常,但業務認為不是異常,需要排除掉。再例如服務器并沒有掛掉,但是IO延時和資源占用率各項指標都不正常等場景。針對以上等情況,增加uptime判斷以及帶外日志分析排查。
    宕機時間點探測uptime確定是否發生重啟。
    進一步通過分析日志是否連續,判斷是否發生重啟。
    日志重啟特征值匹配,確認是否發生重啟。
    如果還不能確定,使用uptime的時間窗技術進行重啟。
    仍不能確定的待處理,進入長尾處理名單。
    長尾再次處理
    未確認的待處理的,會加入到長尾列表中,像這種分鐘級的心跳異常,ping異常,但串口日志一直正常輸出的情況,一般就是某種死機,死到連網絡都不通的場景。會觀察一段時間,一個固定時間窗內仍未恢復或重啟的話,就暫時報宕機。后期會把這種死機單獨找劃分歸類。

    [本信息來自于今日推薦網]
    主站蜘蛛池模板: 亚洲国产精品成人久久久| 成人片黄网站色大片免费观看app| 国产成人+综合亚洲+天堂| 成人毛片18女人毛片免费视频未| 成人理论电影在线观看| 国产精品香蕉成人网在线观看| 国产成人无码一区二区在线播放| 免费无码成人片| 成人永久免费高清| 亚洲最大成人网色香蕉| 成人午夜看片在线观看| 亚洲成人午夜电影| 国产精品成人扳**a毛片| 91亚洲国产成人精品下载| 亚洲国产成人久久一区二区三区| 亚洲国产成人高清在线观看| 我的初次内射欧美成人影视| 国产成人福利在线| 成人午夜一区二区三区视频| 久久久久99精品成人片欧美| 国产成人无码一区二区三区在线| 欧美成人免费在线视频| 18岁日韩内射颜射午夜久久成人| 国产成人爱片免费观看视频| 成人性生交大片免费看午夜a| 中文字幕欧美成人免费| 国产成人无码aa精品一区| 成人国产网站v片免费观看 | 亚洲国产成人99精品激情在线| 国产精品成人久久久| 成人精品一区二区三区电影| 久久国产精品成人片免费| 亚洲AV无码成人精品区在线观看| 国产成人欧美一区二区三区| 成人午夜大片免费7777| 红楼遗梦成人h文完整版| 色偷偷成人网免费视频男人的天堂| 人碰人碰人成人免费视频| 亚洲国产精品成人午夜在线观看| 亚洲欧美成人中文日韩电影| 国产成人久久精品二区三区|