公之淫手_韩国电影邻居的老婆_HD中文字幕在线播放,禁止的爱善良的小姨子,妹妹的味道在线观看,爱的精灵在线观看

如何應對容器和微服務帶來的IT監控挑戰
2020-10-10 by uino 9.9K 技術分享

IT監控作為IT的伴生系統,應對了各種IT技術發展帶來的挑戰,然而在容器和微服務的時代到來之際,IT監控會面臨哪些挑戰?又應該如何應對呢?

一、IT監控的現狀

01.規模增大,IT系統越發復雜

現在企業的IT環境早已不是少量幾臺服務器就可以支撐的,各企業IT團隊都需要應對各種IT復雜的環境:物理機、虛擬機、IAAS、PASS、各種應用等。而近兩年微服務和容器等技術的發展,讓基礎設施的管理對象越來越多,也越來越分散;同時敏捷迭代的思維,上層的應用程序發布節奏也更加頻繁。當這些因素疊加在一起,就造成了企業IT監控的數據量以指數級的增加,以至于遠遠超出了“人類”的處理能力。

02.精細化“全棧”監控時代已經到來

為了應對現代IT系統的復雜性,絕大多數企業已經放棄傳統“一刀切”的單維監控方案,轉而投向立體分散的“全棧”監控方法。如今IT系統的監控平均要使用大約6-8個工具,其中至少包括:系統監控、用戶行為監控、APM、錯誤檢測、日志分析、網絡監控、ITSM工單系統。因為各種工具相互割裂缺乏有效的整合,工程師需要不斷地對各種屏幕和儀表板進行操作。

二、IT監控需要面對的挑戰

01.告警風暴頻發

不斷增加的工具數量與所需要處理的龐大數據相結合后,必然出現海量告警數據,從而導致告警風暴問題。每當發生故障時,IT團隊都被來自多個監控工具的告警所淹沒,但卻沒有任何關于整體問題的歸納。這樣不僅難以快速檢測和分類問題,而且還阻礙IT團隊發現可能更為嚴重的問題。

02. 運維壁壘顯現

運維部門常會碰到以下場景:核心業務系統不能正常訪問,大家都不知道問題出在哪,只能將各領域人員召集到一起分析。各管理員往往有自己獨立的監控平臺,大家各自為政分頭檢查,沒有人能知道完整的總體情況,導致系統的恢復時間較長,給企業帶來負面影響。監控數據層面,各領域監控數據割離,不能集中分析和展現,無法深入挖掘運維價值。怎么第一時間全面掌握IT各領域系統運行狀況,及時發現系統隱患和問題?

03. 事件處理低效

業務對IT運維精細化要求越來越高,精細化的運維必然要求對海量運維數據的實時深入分析,這樣也就帶來了大量的數據采集,從不同維度對管理對象進行監控,從而產生大量的事件數據。在有限的人力情況下,如何高效的采集、存儲、分析處理和展現大量事件數據?并且避免傳統集中監控平臺在事件量太大造成告警延遲和丟失問題。

三、新一代IT監控的能力需求

01.監控事件的匯聚與處理

  1. **事件匯總:**匯總不同層級、不同專業、不同類型的事件是集中監控的基礎,無論是底層的動環、傳輸、網絡、主機,中間層的操作系統、中間件、數據庫,還是上層的應用都應該進行匯聚接入到統一事件臺。

  2. **事件歸集:**IT系統之間復雜的關聯性和全面立體的監控體系背景下,一個故障會觸發多類指標的告警,同一個指標在故障未解除前也會重復產生大量的告警事件。如果將全部事件都展示出來,那對于監控處理人員將是“災難性”的,所以需要進行事件按照不同維度的歸集。

  3. **事件重定級:**對于不同的事件不僅需要有適當層次的事件分級,同時也應在故障時段內事件的變化態勢,以及IT系統架構的健壯性方面,更加智能的完成事件重定級策略。事件分級是將事件當前緊急程度進行標識顯示,事件重定級是從時間、架構、指標等多維度的度量后對事件的級別給予二次定義,讓運維人員的寶貴時間可以投入到更有價值的事務中。

02.監控數據的可視化

  1. **統一可視化:**統一展示不同來源的事件,支持不同角色用戶管理不同的事件,包括事件的確認、通知、屏蔽、轉工單等閉環操作,無需在不同監控工具上多次操作。

  2. **事件策略可視化:**能夠將每一個事件處理策略由過去“黑盒”,轉變為整個運維團隊都可以查看、定義透明的“水晶盒”。

  3. **處理過程可視化:**不僅事件處理策略運維團隊能夠共享,對于事件處理的過程與指標也應該共享給整個運維團隊,以便于不同領域的管理員可以從自身業務出發來對這些事件處理給予評估及優化。

  4. **故障分析可視化:**在故障出現后需要能夠快速的展示應用與應用、事件與事件之間的關聯關系,以便于運維人員能夠快速完成故障的定位與處理。

03.運營工作的持續投入

對于IT監控的標桿企業,雖然監控的對象、環境各不相同,但是他們有一個共同的特點——對監控系統運營工作的持續投入。例如:由專人負責告警治理,統計事件情況,分析事件風暴的原因并形成告警策略,對告警進行過濾、壓縮、關聯、歸集等策略設定及驗證,并且會遵照PDCA循環方式不斷地對策略優化,經過一段事件的運營后,需要人工處理的事件,會下降至原始事件的10%至20%。為了更好的完成運營工作就要求監控平臺能為監控運營分析提供“武器與彈藥”,能夠提供從各個維度為運營人員提供數據和分析工具。

四、新一代IT監控解決方案帶來的收益

01.提升處理效率

通過事件歸集智能地將警報分組和關聯到相關事件中,依靠事件時序圖和業務架構圖模式,可以從時間和空間兩個維度進行故障定位,從而更容易地發現關鍵問題并找出根本原因。此外通過告警歸集將獲得事件的完整關聯信息,而不僅僅是單個告警的信息。例如,可以讓您快速發現整個集群遇到了磁盤問題,而不是浪費時間來分析單個主機的磁盤I / O警報。可以避免故障處理時間的浪費,提升故障處理時效。

02.提高監控能效

在遵照PDCA循環方式進行監控的持續運營過程中,大量無效事件會被過濾、壓縮,事件信息會更加豐富,事件之間的關聯關系也將更加清晰。使得監控管理員可以關注真正需要處理的故障,并且方便獲取與故障相關的信息,從而不斷提高監控效能。