在數(shù)字化轉(zhuǎn)型與國產(chǎn)化替代的雙重驅(qū)動(dòng)下,傳統(tǒng)IT監(jiān)控工具正面臨前所未有的挑戰(zhàn)。以IBM Tivoli為代表的國外監(jiān)控產(chǎn)品,因廠商支持力度減弱、本土化服務(wù)退化及技術(shù)架構(gòu)陳舊等問題,已難以滿足企業(yè)對(duì)國產(chǎn)化、自主可控和云原生環(huán)境的迫切需求。
隨著Tivoli核心產(chǎn)品(如ITM/ITCAM、Netcool系列)陸續(xù)停服,存量用戶亟需尋找既能覆蓋全棧觀測(cè)場(chǎng)景,又具備深度國產(chǎn)化適配能力的替代方案。嘉為藍(lán)鯨全棧智能觀測(cè)中心·鯨眼(以下簡(jiǎn)稱“全棧智能觀測(cè)中心”)作為騰訊大規(guī)模IT生產(chǎn)環(huán)境錘煉出的全棧智能觀測(cè)中心,憑借一體化融合設(shè)計(jì)、開箱即用的信創(chuàng)生態(tài)支持、云原生監(jiān)控能力以及本土化服務(wù)優(yōu)勢(shì),正成為企業(yè)替代Tivoli的高性價(jià)比選擇。
本文將通過現(xiàn)狀分析、場(chǎng)景覆蓋、國產(chǎn)化適配等維度,解析全棧智能觀測(cè)中心如何破解傳統(tǒng)監(jiān)控工具困局,助力企業(yè)構(gòu)建自主可控的智能運(yùn)維體系。
01.全棧智能觀測(cè)中心與Tivoli現(xiàn)狀分析
1)全棧智能觀測(cè)中心:深度融合,自主可控
2)Tivoli:多源技術(shù)組合,本土化適配受阻
3)全棧智能觀測(cè)中心與Tivoli的監(jiān)控能力替換
(備注:容量管理與服務(wù)器管理屬于基礎(chǔ)設(shè)施運(yùn)維范疇,不在可觀測(cè)性(Observability)的能力覆蓋范圍內(nèi)。作為全棧可觀測(cè)平臺(tái),全棧智能觀測(cè)中心當(dāng)前暫未集成這兩類功能模塊。但嘉為藍(lán)鯨已提供獨(dú)立的解決方案,包括智能報(bào)表系統(tǒng)和自動(dòng)化運(yùn)維平臺(tái),可有效滿足相關(guān)需求。)
以下將通過具體場(chǎng)景對(duì)比,進(jìn)一步闡述全棧智能觀測(cè)中心的核心價(jià)值與落地實(shí)踐。
02.全棧智能觀測(cè)中心與Tivoli的監(jiān)控場(chǎng)景對(duì)比
IBM Tivoli 的監(jiān)控和事件管理通常由多個(gè)子產(chǎn)品組合而成,例如 ITM (IBM Tivoli Monitoring) 主要負(fù)責(zé)基礎(chǔ)架構(gòu)監(jiān)控,ITCAM (IBM Tivoli Composite Application Manager) 側(cè)重于應(yīng)用性能和更深層次的組件監(jiān)控,而 Omnibus (Netcool/OMNIbus) 則專注于強(qiáng)大的事件管理和關(guān)聯(lián)分析。這種組合方式功能強(qiáng)大,但也可能帶來較高的復(fù)雜度和維護(hù)成本。
全棧智能觀測(cè)中心旨在提供一個(gè)更現(xiàn)代化、更統(tǒng)一、更能開箱即用的全棧可觀測(cè)平臺(tái),在大部分的監(jiān)控場(chǎng)景中,全棧智能觀測(cè)中心一個(gè)產(chǎn)品就能實(shí)現(xiàn)Tivoli三個(gè)子產(chǎn)品的效用:
1)基礎(chǔ)架構(gòu)與組件監(jiān)控
全棧智能觀測(cè)中心提供開箱即用的監(jiān)控能力,覆蓋操作系統(tǒng)、數(shù)據(jù)庫、中間件等基礎(chǔ)組件,支持通過插件化方式對(duì)接各類信創(chuàng)環(huán)境。相較于ITM的基礎(chǔ)資源監(jiān)控和ITCAM的組件級(jí)監(jiān)控,全棧智能觀測(cè)中心通過統(tǒng)一數(shù)據(jù)模型實(shí)現(xiàn)指標(biāo)、日志、追蹤、告警數(shù)據(jù)的融合采集,顯著降低了多系統(tǒng)集成的復(fù)雜度。平臺(tái)提供SDK、標(biāo)準(zhǔn)協(xié)議和自定義插件三種接入方式,滿足企業(yè)級(jí)全棧觀測(cè)需求。
業(yè)務(wù)全景觀測(cè)
業(yè)務(wù)資源縱覽
資源詳情-指標(biāo)視圖
組件監(jiān)控列表
2)虛擬化與容器監(jiān)控
全棧智能觀測(cè)中心同樣和Tivoli一樣具備虛擬化監(jiān)控能力,支持OpenStack、VMware ESX 等虛擬化平臺(tái)的監(jiān)控?cái)?shù)據(jù)接入的同時(shí),還支持對(duì)云環(huán)境進(jìn)行一體化納管,支持插件化的方式對(duì)公有云和私有云平臺(tái)進(jìn)行擴(kuò)展監(jiān)控。
除了虛擬化監(jiān)控,全棧智能觀測(cè)中心在容器化這一現(xiàn)代化關(guān)鍵技術(shù)領(lǐng)域也具備明顯優(yōu)勢(shì)。對(duì)于正在采用或計(jì)劃采用容器技術(shù) (如 Docker, Kubernetes) 的企業(yè),相較于Tivoli對(duì)傳統(tǒng)架構(gòu)的強(qiáng)依賴,全棧智能觀測(cè)中心支持接入原生Kubernetes的容器監(jiān)控能力,提供從基礎(chǔ)設(shè)施到PaaS層的完整監(jiān)控鏈路,有效支撐企業(yè)云原生轉(zhuǎn)型。
云平臺(tái)監(jiān)控概覽
容器監(jiān)控資源列表
容器資源詳情-指標(biāo)視圖
3)硬件設(shè)備監(jiān)控
在硬件設(shè)備監(jiān)控領(lǐng)域,Tivoli更多的是通過SNMP協(xié)議實(shí)現(xiàn)網(wǎng)絡(luò)設(shè)備性能和可用性的監(jiān)控,對(duì)于其他的物理機(jī)設(shè)備和存儲(chǔ)設(shè)備,缺少直接有效的監(jiān)控方式。而全棧智能觀測(cè)中心的硬件監(jiān)控支持多種帶外協(xié)議的對(duì)接以及多種數(shù)據(jù)類型的采集:基于SNMP、IPMI、SMI-S、Trap和Syslog協(xié)議的指標(biāo)采集及日志采集,實(shí)現(xiàn)硬件設(shè)備的指標(biāo)、日志、告警的統(tǒng)一監(jiān)控。
硬件監(jiān)控詳情-指標(biāo)視圖
網(wǎng)絡(luò)拓?fù)?/span>
4)應(yīng)用性能監(jiān)控
Tivoli體系中的ITCAM雖然提供APM能力,但常局限于對(duì)特定應(yīng)用的監(jiān)控,如SAP和其他企業(yè)資源規(guī)劃(ERP)應(yīng)用程序。與其他APM工具相比,ITCAM的集成能力非常有限,且安裝復(fù)雜,用戶界面陳舊等原因難以在國內(nèi)推廣。
而全棧智能觀測(cè)中心則采用現(xiàn)代化的探針埋點(diǎn)服務(wù)進(jìn)程的方式,自動(dòng)探測(cè)分布式服務(wù)端到端調(diào)用鏈路,自動(dòng)生成服務(wù)調(diào)用拓?fù)洌瑥膽?yīng)用、服務(wù)、接口、調(diào)用 4個(gè)層次層層深入,監(jiān)控應(yīng)用的健康狀態(tài)和調(diào)用性能;并支持基礎(chǔ)資源監(jiān)控進(jìn)行聯(lián)動(dòng)和下鉆分析,輔助問題根因分析,提升問題定位效率。同時(shí)還支持應(yīng)用服務(wù)調(diào)用視角、應(yīng)用資源關(guān)聯(lián)視角、服務(wù)分析視角、接口分析視角、Trace調(diào)用鏈路視角多視角分析查看和追蹤問題。
應(yīng)用觀測(cè)
應(yīng)用詳情-鏈路拓?fù)?/span>
調(diào)用鏈檢索
5)告警事件閉環(huán)能力
Tivoli將高級(jí)事件處理能力(如去重、豐富、關(guān)聯(lián))集中于 Netcool/OMNIbus,子產(chǎn)品ITM中只具備基本的告警列表、規(guī)則和處理能力,并且事件規(guī)則的配置需要專門的技能進(jìn)行腳本化配置和維護(hù)。
全棧智能觀測(cè)中心則將從告警管理、規(guī)則配置、處理、自動(dòng)化轉(zhuǎn)工單到抑制、屏蔽、豐富、關(guān)聯(lián)分析等全流程能力內(nèi)建于平臺(tái)。其核心優(yōu)勢(shì)在于提供了可視化的告警規(guī)則配置界面,大幅降低了使用門檻,使普通運(yùn)維人員也能輕松掌握和維護(hù),促進(jìn)告警規(guī)則的持續(xù)優(yōu)化和知識(shí)沉淀,從而不斷提升告警的準(zhǔn)確性和有效性。
(Omnibus復(fù)古的配置頁面,理解和配置門檻都很高)
鯨眼告警閉環(huán)流程
告警源數(shù)據(jù)豐富配置
告警策略配置
03.全棧智能觀測(cè)中心替換 Tivoli 事件規(guī)則實(shí)操
截至目前,全棧智能觀測(cè)中心團(tuán)隊(duì)已經(jīng)在近十個(gè)項(xiàng)目中將 IBM Tivoli 替換為全棧智能觀測(cè)中心產(chǎn)品,一個(gè)核心且常見的需求是將Tivoli系統(tǒng)中長(zhǎng)期積累的事件規(guī)則遷移至全棧智能觀測(cè)中心平臺(tái)。然而,這項(xiàng)任務(wù)面臨一個(gè)關(guān)鍵挑戰(zhàn):Tivoli的事件規(guī)則通常以腳本形式存在,這些腳本往往缺乏清晰的文檔記錄,甚至客戶自身也難以完全解讀其復(fù)雜的邏輯。這種不透明性直接導(dǎo)致在全棧智能觀測(cè)中心中準(zhǔn)確、完整地復(fù)現(xiàn)這些關(guān)鍵規(guī)則變得異常困難。
過去,這一遷移過程高度依賴具備深厚Tivoli專業(yè)知識(shí)的專業(yè)人員進(jìn)行人工分析和解讀,不僅耗時(shí)費(fèi)力,實(shí)施效率也因此受到極大限制,項(xiàng)目周期常常被拉長(zhǎng)。
幸運(yùn)的是,隨著大語言模型(LLM)技術(shù)的興起與應(yīng)用,全棧智能觀測(cè)中心團(tuán)隊(duì)探索并實(shí)踐了一套創(chuàng)新的解決方案。我們現(xiàn)在可以利用大模型對(duì)Tivoli的規(guī)則腳本進(jìn)行自動(dòng)化分析,智能地生成一份詳盡且易于理解的規(guī)則說明清單。
具體操作流程得以顯著簡(jiǎn)化:實(shí)施團(tuán)隊(duì)現(xiàn)在只需將客戶提供的Tivoli規(guī)則腳本文件,輸入大模型進(jìn)行分析,即可快速獲得一份清晰、結(jié)構(gòu)化的規(guī)則邏輯描述文檔。基于這份文檔,運(yùn)維人員便可以參照具體的說明,在全棧智能觀測(cè)中心友好的可視化界面中高效、準(zhǔn)確地完成相應(yīng)告警規(guī)則的配置。
(Tivoli 導(dǎo)出的規(guī)則腳本清單)
(自動(dòng)化分析后的腳本說明清單)
04.更多全棧可觀測(cè)能力
全棧智能觀測(cè)中心作為嘉為藍(lán)鯨傾力打造的一款全棧可觀測(cè)產(chǎn)品,經(jīng)過持續(xù)的沉淀和迭代,目前已經(jīng)實(shí)現(xiàn)了業(yè)務(wù)全棧系統(tǒng)資源監(jiān)控、K8s容器監(jiān)控、云平臺(tái)監(jiān)控、硬件設(shè)備監(jiān)控、網(wǎng)站服務(wù)撥測(cè)、日志統(tǒng)一管理、應(yīng)用性能觀測(cè)、業(yè)務(wù)場(chǎng)景監(jiān)控、告警閉環(huán)管理等多個(gè)領(lǐng)域的可觀測(cè)場(chǎng)景。
為了實(shí)現(xiàn)上述各種觀測(cè)場(chǎng)景的落地,產(chǎn)品設(shè)計(jì)上結(jié)合PaaS+SaaS的理念,抽象各個(gè)場(chǎng)景的公共能力,融合成一套底層能力框架,并且能夠和企業(yè)內(nèi)的運(yùn)維體系工具聯(lián)動(dòng)集成,支撐上層的場(chǎng)景擴(kuò)展,以適應(yīng)企業(yè)不斷變化的可觀測(cè)場(chǎng)景和管理訴求。
圖中由下而上,依次是監(jiān)控對(duì)象、數(shù)據(jù)集成、數(shù)據(jù)中臺(tái)、能力中心、觀測(cè)場(chǎng)景五層以及外部集成模塊。
05.結(jié)論
總的來說,在國產(chǎn)化替代與云原生轉(zhuǎn)型趨勢(shì)下,全棧智能觀測(cè)中心憑借一體化云原生架構(gòu)、全棧端到端可觀測(cè)能力及信創(chuàng)生態(tài)支持,全面突破IBM Tivoli因架構(gòu)陳舊、國產(chǎn)化適配不足、多產(chǎn)品割裂導(dǎo)致的運(yùn)維瓶頸,助力企業(yè)通過優(yōu)先替換容器監(jiān)控、云平臺(tái)監(jiān)控及業(yè)務(wù)觀測(cè)等Tivoli薄弱環(huán)節(jié),快速實(shí)現(xiàn)從“被動(dòng)救火”到“智能預(yù)防”的運(yùn)維模式升級(jí),為數(shù)字化轉(zhuǎn)型奠定技術(shù)基石。
ITSM運(yùn)營(yíng):服務(wù)請(qǐng)求管理持續(xù)改進(jìn)
查看詳細(xì)
AI驅(qū)動(dòng)IT運(yùn)維轉(zhuǎn)型:從審批流到AI工作流
查看詳細(xì)
國產(chǎn)化替代實(shí)踐:嘉為藍(lán)鯨全棧智能觀測(cè)中心對(duì)比IBM Tivoli
查看詳細(xì)
嘉為藍(lán)鯨平臺(tái):三位一體,打造云原生數(shù)字化基座
查看詳細(xì)
嘉為藍(lán)鯨DevOps研發(fā)效能管理平臺(tái):AI賦能研運(yùn),效能再進(jìn)化
查看詳細(xì)
ITSM運(yùn)營(yíng):事件管理持續(xù)改進(jìn)
查看詳細(xì)
申請(qǐng)演示