01. 觀測場景
分布式、微服務(wù)、云原生等先進(jìn)應(yīng)用架構(gòu)在落地敏捷開發(fā)、快速迭代、彈性伸縮的同時(shí)將原有的單體應(yīng)用拆分成多個(gè)獨(dú)立部署相互通信的組合應(yīng)用。應(yīng)用數(shù)量指數(shù)級增長,業(yè)務(wù)模塊間依賴關(guān)系錯(cuò)綜復(fù)雜,不同業(yè)務(wù)層級不同維度難以建立實(shí)時(shí)有效的映射關(guān)系。同時(shí),隨著容器頻繁啟停,監(jiān)控對象及其指標(biāo)變化成為常態(tài),故障現(xiàn)場難以留存、故障問題難以有效定位。
02. 場景痛點(diǎn)
以上云原生架構(gòu)的觀測難點(diǎn)給應(yīng)用運(yùn)維的故障分析、根因定位、業(yè)務(wù)連續(xù)穩(wěn)定帶來嚴(yán)峻挑戰(zhàn)。應(yīng)用觀測難點(diǎn)概述為以下兩點(diǎn):
1)信息維度復(fù)雜,難以建立多維數(shù)據(jù)關(guān)聯(lián)映射關(guān)系
云原生應(yīng)用的監(jiān)控度量涉及應(yīng)用進(jìn)程、中間件、容器編排平臺、容器進(jìn)程、資源基礎(chǔ)設(shè)施等相關(guān)層級資源屬性和性能指標(biāo);其次,應(yīng)用排障及性能剖析涉及多個(gè)服務(wù)、多個(gè)組件復(fù)雜交互關(guān)系,需根據(jù)請求鏈路依賴關(guān)系分析故障根因。
2)架構(gòu)動(dòng)態(tài)變化,故障現(xiàn)場難以留存,問題難以定位
容器部署架構(gòu)基于聲明式面向終態(tài)的設(shè)計(jì)思想,部署資源實(shí)例對象變更頻繁,服務(wù)節(jié)點(diǎn)漂移成為常態(tài)。基于多維明細(xì)數(shù)據(jù)和指標(biāo)數(shù)據(jù)關(guān)聯(lián)映射構(gòu)建的運(yùn)行時(shí)觀測分析矩陣能有效回溯歷史故障現(xiàn)場。
03. 解決方案
1)合縱連橫故障尋址
縱向:建立運(yùn)行時(shí)軟件架構(gòu)級聯(lián)對象下鉆分析邏輯。基于實(shí)際業(yè)務(wù)流量構(gòu)建不同服務(wù)的全局依賴拓?fù)洌瑢?shí)現(xiàn)可選時(shí)間范圍的單業(yè)務(wù)領(lǐng)域全景分析,通過拓?fù)涔?jié)點(diǎn)大小、顏色差異有效分析服務(wù)流量負(fù)載及服務(wù)健康狀態(tài),支持對服務(wù)節(jié)點(diǎn)的下鉆分析、指定時(shí)間范圍內(nèi)服務(wù)請求、負(fù)載、錯(cuò)誤、耗時(shí)黃金指標(biāo),在服務(wù)內(nèi)可下鉆分析服務(wù)的單一接口/單一服務(wù)實(shí)例進(jìn)一步故障尋址分析。將服務(wù)實(shí)例與CMDB管理資源(主機(jī)、容器)關(guān)聯(lián),可下鉆至IaaS層資源,分析IT基礎(chǔ)資源指標(biāo)異常對服務(wù)流量的影響。
橫向:基于Trace串聯(lián)構(gòu)建單筆請求鏈路追蹤。每筆業(yè)務(wù)請求調(diào)用在入口服務(wù)生成請求唯一標(biāo)識,當(dāng)流量在下游多個(gè)服務(wù)傳遞時(shí)將請求唯一標(biāo)識、當(dāng)前節(jié)點(diǎn)請求標(biāo)識、上游服務(wù)信息作為上下文傳遞,從而構(gòu)建完成業(yè)務(wù)調(diào)用鏈路。此外,用戶可結(jié)合實(shí)際業(yè)務(wù)場景從HTTP請求頭、請求參數(shù)、cookie等獲取業(yè)務(wù)特征數(shù)據(jù)完成數(shù)據(jù)埋點(diǎn),在鏈路分析時(shí)根據(jù)指定業(yè)務(wù)特征的請求依賴關(guān)系輔助業(yè)務(wù)異常分析。
2)調(diào)用鏈與日志明細(xì)關(guān)聯(lián)根因定位
在KAPM和KLC共同交付場景下,可將調(diào)用鏈和日志明細(xì)進(jìn)行關(guān)聯(lián),實(shí)現(xiàn)高效根因定位。通過KAPM調(diào)用鏈分析能力用戶可以確定請求依賴關(guān)系、縮小排障范圍、準(zhǔn)確故障尋址,但無法獲取故障根因明細(xì),在此場景下將調(diào)用鏈和日志明細(xì)關(guān)聯(lián)無縫鏈接排障最后“一公里”。
04. 產(chǎn)品功能
功能點(diǎn)1:應(yīng)用分析
鏈路拓?fù)洌?/strong>通過探針埋點(diǎn)服務(wù)進(jìn)程,自動(dòng)探測繪制應(yīng)用運(yùn)行拓?fù)洌煌ㄟ^節(jié)點(diǎn)面積大小區(qū)分服務(wù)流量情況,并根據(jù)相應(yīng)耗時(shí)/請求錯(cuò)誤等數(shù)據(jù)對服務(wù)節(jié)點(diǎn)進(jìn)行Apdex評分染色。
資源關(guān)系:根據(jù)探針采集數(shù)據(jù),自動(dòng)關(guān)聯(lián)主機(jī)、數(shù)據(jù)庫及消息隊(duì)列的基礎(chǔ)監(jiān)控實(shí)例,實(shí)現(xiàn)APM與ITIM的聯(lián)動(dòng)觀測能力。
指標(biāo)分析:通過頁面集中展示應(yīng)用運(yùn)行黃金指標(biāo)(健康狀態(tài)、請求負(fù)載和請求錯(cuò)誤數(shù)),展示服務(wù)及接口的請求TOP列表。
功能點(diǎn)2:服務(wù)分析
服務(wù)列表:展示應(yīng)用所屬全部服務(wù)列表,匯總概要指標(biāo)數(shù)據(jù)。
指標(biāo)分析:展示服務(wù)視角運(yùn)行指標(biāo),包括Apdex評分、請求負(fù)載、請求錯(cuò)誤數(shù)和請求耗時(shí)等。
鏈路拓?fù)洌?/strong>展示從指定服務(wù)出發(fā)的局部拓?fù)渖舷掠侮P(guān)系,精準(zhǔn)定位服務(wù)運(yùn)行影響范圍。
接口列表:集中展示服務(wù)所屬接口,匯總概要信息。
請求列表:羅列詳細(xì)請求數(shù)據(jù),精準(zhǔn)記錄每一次業(yè)務(wù)運(yùn)行,支持一鍵跳轉(zhuǎn)接口分析、服務(wù)分析、調(diào)用鏈檢索等場景頁面。
錯(cuò)誤列表:集中展示錯(cuò)誤調(diào)用,支持一鍵跳轉(zhuǎn)調(diào)用鏈檢索頁面,可在頁面一鍵查看錯(cuò)誤堆棧信息。
實(shí)例分析-請求概覽:針對服務(wù)實(shí)例(Java進(jìn)程)級別的分析概覽頁面,支持用戶查看健康狀態(tài)、請求負(fù)載、請求錯(cuò)誤數(shù)和請求耗時(shí)等數(shù)據(jù)
實(shí)例分析-JVM分析:針對實(shí)例級別的進(jìn)程進(jìn)行JVM分析,包括GC分析、堆內(nèi)存分析、線程分析等指標(biāo)視圖。
SQL/NOSQL分析:針對服務(wù)調(diào)用的周邊數(shù)據(jù)庫進(jìn)行應(yīng)用層面的數(shù)據(jù)分析視圖,包括針對SQL命令/慢命令/錯(cuò)誤的匯總分析視圖。
功能點(diǎn)3:接口分析
下鉆至具體服務(wù)接口,查看應(yīng)用運(yùn)行情況,包括應(yīng)用運(yùn)行數(shù)據(jù)概覽、請求列表和錯(cuò)誤列表匯總分析;支持一鍵跳轉(zhuǎn)服務(wù)分析,支持下鉆至調(diào)用鏈檢索進(jìn)行詳情查看。
功能點(diǎn)4:調(diào)用鏈檢
Trace/Span檢索:針對調(diào)用鏈Trace和Span環(huán)節(jié)的詳情檢索頁面,支持通過Trace/SpanID精準(zhǔn)定位請求詳情,支持通過請求耗時(shí)范圍檢索請求列表;
請求詳情:通過查看詳情數(shù)據(jù)分析系統(tǒng)運(yùn)行情況,包括探針原始數(shù)據(jù),與日志聯(lián)動(dòng)的分析能力。
功能點(diǎn)5:應(yīng)用配置
健康度評分:支持用戶手動(dòng)配置健康度閾值,針對不同應(yīng)用情況進(jìn)行不同條件下的應(yīng)用運(yùn)行評估。
SQL/NOSQL慢命令配置:支持用戶自定義“慢命令/慢SQL”的閾值配置。
05. 落地愿景
在科技飛速發(fā)展的今天,各行各業(yè)都在不斷迎來新的變革。在IT運(yùn)維領(lǐng)域,云原生概念隨著微服務(wù)、云以及容器化等技術(shù)的大規(guī)模應(yīng)用愈發(fā)深入人心;云原生帶來的新的運(yùn)維困境和技術(shù)難題也愈發(fā)尖銳。在此背景下應(yīng)時(shí)而生的調(diào)用鏈追蹤技術(shù),將會幫助運(yùn)維乃至開發(fā)人員更加方便快捷的完成系統(tǒng)維穩(wěn)、代碼優(yōu)化、故障排查等動(dòng)作。同時(shí),詳盡的寬事件數(shù)據(jù)也在推動(dòng)著監(jiān)控領(lǐng)域從被動(dòng)告警響應(yīng)向主動(dòng)可觀測的模式轉(zhuǎn)變,從而加速各行各業(yè)的產(chǎn)品迭代,最終實(shí)現(xiàn)IT領(lǐng)域的加速發(fā)展。
CMDB治理:CMDB數(shù)據(jù)消費(fèi)與應(yīng)用指南
查看詳細(xì)
1分鐘解鎖開箱即用價(jià)值流:研發(fā)效率飆升實(shí)戰(zhàn)指南
查看詳細(xì)
CCI持續(xù)集成平臺:高效集成K8s集群,流水線容器構(gòu)建集群上線
查看詳細(xì)
嘉為藍(lán)鯨CCI持續(xù)集成平臺:Matrix Job 帶你開啟流水線編排 2.0 時(shí)代
查看詳細(xì)
告警管理:如何從零散事件中挖出關(guān)鍵信息
查看詳細(xì)
嘉為藍(lán)鯨CPack制品庫:全新ML模型管理功能,助力AI交付與企業(yè)級DevOps實(shí)踐無縫結(jié)合
查看詳細(xì)
申請演示