在眾多流程中,事件管理流程是很多組織在實(shí)踐中優(yōu)先考慮的選擇,也是在企業(yè)內(nèi)部IT部門(mén)與業(yè)務(wù)部門(mén)銜接中出現(xiàn)最多的一類(lèi)場(chǎng)景,有效的落地事件流程可以快速體現(xiàn)IT部門(mén)價(jià)值,同時(shí)能為業(yè)務(wù)部門(mén)帶來(lái)顯著收益的一種方式。
在事件管理流程中,如何通過(guò)快速派單、快速解決等活動(dòng),實(shí)現(xiàn)“快速恢復(fù)服務(wù)至正常服務(wù)水平”的目標(biāo)?結(jié)合歷史經(jīng)驗(yàn)我們做一些簡(jiǎn)單的實(shí)踐分享。
01. 有效設(shè)置事件優(yōu)先級(jí)
如何有效確定優(yōu)先級(jí)是大部分IT管理者認(rèn)為最困難的事項(xiàng)。有效確定優(yōu)先級(jí)是按照事件對(duì)業(yè)務(wù)的影響來(lái)判斷的。優(yōu)先級(jí)的計(jì)算方式是:優(yōu)先級(jí) = 影響 x 緊急程度,緊急程度指的是事件必須在多快的時(shí)間內(nèi)得到解決,影響則是事件的影響面。
例如影響廣大用戶(hù)的核心業(yè)務(wù)系統(tǒng)的事件應(yīng)該始終排在第一位(即 1級(jí)),但是日常工作中普遍出現(xiàn)的事件通常是影響個(gè)別用戶(hù)的事件(通常是3級(jí)或者4級(jí))。
決定事件的嚴(yán)重性時(shí)需要考慮的一些問(wèn)題:
四個(gè)級(jí)別能夠適用于大部分組織,一般不會(huì)超過(guò)五個(gè),太多的級(jí)別會(huì)讓IT工程師在判定的時(shí)候難以抉擇。
示例:某個(gè)IT組織的優(yōu)先級(jí)策略
02. 提升時(shí)效控制
1)快速記錄
在事件管理中,想要實(shí)現(xiàn)事件的快速記錄,需要編制一個(gè)簡(jiǎn)單又信息完備的事件記錄單,并且結(jié)合工具的能力,使用結(jié)構(gòu)化字段和模板化的方式,完成事件的快速記錄。
2)快速轉(zhuǎn)派
確保和提升工作效率的核心能力在于快速有效地分派事件單。這涉及到依據(jù)事件的類(lèi)別進(jìn)行迅速識(shí)別,界定其與不同支持小組之間的關(guān)聯(lián),從而精準(zhǔn)地決定事件應(yīng)被分派給哪個(gè)處理團(tuán)隊(duì),以確保事件得到及時(shí)且專(zhuān)業(yè)的處理。
那如何編制這份事件分類(lèi)和小組映射的表格,以實(shí)現(xiàn)較好的效果呢?
事件的分類(lèi)使用IT團(tuán)隊(duì)內(nèi)部通用且互相認(rèn)可的描述,可以考慮按服務(wù)內(nèi)容分類(lèi),或按技術(shù)能力分類(lèi),以及按資源類(lèi)型分類(lèi)。如果難以開(kāi)始,可以考慮使用按照資源類(lèi)型或系統(tǒng)進(jìn)行分類(lèi),但是這種方式的技術(shù)語(yǔ)言中,對(duì)于最終用戶(hù)自行發(fā)起的事件,難以準(zhǔn)確判斷對(duì)應(yīng)的分類(lèi)。
映射的處理團(tuán)隊(duì)可以是小組,也可以是具體的人員,如果存在組內(nèi)多個(gè)人承擔(dān)相同的職責(zé)的情況下,可以到組,如果每個(gè)人的分工明確,就可以直接到人。
3)快速處理
快速處理事件是非常關(guān)鍵的一步,要想達(dá)到這個(gè)目標(biāo),有兩項(xiàng)必要的準(zhǔn)備工作,分別是“工具化”和“標(biāo)準(zhǔn)化”。
① 工具化指的是在處理的工作中,結(jié)合各種工具技術(shù),例如腳本、遠(yuǎn)程工具等。
② 標(biāo)準(zhǔn)化指的是使用SOP的方式,標(biāo)準(zhǔn)化記錄處理某些常見(jiàn)事件的固定操作步驟。
示例:服務(wù)器故障排除SOP
故障排除
當(dāng)服務(wù)器出現(xiàn)硬件故障,通過(guò)以下步驟排除:
4)快速關(guān)閉
事件單的關(guān)閉的前提是提交事件的用戶(hù)確認(rèn)事件已經(jīng)得到了解決,通過(guò)現(xiàn)代化工具中通常具備的郵件或IM工具的回訪方式,對(duì)于普通事件,設(shè)置默認(rèn)無(wú)回復(fù)關(guān)閉的期限(如3天);對(duì)于高優(yōu)先級(jí)事件采取人工一對(duì)一的方式進(jìn)行回訪。
03. 適當(dāng)?shù)纳?jí)事件
事件的升級(jí)分為技術(shù)升級(jí)和管理升級(jí),兩者互為補(bǔ)充。技術(shù)升級(jí)指的是當(dāng)前環(huán)節(jié)的工程師的技術(shù)水平無(wú)法滿足處理,需要升級(jí)至其他技能水平更高的人員或小組的升級(jí)方式。管理升級(jí)是指需要更高權(quán)限級(jí)別的管理人員介入確保更充足的資源的升級(jí)方式。
升級(jí)策略的目的是,對(duì)于不同優(yōu)先級(jí)的事件,確保分配到合適的資源進(jìn)行解決。因此需要定義事件升級(jí)的時(shí)間框架。當(dāng)達(dá)到某個(gè)時(shí)間點(diǎn)時(shí),如事件還未解決,將觸發(fā)相應(yīng)的事件升級(jí)路徑。
這個(gè)表中描述了針對(duì)某一級(jí)別的事件的各角色的處理時(shí)限要求,以及在其中做的努力程度描述。
以上是事件管理的部分經(jīng)驗(yàn),組織在可以結(jié)合這些方法,并結(jié)合現(xiàn)代化的技術(shù)能力進(jìn)行適當(dāng)?shù)恼{(diào)整和優(yōu)化,以達(dá)到事件管理的核心目標(biāo)。
CMDB治理:CMDB數(shù)據(jù)消費(fèi)與應(yīng)用指南
查看詳細(xì)
1分鐘解鎖開(kāi)箱即用價(jià)值流:研發(fā)效率飆升實(shí)戰(zhàn)指南
查看詳細(xì)
CCI持續(xù)集成平臺(tái):高效集成K8s集群,流水線容器構(gòu)建集群上線
查看詳細(xì)
嘉為藍(lán)鯨CCI持續(xù)集成平臺(tái):Matrix Job 帶你開(kāi)啟流水線編排 2.0 時(shí)代
查看詳細(xì)
告警管理:如何從零散事件中挖出關(guān)鍵信息
查看詳細(xì)
嘉為藍(lán)鯨CPack制品庫(kù):全新ML模型管理功能,助力AI交付與企業(yè)級(jí)DevOps實(shí)踐無(wú)縫結(jié)合
查看詳細(xì)
申請(qǐng)演示