之前接到一位客戶咨詢,說自己是300人的公司,4名運(yùn)維人員。負(fù)責(zé)桌面支持,網(wǎng)絡(luò),視頻等所有it工作。有什么辦法能提高并量化it運(yùn)維效率。為他解答的過程自己也整理除了一些思考,和大家一起聊聊。
如這位咨詢者所描述的公司內(nèi)部IT運(yùn)維現(xiàn)狀,其實是一種很普遍地存在于各類中小型企業(yè)中的IT運(yùn)維挑戰(zhàn)。多數(shù)情況下,這4名運(yùn)維人員都是類似全棧工程師的角色,處理公司內(nèi)部的各類運(yùn)維問題。
員工大多數(shù)情況下以郵件或線下方式提出大量的服務(wù)請求,或者干脆找到自己熟悉的運(yùn)維人員口頭尋求幫助,久而久之,會進(jìn)入一種怪圈,即每個運(yùn)維工程師每天都會接收來自不同地方的大量服務(wù)請求,一整天都會十分地忙碌,但公司的同事卻始終對運(yùn)維部門所提供的服務(wù)不滿意,認(rèn)為自己的請求解決太慢,領(lǐng)導(dǎo)也對運(yùn)維部門不滿意,認(rèn)為看不到工作的成果與工作量的度量展現(xiàn),反而會聽到大量對運(yùn)維部門效率低下的抱怨。
出現(xiàn)這種怪圈的時候,證明公司的運(yùn)維管理已經(jīng)開始面對巨大的挑戰(zhàn),此時的運(yùn)維部門負(fù)責(zé)人甚至公司的CIO就要考慮如何考核IT人員工作量、提升IT問題處理效率,是時候開始重新規(guī)劃運(yùn)維部門的運(yùn)作方式了。
01. 業(yè)務(wù)戰(zhàn)略決定IT戰(zhàn)略
首先需要認(rèn)識到一點,企業(yè)的業(yè)務(wù)戰(zhàn)略會決定IT戰(zhàn)略,而IT戰(zhàn)略會決定我們運(yùn)維部門的最核心職能,如果不跳出怪圈,我們的運(yùn)維部門就會背離企業(yè)的IT戰(zhàn)略,從而不能服務(wù)于更高級別的企業(yè)戰(zhàn)略,拖累企業(yè)的發(fā)展。
從這位咨詢者的問題描述來看,該運(yùn)維部門的核心職能主要有兩點:一是保證公司IT業(yè)務(wù)系統(tǒng)的穩(wěn)定性與連續(xù)性(運(yùn)維的核心),二是保證有能力對公司各部門提供相應(yīng)IT服務(wù)(大量桌面運(yùn)維)。
想做到以上兩點,不妨利用業(yè)界通用的OASR模型,先梳理清楚我們擁有的運(yùn)維對象(Objects)、每天所需進(jìn)行的運(yùn)維活動(Activities)、由這些活動衍生出來哪些典型的運(yùn)維場景(Scenes)、以及完成這些場景所需的運(yùn)維角色(Roles)應(yīng)具備什么樣的能力。
就本運(yùn)維部門來看,所負(fù)責(zé)的運(yùn)維對象主要有基礎(chǔ)架構(gòu)、桌面端、各類賬號資源等,每天進(jìn)行的運(yùn)維活動就是對承載業(yè)務(wù)系統(tǒng)的IT資源進(jìn)行維護(hù),包括基礎(chǔ)資源的分配、應(yīng)用系統(tǒng)的監(jiān)控、部署等,同時承接大量的諸如賬戶開通、資產(chǎn)申請、桌面配置等桌面運(yùn)維所涉及的活動。
可以將上述活動歸結(jié)為資源運(yùn)維場景、桌面運(yùn)維場景這兩大類,而涉及到的角色就僧我們的四個運(yùn)維工程師,他們一定要具備相應(yīng)能力才能完成自己部門的核心職能。
一個好的運(yùn)維部門規(guī)劃應(yīng)該最大化的針對自身情況和人員能力做相應(yīng)的調(diào)整,而不應(yīng)該一股腦照搬一些運(yùn)維理論或者為了提升而專門用自身運(yùn)維團(tuán)隊去匹配某些固定場景、流程的運(yùn)維工具。
因此,根據(jù)OASR模型對運(yùn)維工作所做的梳理,可以提供三點最主要的改進(jìn)點,分別是:
1)組織保障
從該公司來看,因組織架構(gòu)簡單,只對人員做分工即可。這里推薦使用職能型的組織分工,各成員專注于自己的工作與任務(wù),有如下幾種分工方式做參考:
如果桌面運(yùn)維請求量特別多的話還可以變?yōu)閮擅烂孢\(yùn)維,2桌面,1基礎(chǔ)架構(gòu)/數(shù)據(jù)庫,1網(wǎng)絡(luò)/安全。這樣的分工可以在滿足內(nèi)部運(yùn)維場景的同時,讓各工程師有機(jī)會合理安排自己工作的優(yōu)先級,并且在自己的專業(yè)領(lǐng)域內(nèi)不斷深耕,更高質(zhì)量地完成自己的運(yùn)維工作,提高用戶對于其工作的滿意度。
由此引出在合理分工保證員工各司其職的同時,出于持續(xù)經(jīng)驗的考量,企業(yè)還應(yīng)建立相應(yīng)的職級與人才培養(yǎng)機(jī)制,初期可設(shè)立兩到三級(工程師、高級工程師、專家)的崗位職級,同時定期對其專業(yè)領(lǐng)域的工作做相應(yīng)技術(shù)培訓(xùn),確保其能力有一定冗余,能夠支撐企業(yè)業(yè)務(wù)發(fā)展和擴(kuò)張帶來的更大更復(fù)雜的IT運(yùn)維挑戰(zhàn)。
2)流程管控
同樣地,基于業(yè)界最佳實踐ITIL體系,我們要找到最適合企業(yè)現(xiàn)狀的調(diào)整策略,規(guī)劃活動藍(lán)圖,形成適合自己內(nèi)部情況的部門流程管理規(guī)劃。就本例來說,當(dāng)務(wù)之急是收斂服務(wù)入口、做出服務(wù)承諾(SLA)、度量運(yùn)維工作。
建立統(tǒng)一的服務(wù)臺門戶,讓用戶可以從服務(wù)臺處統(tǒng)一提單,服務(wù)目錄的設(shè)計方式可以根據(jù)兩大運(yùn)維場景進(jìn)行拓展,同時規(guī)定每種服務(wù)的響應(yīng)與處理時間。
可以讓桌面運(yùn)維的工程師負(fù)責(zé)一線和部分二線的服務(wù)請求,剩余的人作為二線處置人員,兼有一些三線專家的能力,最重要的是,服務(wù)臺一定要對所有服務(wù)請求做到閉環(huán)跟蹤,在保證服務(wù)滿意度的同時,方便后續(xù)進(jìn)行度量計算來評估工作質(zhì)量,如:是否滿足SLA的指標(biāo)要求,以及針對故障的MTTA、MTTR等。
值得一提的是,由于企業(yè)中經(jīng)常會遇到大量相似的IT問題,因此知識庫的建設(shè)必不可少,用戶如果可以有相應(yīng)的技術(shù)文章作為參考,可以自己處置大量常見的IT問題,這樣可以釋放部分桌面運(yùn)維人力到其他更需要專業(yè)技術(shù)的運(yùn)維工作中去,對此我們稱之為零線服務(wù)。
3)技術(shù)支撐
為了滿足資源運(yùn)維與桌面運(yùn)維兩大場景,以及針對公司的運(yùn)維流程管控,除人員能力外,我們一定要有相應(yīng)的技術(shù)工具去支撐這些運(yùn)維工作。
首先我們需要有靈活的流程工具去匹配流程管控的對應(yīng)功能要求,需要具備的功能主要有:
其次,針對運(yùn)維人員相對較少,卻需要管理整個企業(yè)的IT資源的情況,我們需要有具備自動化能力的一體化平臺去幫助工程師簡化操作難度,完成日常的資源運(yùn)維場景,該平臺需具備如下能力:
有了上述三點的改進(jìn),相信該咨詢者一定會在較短的時間內(nèi)看到運(yùn)維部門乃至整個公司的運(yùn)作效率有很大的改觀。
02. 咱們嘉為藍(lán)鯨是如何做的?
1)嘉為藍(lán)鯨一體化運(yùn)維平臺
嘉為藍(lán)鯨以騰訊藍(lán)鯨PaaS平臺為底座,構(gòu)建了一整套完整的運(yùn)維體系解決方案,其中不僅包括實現(xiàn)對應(yīng)運(yùn)維場景的SaaS應(yīng)用,還提供專業(yè)團(tuán)隊,輔以配套的輕咨詢、方案、測試、交付、售后及客戶成功整套服務(wù),幫助企業(yè)平穩(wěn)完成數(shù)字化轉(zhuǎn)型升級,以下為嘉為藍(lán)鯨產(chǎn)品地圖全貌:
除以上這些常見運(yùn)維場景外,憑借平臺強(qiáng)大地可擴(kuò)展能力,我們還可以快速構(gòu)建符合企業(yè)自身運(yùn)維場景的SaaS應(yīng)用,正所謂授人以魚不如授人以漁,通過雙方的共同努力,使運(yùn)維工作更好地服務(wù)于企業(yè)的IT戰(zhàn)略,甚至從成本中心轉(zhuǎn)變?yōu)檫\(yùn)營中心、利潤中心才是我們的共同目標(biāo),因此我們更愿意企業(yè)與我們一道加入整個藍(lán)鯨運(yùn)維開發(fā)的生態(tài),不斷發(fā)掘自身潛力,做到運(yùn)維自增長,通過雙方的努力,使整個運(yùn)維工作水平邁上自主可控的新臺階。
針對這位咨詢者的提問,嘉為藍(lán)鯨可以提供以下的產(chǎn)品及服務(wù)來實現(xiàn)我們的3點改善目標(biāo):
① 配置管理中心
上面提到的兩大運(yùn)維場景,資源運(yùn)維與桌面運(yùn)維,涉及的內(nèi)容歸根結(jié)底就是我們常說的IT服務(wù)管理與IT運(yùn)維管理,而這兩者的連接點就是配置管理中心,因此我們要首先構(gòu)建整個運(yùn)維工作的基石——配置管理中心(CMDB)。
根據(jù)企業(yè)內(nèi)部的常用業(yè)務(wù)系統(tǒng)分類,規(guī)劃整個業(yè)務(wù)系統(tǒng)的層級,將IT資源合理地劃分到各層級中,同時梳理運(yùn)維活動中所需的配置屬性并自動化維護(hù)起來,使得人員、系統(tǒng)不斷地去消費(fèi)并更新這些配置屬性,始終保持運(yùn)維配置主數(shù)據(jù)的高質(zhì)量性,這樣即使只有一兩個運(yùn)維人員也可以隨時清楚地知道企業(yè)所擁有資源的實時變動情況。
與此同時,規(guī)范的配置管理工作不僅能夠提高運(yùn)維工作的效率,使自動化操作成為可能,還可以通過周報、月報、統(tǒng)計度量的方式,去量化運(yùn)維人員的工作成果,滿足管理者的管理需求。
② 可觀測中心
在將資源納管到我們的CMDB中之后,離不開的便是我們的“運(yùn)維之眼”——可觀測中心。
在一個四個人組成的運(yùn)維團(tuán)隊中,做到專門有人實時利用多種監(jiān)控工具去感知系統(tǒng)狀態(tài)是不現(xiàn)實的,因此如何快速發(fā)現(xiàn)有效告警并及時處理,這部分工作很大程度上就要依靠統(tǒng)一的可觀測中心去實現(xiàn)。
嘉為藍(lán)鯨依托多年在運(yùn)維領(lǐng)域深耕的經(jīng)驗,按照數(shù)據(jù)中心層次劃分,從縱向構(gòu)建了豐富完整的指標(biāo)體系,同時還可以利用日志工具、服務(wù)可觀測工具,建立功能齊備的可觀測中心,實時感知業(yè)務(wù)系統(tǒng)狀態(tài)。
當(dāng)然,發(fā)現(xiàn)問題不是目的,快速形成事件處理閉環(huán)才是我們實現(xiàn)部門“保障穩(wěn)定性”職能的本質(zhì)目的,因此,從橫向構(gòu)建對于告警事件的全生命周期管理才是最終實現(xiàn)監(jiān)控價值的有效方式,嘉為藍(lán)鯨告警中心提供告警事件全生命周期閉環(huán)管理,可與工單系統(tǒng)無縫聯(lián)動,有效計算MTTA、MTTR等指標(biāo),保障企業(yè)業(yè)務(wù)平穩(wěn)運(yùn)行。
③ IT服務(wù)管理中心
實現(xiàn)對于企業(yè)流程管控的要求,我們就必須利用相應(yīng)的流程管理工具——IT服務(wù)管理中心去支撐。第一部分我們提到,想要規(guī)范運(yùn)維部門對外提供服務(wù)的方式,就一定要提供統(tǒng)一的服務(wù)入口,嘉為藍(lán)鯨可以根據(jù)不同用戶設(shè)置不同門戶界面,開放不同服務(wù)權(quán)限,滿足企業(yè)對于不同部門的IT服務(wù)要求。
同時平臺具備畫布式靈活編排的能力,匹配不同企業(yè)個性化的流程需求,還可以提供知識庫服務(wù),讓用戶在提單時自動發(fā)現(xiàn)可能的解決方案,減少重復(fù)的基礎(chǔ)IT請求,除此之外還有SLA、值班表等IT服務(wù)管理常見工具來完善整個的IT服務(wù)治理。
針對領(lǐng)導(dǎo)關(guān)心的運(yùn)維人員工作量度量問題,我們還可以提供相應(yīng)指標(biāo)如服務(wù)請求、事件管理、問題管理績效指標(biāo)來度量運(yùn)維人員的工作情況,體現(xiàn)運(yùn)維的價值。
④ 自動化中心
為了使4個運(yùn)維人員完成整個企業(yè)的IT運(yùn)維工作,除了上述三個中心之外,平臺一定要具備的就是串聯(lián)各中心的自動化能力——自動化中心。
對于腳本執(zhí)行、文件下發(fā)、巡檢等日常運(yùn)維操作,或者日志空間將滿、服務(wù)進(jìn)程重啟等常見故障恢復(fù)動作,如果沒有自動化方式去執(zhí)行,將占據(jù)運(yùn)維人員大量的時間去手動完成許多機(jī)械、重復(fù)的作業(yè),往往還會因為疲勞導(dǎo)致一些不該發(fā)生的誤操作。
同時現(xiàn)在企業(yè)的IT多以應(yīng)用為中心,針對應(yīng)用的大量復(fù)雜操作都有比較長的流程,其中涉及多個系統(tǒng)聯(lián)動,如應(yīng)用發(fā)布、災(zāi)備切換演練等,這些如果沒有統(tǒng)一的自動化流程去規(guī)范和沉淀,很容易發(fā)生一些本不會發(fā)生的生產(chǎn)故障,敏捷時代,每天大量的變更發(fā)布已經(jīng)不是人力所能解決的問題,沒有自動化能力的支撐,運(yùn)維人員將很難獨立的完成這些運(yùn)維活動。
2)完整的解決方案服務(wù)體系
① 豐富的配套服務(wù)(咨詢、培訓(xùn)、大運(yùn)維)
上面提到,嘉為藍(lán)鯨不僅提供產(chǎn)品來滿足運(yùn)維場景的功能需求,同時提供完整的解決方案來滿足企業(yè)的需要,其中常見服務(wù)有咨詢、培訓(xùn)以及針對該企業(yè)類似規(guī)模的大運(yùn)維服務(wù),來保證我們的客戶取得IT的成功。
針對常見的運(yùn)維場景,如CMDB建設(shè)、ITSM建設(shè)等,提供相應(yīng)的輕咨詢服務(wù),幫助企業(yè)落地完整的建設(shè)管理體系,建的好,更要用的好。
針對類似咨詢者公司的情況,同為我們集團(tuán)的嘉為教育還可以提供相應(yīng)能力提升課程的售賣,滿足組織保障中對于能力提升的要求,如果類似公司還有大量桌管需求,我們還可以提供諸如SCCM的大運(yùn)維服務(wù),全方位滿足對于企業(yè)運(yùn)維部門運(yùn)作方式提升的要求!
② 全行業(yè)落地實踐(核心價值)
在運(yùn)維行業(yè)深耕20余年,利用豐富的行業(yè)經(jīng)驗,我們在大量頭部客戶側(cè)落地了嘉為藍(lán)鯨一體化運(yùn)維平臺,幫助客戶實現(xiàn)了高質(zhì)量、高效率、高可靠、低成本的運(yùn)維價值,在接下來的日子里我們希望與更多客戶建立共同目標(biāo)并為之努力,期待您的垂詢!
CMDB治理:CMDB消費(fèi)場景規(guī)劃指南
查看詳細(xì)
CTest測試管理平臺:上新用例結(jié)構(gòu)化設(shè)計
查看詳細(xì)
CCode代碼管理平臺:代碼合并前CI任務(wù)狀態(tài)校驗
查看詳細(xì)
嘉為藍(lán)鯨WeOps:高效監(jiān)控Kubernetes集群的三大關(guān)鍵點
查看詳細(xì)
CFlow價值流管理平臺:從流程線上化到價值可視化,研運(yùn)黑盒破解之道
查看詳細(xì)
CPack制品庫:制品黑白名單,為軟件供應(yīng)鏈安全護(hù)航
查看詳細(xì)
申請演示