背景和挑戰
隨著(zhu)保(bao)險(xian)業務(wu)(wu)(wu)的(de)不斷發展(zhan)、規(gui)模逐漸(jian)壯(zhuang)大(da),應(ying)用逐步微(wei)服務(wu)(wu)(wu)化、核(he)心業務(wu)(wu)(wu)系(xi)統相繼(ji)上云,以及業務(wu)(wu)(wu)系(xi)統上線的(de)高頻(pin)次(ci)需求(qiu),給IT運維支撐帶來了非常大(da)的(de)挑戰。同時,傳(chuan)統豎井(jing)的(de)專業組、點(dian)對點(dian)式運維模式,對如何保(bao)障應(ying)用的(de)高質量穩(wen)定性、業務(wu)(wu)(wu)的(de)高度連續性、應(ying)對新技術棧的(de)管理等(deng)都帶來了巨大(da)的(de)壓力(li)。
技術壓力
云化后技術架構復雜、技術棧驟增,導致運維難度成倍增加。故障發現/定位/解決能力的覆蓋全面性及深度愈發困難。
管理壓力
不同監控告警系統同時分散運行,形成數據孤島,無法及時有效地發現和定位問題。各部門人員獨自為戰,橫向管理成本過高。
業務壓力
業務上線的“高發布率、高穩定性”給運維人員帶來巨大挑戰,對于業務運行的連續性提出了更高的要求。
人員壓力
原有運維人員技能無法滿足云化后的運維開發需求,運維操作技能單一、運維思維固化,人力成本逐年上升。