隨著互聯網飛速發(fā)展,簡單的運維實施已經無法滿足企業(yè)的實際業(yè)務環(huán)境,應對一系列挑戰(zhàn),系統(tǒng)管理員在企業(yè)中容易出現:
● 隨著系統(tǒng)的復雜度提升,組建越來越多,用戶的流量壓力也越來越大,相關的變更也會越來越多,各模塊之間的變更順序也會越來越復雜。在這樣的情況下,單純的靠運維人力的數量提升無法滿足業(yè)務的發(fā)展需求,而且會提升企業(yè)的成本;
● 傳統(tǒng)的研發(fā)團隊和運維團隊天然具有沖突。公司的IT人員的配置:研發(fā)(Dev)和運維(Ops),研發(fā)部門聚焦在快速構建和快速發(fā)布;運維部門關注的是如何避免發(fā)生故障,從目標上講就是矛盾的。且隨著 IT 技術的發(fā)展,對 IT 從業(yè)者的要求也越來越高,既要懂得底層系統(tǒng),也要懂得數據算法,同時對主流技術還要快速追趕,滿足這樣要求的人才太少;
● 生產工具為適配生產力發(fā)展的必然產物。為了提高IT行業(yè)的整體效率和質量,使得從手工運維時代,逐漸過度到腳本工具運維,在發(fā)展到平臺數據運維,再到平臺軟件運維,在發(fā)展到智能自動化運維。通過一系列手段、工具、理念的進步,將 Ops 技術發(fā)展到 DevOps、DataOps、AIOps 等;
SRE+(Site Reliability Engineer)云計算工程師便應運而生。由此也倒逼了運維在業(yè)務、人員素質、技術上的革新。于是,SRE工程師便有了存在的意義。