供電、系統(tǒng)、網(wǎng)絡(luò)、制冷——2020年數(shù)據(jù)中心宕機(jī)四大主因
近日,Uptime Institute發(fā)布了2020年度數(shù)據(jù)中心掉線(xiàn)調(diào)查報(bào)告。報(bào)告結(jié)果并不意外,供電、系統(tǒng)、網(wǎng)絡(luò)、制冷等四大因素依舊是宕機(jī)的最常見(jiàn)因素。
數(shù)據(jù)顯示,在2020年發(fā)生的數(shù)據(jù)中心故障中,大約有37%與電源有關(guān),22%與軟件、系統(tǒng)相關(guān),17%與網(wǎng)絡(luò)有關(guān),其次則為13%問(wèn)題來(lái)自制冷系統(tǒng)的故障。
值得注意的是,雖然供電排在數(shù)據(jù)中心故障前列,但近年來(lái)的眾多事故表明,網(wǎng)絡(luò)和軟件系統(tǒng)造成的故障往往是更深遠(yuǎn)的影響。
一方面的原因是近年來(lái)電力供應(yīng)可靠性在逐年提升,數(shù)據(jù)中心也往往更加重視配電系統(tǒng)的穩(wěn)定性。一旦出現(xiàn)意外斷電事故,數(shù)據(jù)中心往往可以在很短的時(shí)間進(jìn)行修復(fù)、替代。在很多電力系統(tǒng)故障的事故中,數(shù)據(jù)中心的IT與制冷系統(tǒng)都運(yùn)行正常。
另一方面隨著云計(jì)算、大數(shù)據(jù)、智能運(yùn)維等技術(shù)的普及和深入,愈發(fā)復(fù)雜的IT環(huán)境導(dǎo)致了IT、網(wǎng)絡(luò)問(wèn)題的增多。而軟件和網(wǎng)絡(luò)故障,常常會(huì)導(dǎo)致服務(wù)中斷,甚至出現(xiàn)數(shù)據(jù)風(fēng)險(xiǎn)。