一份令人警醒的網(wǎng)絡重大故障報告
數(shù)字證書過期了,為什么沒有及早發(fā)現(xiàn)?
軟銀解釋到,該分組交換設備的數(shù)字證書不同于其他網(wǎng)絡設備。
通常,對于其他網(wǎng)絡設備,我們在購買設備后,是可以自行確認數(shù)字證書到期時間的。
但分組交換設備的數(shù)字證書是通過嵌入式軟件固化在相應硬件里的,作為運營商,我們無法確認到期時間。
解決措施
臨時解決措施
本次故障是由2018年4月升級的Ver.1.14版本引起,而之前的Ver.1.08版本沒有問題,因此,臨時解決措施是從Ver.1.14版本回滾到Ver.1.08版本,但這會導致一些4G物聯(lián)網(wǎng)功能無法使用。
中期解決措施
1. 全網(wǎng)普查所有設備的相關證書是否到期,包括全網(wǎng)基站設備。
2. 制定更加嚴格的新設備和新軟件版本入網(wǎng)測試規(guī)范。
3. 要求在設備升級后一年內(nèi),保留舊版本軟件,以在新版軟件出現(xiàn)類似問題后,快速回滾到舊版本。
永久性措施
1. 要求以后所有購買的網(wǎng)絡設備和軟件,運營商均可自行檢查數(shù)字證書是否到期。
2. 更改系統(tǒng)異常檢測和應急機制,當系統(tǒng)檢測到網(wǎng)絡異常時,不再只是重啟恢復,而是設置異常告警級別,根據(jù)門限判定是重啟還是繼續(xù)運行。
3. 由于引起本次重大事故的原因之一是由于所有設備都來自同一家供應商,因此,要求在2019年6月30日之前引入多家設備供應商,以分散風險。
看完軟銀的故障報告,感覺是字里行間透露出一萬個“萬萬沒想到”,盡管各種備份容災都做到位了,但意外還是發(fā)生了。真是網(wǎng)絡安全無小事,運維責任重如山,令人警醒。(作者:網(wǎng)優(yōu)雇傭軍)
請輸入評論內(nèi)容...
請輸入評論/評論長度6~500個字
圖片新聞
最新活動更多
- 高級軟件工程師 廣東省/深圳市
- 自動化高級工程師 廣東省/深圳市
- 光器件研發(fā)工程師 福建省/福州市
- 銷售總監(jiān)(光器件) 北京市/海淀區(qū)
- 激光器高級銷售經(jīng)理 上海市/虹口區(qū)
- 光器件物理工程師 北京市/海淀區(qū)
- 激光研發(fā)工程師 北京市/昌平區(qū)
- 技術專家 廣東省/江門市
- 封裝工程師 北京市/海淀區(qū)
- 結(jié)構(gòu)工程師 廣東省/深圳市