有沒有發(fā)現(xiàn)他們的黑眼圈又深了一些?
3月3日凌晨,不少網(wǎng)友在微博上反映阿里云出現(xiàn)大規(guī)模宕機故障,波及華北一大批互聯(lián)網(wǎng)公司,APP和網(wǎng)站都癱瘓了,程序員們深夜被迫爬起來干活;一時之間程序員圈子里哀鴻遍野。
對此,阿里云官網(wǎng)凌晨2點37分發(fā)布公告稱,經(jīng)緊急排查處理后逐步恢復(fù)服務(wù)。針對本次故障,阿里云將根據(jù)SLA協(xié)議,盡快處理賠償事宜。
阿里云官方對IOHANG問題的原因語焉不詳,該回應(yīng)被搜狐網(wǎng)、金融界、新京報等四百多家網(wǎng)媒轉(zhuǎn)載,也沒有媒體對IOHANG一詞給出專業(yè)解釋,那么打敗了阿里云的高深莫測的IO HANG到底是什么?
什么是IO HANG
所謂IO HANG,就是云服務(wù)器的磁盤無響應(yīng),hang 就是停止響應(yīng),IOhang,就是指 I/O(輸入/輸,Input/Output)停止響應(yīng),或者說 IO 響應(yīng)變慢了,這意味著輸入輸出卡住了,無法使用存儲功能,這也就是很多公司反映 APP 卡頓的原因。
IO hang 一般非常的少見。類似的hang故障 還有,系統(tǒng) hang (系統(tǒng)停止響應(yīng)了),數(shù)據(jù)庫 hang 等,一般都是指的磁盤故障。
什么是SLA協(xié)議
那么,阿里云提到的根據(jù)SLA協(xié)議進行賠償,又是指什么?SLA(Service-LevelAgreement)即為服務(wù)水平協(xié)議或服務(wù)等級協(xié)議,是國際通行電信服務(wù)評估標準,是一種由服務(wù)供應(yīng)商與用戶簽署的法律文件,承諾只要用戶向服務(wù)供應(yīng)商支付相應(yīng)費用,就應(yīng)享受到服務(wù)供應(yīng)商提供的相應(yīng)服務(wù)。
SLA在國外已經(jīng)廣泛應(yīng)用,在國內(nèi),首先推行的是電信行業(yè),圍繞網(wǎng)絡(luò)維護的關(guān)鍵指標,如電路可用性、網(wǎng)絡(luò)性能、服務(wù)響應(yīng)時間、業(yè)務(wù)提供保證等,進行服務(wù)質(zhì)量、收費標準及賠付標準的承諾。 SLA以協(xié)議的形式詳細描述所提供的服務(wù)及未達到服務(wù)承諾時的賠付等。
在阿里云官網(wǎng)可以查閱到云服務(wù)器 ECS服務(wù)等級協(xié)議(SLA),受牽連的互聯(lián)網(wǎng)公司可以對照協(xié)議,琢磨下如何向阿里云索賠了。
阿里云此次宕機引起軒然大波,也與其龐大的用戶基數(shù)有關(guān)。根據(jù)市場調(diào)研機構(gòu)IDC發(fā)布的市場份額報告顯示,2018年阿里云市場份額占比45.5%,排名第一;騰訊云市場份額10.3%,排名第二;中國電信第三,份額7.6%。
服務(wù)器宕機事故頻發(fā)
據(jù)了解,這不是阿里云第一次出現(xiàn)宕機事故。
2018 年 6 月 27 日 16:21,阿里云也曾出現(xiàn)重大技術(shù)故障,16:50 分開始陸續(xù)恢復(fù),官方給出的故障時間為 30 分鐘左右,恢復(fù)時間大約花費一小時。經(jīng)過技術(shù)復(fù)盤,阿里給出的故障原因為工程師團隊上線自動化運維新功能時,執(zhí)行了一項變更驗證操作,該操作在測試環(huán)境中未發(fā)生問題,上線后觸發(fā)未知 bug。
放眼到全球,宕機事件不勝枚舉。僅2018年一年,全球主流云計算廠商曾發(fā)生數(shù)十起宕機事故,宕機原因更是五花八門:亞馬遜AWS稱因數(shù)據(jù)中心硬件問題導(dǎo)致宕機,微軟Azure數(shù)據(jù)中心則因高溫和打雷陷入宕機,騰訊云因運營和硬盤故障導(dǎo)致宕機,谷歌則因自動化失效陷入宕機。
如何避免宕機事故造成重大損失?有業(yè)內(nèi)人士稱,需要將重要業(yè)務(wù)分別放在不同的籃子里,也就是選擇多個供應(yīng)商,進行多云部署。不過,也有專家認為,多云部署,會帶來管理、開發(fā)、人員培訓(xùn)的復(fù)雜性,也可以選擇多區(qū)域部署的方式。
智慧城市的安全風(fēng)險
隨著網(wǎng)絡(luò)普及,我們的生活越來越便利,與此同時,捆綁在網(wǎng)絡(luò)上的生活,也變得越來越脆弱。
網(wǎng)絡(luò)襲擊已成為最新型的大規(guī)模攻擊性武器。甚至不用什么黑科技,只用最基礎(chǔ)的DDoS攻擊,就能制造一場災(zāi)難。
2016年10月21日,網(wǎng)絡(luò)主機公司Dyn遭遇大規(guī)模DDoS攻擊,使得很多使用Dyn服務(wù)的大型網(wǎng)站,全部癱瘓。其中,包括GitHub 、Twitter、Airbnb、Spotify、SoundCloud、Reddit等等,Dyn花了一整天才重新啟動服務(wù)器,這里面損失多少錢,恐怕難以估量。
當前,我國全速推進智慧城市建設(shè),物聯(lián)網(wǎng)與城市政務(wù)、環(huán)境、交通以及生活的各類基礎(chǔ)設(shè)施交融互聯(lián),全面感知城市動態(tài)。如果別有用心的黑客組織找到安全漏洞,完全可以通過網(wǎng)絡(luò),切斷水電、通信、交通,能源,從而把整個城市攻陷,這是比任何形式的戰(zhàn)爭成本都要低,效果卻極具毀滅性的“數(shù)字災(zāi)難”。
是等到災(zāi)害來臨時束手無策?
還是提前掌握主動權(quán),及時把控網(wǎng)絡(luò)安全態(tài)勢,監(jiān)管網(wǎng)絡(luò)安全風(fēng)險?
答案顯而易見。
及時掌握網(wǎng)絡(luò)安全態(tài)勢 盡在傻蛋網(wǎng)絡(luò)安全監(jiān)測系統(tǒng)
【網(wǎng)絡(luò)安全監(jiān)管部門】免費試用
本文來源:網(wǎng)絡(luò)
如涉及侵權(quán),請及時與我們聯(lián)系,我們會在第一時間刪除或處理侵權(quán)內(nèi)容。
電話:400-869-9193 負責(zé)人:張明