[No.H001]
一場數(shù)據(jù)中心大火,直接蒸發(fā)2萬億韓元市值,至少84%的國民受到影響,CEO引咎辭職,還不包括各種連帶及潛在損失...
這就是近日發(fā)生在韓國的“互聯(lián)網(wǎng)大癱瘓”事件。
國民App中斷10小時
起因只是一個鋰電池
10月15日下午3:33分,位于首爾的SK C&C數(shù)據(jù)中心大樓發(fā)生火災,該大樓管理著社交軟件Kakao、門戶網(wǎng)站Naver等核心平臺運營商的數(shù)據(jù)。大火導致Kakao出現(xiàn)登錄問題和消息傳遞失敗,而Naver的一些服務也出現(xiàn)故障,包括搜索、新聞和購物等。
Kakao在韓國擁有4300-4700萬的活躍用戶(韓國全國人口約為5100萬),涵蓋即時通訊、移動支付、在線交易、在線地圖和打車等功能,堪稱是韓國的“國民社交軟件”。
而Naver也被稱為“韓國版百度”,同樣擁有大量用戶。因此當兩家公司的數(shù)據(jù)中心同時發(fā)生火災后,直接導致了韓國互聯(lián)網(wǎng)服務大面積癱瘓。
然而事件的原因,僅僅是因為鋰電池導致。
據(jù)韓國警方消息,起火地點為數(shù)據(jù)中心A棟地下3層電氣室的鋰電池架附近。電源堆放在五個電池架上,事發(fā)時,其中一個鋰電池產(chǎn)生了火花并引發(fā)火災。
而在經(jīng)過10個小時的中斷后,Kakao的部分功能終于開始恢復。
顯而易見的是,這起事件對依賴Kakao服務的數(shù)千萬用戶(包括公司和小企業(yè))產(chǎn)生了廣泛的影響,其中許多人正在考慮對這家科技公司提起集體訴訟,要求賠償在停電期間遭受的損失。Kakao自身也遭受了巨大損失,Kakao的股價周一(17日)蒸發(fā)2萬億韓元(約101億元人民幣)市值,其聯(lián)席CEO南宮勛(音)宣布引咎辭職。
此外,韓國政府突擊搜查了SK C&C的總部,以尋找數(shù)據(jù)中心火災背后的真正原因,這促使政府加大對數(shù)據(jù)中心的審查力度,并對該國的數(shù)據(jù)中心制定更多法規(guī)。
兩年3起數(shù)據(jù)中心大火
大量數(shù)據(jù)中心存在火災隱患?
“Kakao一停,大韓民國就停止了”。
從工作到生活,對于今天高度依賴互聯(lián)網(wǎng)的我們來說,這起事件一度引發(fā)了人們的思考,比如是否應該重度依賴個別App?不過今天我們不談這個,還是說說和企業(yè)級相關的,因為有許多IT人士開始擔心,是否數(shù)據(jù)中心大量存在火災隱患?
這起事件,已經(jīng)是近兩年內(nèi)的第3起數(shù)據(jù)中心大火。
●今年8月,一個位于英國的谷歌數(shù)據(jù)中心,就因電氣爆炸而起火,三名在數(shù)據(jù)中心附近的變電站工作的員工受傷。
●2021年,一場大火完全摧毀了OVH在法國的一個數(shù)據(jù)中心,并部分損壞了另一個數(shù)據(jù)中心,所幸無人受傷。
而從數(shù)據(jù)上看,發(fā)生數(shù)據(jù)中心火災的事故是十分罕見的。
據(jù)Uptime Institute稱,自1994年以來,該機構成員共享的8000起異常事件中,其中僅記錄了11起數(shù)據(jù)中心火災,即每年不到0.5起。從2016年到2020年,該機構的數(shù)據(jù)庫僅有13條公開報告的火災造成的停電記錄。
雖然僅僅從這兩年發(fā)生的數(shù)據(jù)中心火災事件來看,我們還不能斷言相關事件正在呈上升趨勢,但此類事件依然也給我們敲響了警鐘,因為一旦發(fā)生,其后果通常是毀滅性的。
為了降低數(shù)據(jù)中心發(fā)生火災的風險,Uptime Institute提供了以下三條建議:
1.檢測:使用 VESDA(非常早期的煙霧探測設備)系統(tǒng)。在火災隱患產(chǎn)生的初期盡早地發(fā)現(xiàn)火情,從而避免火災損失的發(fā)生或把損失減低到最小限度
2.滅火:確保適當?shù)姆阑鹌琳虾拖到y(tǒng)隔離到位,并始終保持滅火系統(tǒng)得到良好的維護。
3.緩解:進行定期風險評估,以識別和解決這些系統(tǒng)的任何問題。
除了采取所有必要的檢測、滅火和緩解措施外,數(shù)據(jù)中心的運行還必須制定穩(wěn)健的災難恢復計劃,包括備份、復制和恢復程序,以及確�?焖夙憫涂焖倩謴偷牧鞒痰姆⻊蘸瓦\營。
災難恢復
怎么強調(diào)都不為過
說起災難恢復,一定會有人覺得老生常談。但一次次慘痛的教訓告訴我們,災難恢復,怎么強調(diào)都不為過。
韓國的這起火災事件中,就讓我們看到了一個鮮明的對比。
因SK C&C數(shù)據(jù)中心大樓火災,而受影響的兩家公司——Naver和Kakao。前者雖然也發(fā)生了業(yè)務停頓,但由于公司有異地備份,它們在幾個小時內(nèi)就恢復了。而另一方面,Kakao沒有災難恢復計劃或備份站點,導致了長達數(shù)天的中斷。
盡管Kakao表示,一旦數(shù)據(jù)中心全面投入運營,它將在兩個月內(nèi)建立冗余,以防止類似的中斷。但這一切,都是在巨大損失之后...
在企業(yè)和個人高度依賴互聯(lián)網(wǎng)的今天,值得肯定的是,許多企業(yè)用戶已經(jīng)認識到了數(shù)據(jù)安全的重要性,也在采取各種措施來確保業(yè)務連續(xù)性,比如通過云上數(shù)據(jù)保護。
然而需要明確的是,在公有云中備份了數(shù)據(jù),是不是就可以高枕無憂?顯然不是!如果只有唯一一份數(shù)據(jù)備份副本,萬一這份數(shù)據(jù)遭受破壞,企業(yè)用戶恢復數(shù)據(jù)就無法實現(xiàn)。在容災環(huán)境下,云上和云下的網(wǎng)絡連通,如果云上環(huán)境讓黑客突破了,云下的設施一樣暴露在網(wǎng)絡攻擊之下。
因此,終極的數(shù)據(jù)保護手段應該是:
1、 云下數(shù)據(jù)中心建立CR保險庫,設置邏輯彈性網(wǎng)閘與生產(chǎn)網(wǎng)絡隔離;
2、 每天把已下云的關鍵備份數(shù)據(jù)復制到CR保險庫;
3、 對保險庫的數(shù)據(jù)上鎖,生成不可篡改版本,并在隔離區(qū)對數(shù)據(jù)進行掃描和偵測,分析數(shù)據(jù)是否受感染;
4、 對數(shù)據(jù)副本進行完整性驗證。
基于上面的上述數(shù)據(jù)安全保護思路,戴爾科技集團在業(yè)界首次提出的“三位一體”數(shù)據(jù)保護方案,實現(xiàn)“BR”+”DR”+”CR”的全面數(shù)據(jù)保護體系,為企業(yè)用戶提供安全可靠的網(wǎng)絡彈性解決方案。
BR:Backup and Recovery,所有數(shù)據(jù)需要做備份
DR:Disaster Recovery(備份數(shù)據(jù)下云),重要數(shù)據(jù)需要復制下云
CR:Cyber Recovery,關鍵數(shù)據(jù)需要做網(wǎng)絡彈性保護
建設“三位一體”數(shù)據(jù)保護方案,離不開戴爾科技集團在數(shù)據(jù)保護領域的強大技術實力,無論云上還是云下,無論多云還是混合云,戴爾都有相應的產(chǎn)品可以提供,從而為企業(yè)用戶實現(xiàn)完整、安全和可靠的數(shù)據(jù)保護體系。
例如在多云數(shù)據(jù)保護方面,戴爾已經(jīng)與AWS、Azure、谷歌云等多個公有云廠商建立了合作,既能將本地的數(shù)據(jù)歸檔和備份到云,也能在公有云上提供云內(nèi)備份,構建云端的備份容災方案。當需要滿足合規(guī)要求時,也可以將備份放到本地環(huán)境。
在國內(nèi),戴爾也與阿里云進行了合作,其云分層技術(Cloud Tier)已經(jīng)正式支持阿里云,用戶可以將數(shù)據(jù)無縫、高效地從PowerProtect DD和集成式數(shù)據(jù)保護應用裝置(IDPA)系統(tǒng),通過云分層的方式遷移至阿里云平臺,從而幫助用戶以更高性價比,實現(xiàn)更有效的數(shù)據(jù)備份和管理效率。
榜單收錄、高管收錄、融資收錄、活動收錄可發(fā)送郵件至news#citmt.cn(把#換成@)。
海報生成中...