近日,騰訊云的客戶北京清博數控科技有限公司所屬“前沿數控”平臺一塊操作系統云盤發生故障,導致文件系統元數據損壞。
騰訊方面提出了總金額136,469元的“賠償+補償”解決方案,前沿數控則索賠11,016,000元,被騰訊認為過高,雙方未達成一致。
現在,騰訊云發布了一份關于客戶“前沿數控”數據完整性受損的技術復盤,對客戶業務所受影響表示誠摯歉意的同時,詳細解釋了此次故障發生的根源,以及將采取的措施。
騰訊云經過復盤發現,故障緣起于因磁盤靜默錯誤導致的單副本數據錯誤,再加上數據遷移過程中的兩次不規范的操作,導致云盤的三副本安全機制失效,并最終導致客戶數據完整性受損。
當天上午11:57,騰訊云運維人員收到倉庫I空間使用率過高告警,準備發起搬遷擴容。
14:05,運維人員從倉庫I選擇了一批云盤搬遷至新倉庫II,為了加速搬遷,手動關閉了遷移過程中的數據校驗。
20:27,搬遷完成之后,運維人員將客戶的云盤訪問切至倉庫II,同時為了釋放空間,對倉庫I中的源數據發起了回收操作。
騰訊表示,數據搬遷過程中的違規操作主要如下兩點:
第一是正常數據搬遷流程默認開啟數據校驗,開啟之后可以有效發現并規避源端數據異常,保障搬遷數據正確性,但是運維人員為了加速完成搬遷任務,違規關閉了數據校驗;
第二是正常數據搬遷完成之后,源倉庫數據應保留24小時,用于搬遷異常情況下的數據恢復,但是運維人員為了盡快降低倉庫使用率,違規對源倉庫進行了數據回收。
因這些錯誤操作的連續影響,導致該客戶數據完整性受損,給客戶的正常業務運行造成影響,騰訊云再次表示最誠懇的歉意。
改進措施方面,騰訊云提出了兩點:
首先,將全面審視所有的數據流程,涉及數據安全的流程自動化閉環,進一步提升常規運維自動化和流程化,降低人工干預,同時把全流程的數據安全校驗作為系統的常開功能,不允許被關閉。
其次,針對物理硬盤靜默數據錯誤,在當前用戶訪問路徑數據校驗自愈的基礎上,優化現有巡檢機制,通過優先巡檢主副本數據塊、跳過近期用戶訪問過的正確數據塊等方法,加速發現該類錯誤,進行數據修復。
另外,騰訊云建議用戶開啟免費的快照功能,對重要數據進行定期備份。
對于索賠和賠償問題,騰訊云暫未披露更多進展。
責任編輯:陳錦娜
特別聲明:本網登載內容出于更直觀傳遞信息之目的。該內容版權歸原作者所有,并不代表本網贊同其觀點和對其真實性負責。如該內容涉及任何第三方合法權利,請及時與ts@hxnews.com聯系或者請點擊右側投訴按鈕,我們會及時反饋并處理完畢。
- 騰訊云數據丟失怎么辦?騰訊云回應用戶數據丟失怎么解決2018-08-07
- 騰訊云被用戶索賠1100萬 騰訊云硬盤Bug致文件損壞機率大嗎?2018-08-06
- 騰訊云回應用戶數據丟失說了什么 騰訊云用戶數據丟失是怎么回事2018-08-06
- 最新科技數碼 頻道推薦
-
微軟禁過愚人節是怎么回事 愚人節弊大于利嗎2019-03-31
- 進入圖片頻道最新圖文
- 進入視頻頻道最新視頻
- 一周熱點新聞


已有0人發表了評論