摘要:?數(shù)據(jù)存儲是各類應用的核心,它決定著應用的生死存亡。所存儲的數(shù)據(jù)的安全性,與上層應用的安全性、可靠性、可用性息息相關。應用層的Bug、運維人員的誤操作、不可預知的環(huán)境因素,都有可能會危及數(shù)據(jù)的完整性與可用性,進而導致應用的不可用。
數(shù)據(jù)存儲是各類應用的核心,它決定著應用的生死存亡。所存儲的數(shù)據(jù)的安全性,與上層應用的安全性、可靠性、可用性息息相關。應用層的Bug、運維人員的誤操作、不可預知的環(huán)境因素,都有可能會危及數(shù)據(jù)的完整性與可用性,進而導致應用的不可用。無數(shù)次的運維人員誤刪數(shù)據(jù)庫、硬盤損壞、施工挖斷電纜,正向我們展示了數(shù)據(jù)存儲的脆弱性,也警示著我們要時刻關注數(shù)據(jù)安全性問題。而備份,則是提升數(shù)據(jù)安全性的重要手段之一,它可以以額外的存儲空間、帶寬消耗以及CPU消耗來換取更高的數(shù)據(jù)安全性。
阿里云文件存儲(NAS,Network Attached Storage)是一種分布式的網(wǎng)絡文件存儲系統(tǒng),為ECS、HPC、Docker、Batch Compute等提供安全、無限容量、高性能、高可靠、簡單易用的文件存儲服務。
作為直接支持用戶應用的存儲服務,NAS在數(shù)據(jù)可用性、數(shù)據(jù)可靠性、數(shù)據(jù)安全性上進行了大量的開發(fā)、優(yōu)化與支持,并提供了一系列的服務幫助用戶更好地了解他們的數(shù)據(jù)、管理他們的數(shù)據(jù)。備份服務是NAS提供的諸多功能之一,以幫助用戶進一步提高他們的數(shù)據(jù)安全性,使得數(shù)據(jù)不再畏懼于天災或者人禍。目前,NAS備份服務還處于公測當中,正式版本的備份服務也在緊張的設計與開發(fā)當中。接下來,本文將介紹NAS正在公測的備份服務的使用方法與典型實踐。
NAS備份服務架構
NAS備份服務架構如圖所示:

Backup Service會根據(jù)Backup Plan來將任務下發(fā)到Backup Executor,Backup Executor會將待備份文件系統(tǒng)的數(shù)據(jù)從一個可用區(qū)傳輸?shù)搅硗庖粋€可用區(qū)中。
備份實踐
在對數(shù)據(jù)進行備份時,我們需要考慮三個問題:
備份的觸發(fā):我們在什么情況下需要進行一次備份?
備份的歷史變更:一系列備份后形成的版本歷史線。
備份的使用:主數(shù)據(jù)出現(xiàn)問題時,我們需要從備份版本歷史線中選出一個版本,并進行恢復。
我們將從這三個維度來介紹NAS備份服務的使用與實踐。
備份的觸發(fā)
新建備份時,用戶可以指定文件系統(tǒng)的備份觸發(fā)策略,備份觸發(fā)策略由兩個參數(shù)值確定:備份開始時間與備份間隔時間。備份開始時間指定了備份操作第一次被觸發(fā)的時間,備份間隔時間指定了上一次備份完成后下一次備份執(zhí)行的時間。兩個值協(xié)同起來,定義了時間維度上一系列備份的觸發(fā)。那么,我們應該如何設置這兩個值呢?
NAS備份服務在對源文件系統(tǒng)進行備份時,會發(fā)生數(shù)據(jù)傳輸,而數(shù)據(jù)傳輸?shù)倪^程會消耗一定的CPU與帶寬。為了避免影響用戶的正常服務,備份服務會對整個備份過程進行流控。另一方面,整個過程視源文件系統(tǒng)的大小而消耗不同的時間。顯然,備份服務會對源文件系統(tǒng)的IOPS與帶寬有略微的消耗。如果希望完全避免備份服務對文件系統(tǒng)正常服務的影響,我們需要精心設置備份開始時間與備份間隔時間。一種可行的方法是將備份開始時間設置為00:00,將間隔時間設置為24小時。這樣,備份服務會總是在業(yè)務壓力較小的凌晨運行,從而做到普通用戶無感知。
除了自動觸發(fā)備份外,NAS備份服務還提供了手動觸發(fā)備份,給用戶以最大的靈活性來進行數(shù)據(jù)備份。
備份歷史
每一次的備份運行,都會生成文件系統(tǒng)的一個實時備份,一系列的備份組成了文件系統(tǒng)的一個備份歷史。我們在創(chuàng)建備份時,可以設置備份保留份數(shù)。顯然,保留的份數(shù)越多,當系統(tǒng)不幸出現(xiàn)數(shù)據(jù)損壞時,我們可以追溯的時間越久,我們甚至可以追溯到數(shù)天、數(shù)周、甚至數(shù)月以前的數(shù)據(jù)。然而,備份需要消耗大量的存儲資源,保留的備份份數(shù)越多,所付出的成本也就越大。當然,目前正在公測中的NAS備份服務是完全免費的。為了在數(shù)據(jù)安全性與成本之間做出妥善的權衡,我們需要認真思考備份開始時間、備份間隔時間、備份保留份數(shù)。一個可行的方案是每天凌晨備份一次,保留三份備份。這種設置可以將備份對業(yè)務的壓力降到最低,同時,在數(shù)據(jù)出現(xiàn)故障時,留給運維人員一定的時間(三天)去發(fā)現(xiàn)它,并進行恢復。
備份恢復
當主數(shù)據(jù)不幸出現(xiàn)故障而被損壞時,我們需要使用備份過的副本進行恢復。數(shù)據(jù)恢復涉及到線上數(shù)據(jù)的變更,這是一個高危操作,操作失誤可能會誤覆蓋掉線上正確的數(shù)據(jù)。為了盡可能的避免運維人員此類誤操作,NAS備份服務對備份恢復添加了較為嚴格的限制:恢復的目標文件系統(tǒng)必須是一個空文件系統(tǒng)。這種強制限制為用戶提供了多一次的思考機會,并且在很大程度上杜絕了運維人員覆蓋其他可用線上數(shù)據(jù)的情況。
備份服務使用示例
下面演示NAS備份服務的使用方法。
申請公測資格
創(chuàng)建備份任務

手動觸發(fā)一次備份(一般不需要,自動觸發(fā)足夠了)

查看備份進度


數(shù)據(jù)恢復

結語
數(shù)據(jù)可靠性、可用性、安全性是用戶應用的生死線,阿里云文件存儲致力于為用戶提供高性能、高一致性的共享文件存儲服務,同時,數(shù)據(jù)可靠性、可用性、安全性也是我們從不妥協(xié)的底線,我們將一直心懷敬畏、砥礪前行,為用戶提供更好、更強、更宜用的文件存儲服務。歡迎廣大用戶參與進來,提出寶貴的意見,幫助我們做到更好。您的每一次使用,都是我們前進的無限動力。
本文為云棲社區(qū)原創(chuàng)內容,未經允許不得轉載。
電子發(fā)燒友App

































































評論