[數(shù)據(jù)庫相關]數(shù)據(jù)庫管理中的數(shù)據(jù)備份、災備和歸檔區(qū)別及管理
2014-01-06 10:28:26 訪問:
隨著各企業(yè)信息化水平越來越高,各系統(tǒng)的數(shù)據(jù)庫及數(shù)據(jù)文件也越來越多,關于數(shù)據(jù)備份大家也越來越重視,不過在備份過程中遇到的幾個概念,如備份、災備、歸檔也讓人摸不清楚,這里將對這幾個概念做一個解釋:
備份和災備或者業(yè)務連續(xù)性有何不同?是否大多數(shù)業(yè)務部門認為他們是一樣的?
備份是保護數(shù)據(jù)資產(chǎn)的一種方式,同時,對數(shù)據(jù)資產(chǎn)的保護是災備計劃或者業(yè)務連續(xù)性計劃的一部分。丟失了數(shù)據(jù)就意味著丟失了業(yè)務。因此,備份也成為了數(shù)據(jù)冗余策略的一部分。
企業(yè)的大多數(shù)信息用一兩種方法就可以保護。第一種是更換策略。假如說有人不小心將可樂潑在了服務器上然后短路了,用戶可以購買一臺然后替換它,或者提前在邊上放置一臺備用的服務器,一旦需要就換上。
這樣的方法對于數(shù)據(jù)來說并不現(xiàn)實,對于數(shù)據(jù)來說,它不能被替換。如今,你可能會驚訝于許多公司還用著50年代的計劃,“如果遇到了緊急情況或者我們的樓燒壞了,我們會讓所有的員工一起重新輸入發(fā)票信息以保證我們的發(fā)票系統(tǒng)能快速恢復。”
非常有意思的概念,但是在如今互聯(lián)網(wǎng)盛行以及以24/7方式運營的時代,你甚至沒有時間去重新錄入那些發(fā)票數(shù)據(jù)。因此,你無法替換數(shù)據(jù),唯一能做的是讓這些數(shù)據(jù)成為冗余的。用戶可以事先做一份拷貝,并將拷貝放在另外的地方。最有效的辦法就是使用備份??梢詡浞莸酱艓希驗榇艓强梢砸苿拥膫浞輸?shù)據(jù)存儲介質:放在盒子里,然后運到遠程安全的存放場所。
那么,你認為什么才是真正意義上的歸檔?很多公司把它們的那些舊的備份當做為歸檔,這其中是否有所疏漏?
我們可以把歸檔分成兩類,我估計你所提到的那些數(shù)據(jù)的集合從技術角度來講可以被認為是第一種歸檔。一些公司認為他們的備份——某一時間點數(shù)據(jù)的快照——就是歸檔,因此它們習慣于只保存舊的備份,被將它們視為歸檔文件。
然而事實上,歸檔應該包含比備份集更多的功能。比方說,你能對歸檔進行搜索,找到某種特定的數(shù)據(jù),或者在所有數(shù)據(jù)中找到某一系列的信息。備份卻很難做到這一點。
歸檔軟件根據(jù)某種規(guī)則把數(shù)據(jù)邏輯地整合到一起。它提供索引信息來幫助實現(xiàn)搜索及發(fā)現(xiàn)功能。它常能讓你更靈活地組織數(shù)據(jù)。
總的說來,歸檔在數(shù)據(jù)組織整理和發(fā)現(xiàn)搜索方面提供了更大的顆粒度,這一點與備份是有很大區(qū)別的。備份僅僅是數(shù)據(jù)在某一特定時間點的拷貝,然而歸檔擁有其他額外的屬性,我把它認為是第二類的歸檔,它也因此被稱作是“深度歸檔”。
第二類歸檔
沒錯,它也被稱為是“動態(tài)歸檔”,這可能把問題搞得更復雜了。它是使用磁帶作為文件系統(tǒng),用磁帶做文件服務器,LTFS,線性磁帶文件系統(tǒng)。
目前市場上有很多產(chǎn)品都宣稱能減少需要用于備份的數(shù)據(jù)量。果真如此么?
是的,你說的就是重復數(shù)據(jù)刪除技術。該技術曾經(jīng)一度被一個非常非常聰明的人認為是對備份管理系統(tǒng)的浪費。傳統(tǒng)的備份是針對全卷的,就是說你會對所有數(shù)據(jù)都進行備份。第二個晚上,你又會把那所有數(shù)據(jù)備份一遍,目的是捕捉到變化的數(shù)據(jù)。然后第三個晚上,你再次對全部數(shù)據(jù)做備份,用來捕捉那些變化的或增加的數(shù)據(jù)。
你會不斷重復地這樣操作。假設這個備份有1TB的數(shù)據(jù)量;那么到周末,你就不得不找個5TB或6TB的空間來存放備份下來的數(shù)據(jù)。
但是問題是,對于大多數(shù)拷貝而言,90%的數(shù)據(jù)實際上是重復的。
因此,如果我們能夠將那部分數(shù)據(jù)除去,就可以把5天備份產(chǎn)生的5TB數(shù)據(jù)縮減到1.5TB,這對于精簡磁盤空間當然是有好處的。
重復數(shù)據(jù)消除技術能找出那些相同的比特或文件或其他相同的數(shù)據(jù),選擇最近的版本保存,并丟棄其他拷貝。通過這種方式就縮減了信息的數(shù)量。這項技術是有幫助的,但同時你會擔心應該如何恢復數(shù)據(jù),或者說怎么把數(shù)據(jù)從消重的狀態(tài)中取出來變成可讀的模式。
在有些情況下,這個不成問題,但是有時由于算法壓縮了數(shù)據(jù),因此在提取數(shù)據(jù)時需要相反的算法。這實際上會增加災難恢復情況下數(shù)據(jù)恢復所需要的時間。它同時也增加了復雜性并需要用戶有登陸使用該備份軟件的能力。
我不想讓過程這么麻煩,現(xiàn)在的情況是我的數(shù)據(jù)中心受損了,我需要的是能盡快將數(shù)據(jù)恢復到可用的狀態(tài),使用新技術自有其優(yōu)勢所在,但坦率地說,我對重復數(shù)據(jù)刪除技術不是特別熱衷。
此外,許多我的金融行業(yè)的客戶們也不會對他們的數(shù)據(jù)進行去重操作,這是由于美國證券及交易委員會的規(guī)定,他們擔心律師搞不清什么是重復數(shù)據(jù)刪除,反問,什么是重復數(shù)據(jù)刪除。
然后他找到IT,IT的回復是,“是的,我們的確用了重復數(shù)據(jù)刪除技術,有些時候我們也會從消重后的數(shù)據(jù)里恢復。”得到了這個消息,股東就會和法官說,“根據(jù)法律,我們是不允許提供修改過的金融數(shù)據(jù)的,這樣的操作實際是違反了SEC條款。沒有證據(jù)證明消重技術不會修改數(shù)據(jù)本身。”
其實是否會修改數(shù)據(jù)本身并不重要。事實上它的確可能不會修改,但這不會阻礙負責價值1100萬美金案子的律師來證明它有。當然他們也不會花這么多錢在‘證明重復數(shù)據(jù)刪除技術沒有改變數(shù)據(jù)的事實’上。
消重的確有效果嗎?從廣泛的角度講,答案是肯定的,但使用增量備份的方法也能達到類似的效果。這就是說只用對每天改變的文件進行備份。
這和重復數(shù)據(jù)刪除很類似,除了沒有做一個完整的備份和將每天的增量進行去重操作,都是拷貝了改變的數(shù)據(jù)。事實上是,我這幾天一直在想,備份是不是真是我們應該選擇的方法,當然我們說的是傳統(tǒng)的備份模式。
備份本身將所有的數(shù)據(jù)都收集起來,整合到一個容器里,稱為一個備份文件,然后將這份文件存放在任意的存儲介質上。恢復的時候則需要當時進行備份操作時候的軟件將數(shù)據(jù)恢復回來。這是一項耗時的工作,因此需要給它足夠的時間以完成。
如今,在有類似線性磁帶文件系統(tǒng)(LTFS)這樣的產(chǎn)品,我們就可以將需要備份的文件直接拷貝到該文件系統(tǒng)上。我們甚至不需要一個備份容器來完成這樣的工作。這就給了我們一種全新且具有創(chuàng)新精神的方式來完成一份數(shù)據(jù)的拷貝。