一 分布式數(shù)據(jù)庫系統(tǒng)概述
分布式數(shù)據(jù)庫系統(tǒng)是在集中式數(shù)據(jù)庫系統(tǒng)的基礎上發(fā)展起來的,是計算機技術和網絡技術結合的產物。分布式數(shù)據(jù)庫系統(tǒng)適合于單位分散的部門,允許各個部門將其常用的數(shù)據(jù)存儲在本地,實施就地存放本地使用,從而提高響應速度,降低通信費用。基于網絡基礎上的分布式數(shù)據(jù)庫系統(tǒng)經常對數(shù)據(jù)庫進行數(shù)據(jù)分片。從數(shù)據(jù)意義上講,數(shù)據(jù)分布的合理與否不僅影響著訪問的局部性,而且也制約著數(shù)據(jù)查詢及事務處理的效率。
在分布式數(shù)據(jù)庫中,數(shù)據(jù)存儲包括數(shù)據(jù)分片和數(shù)據(jù)分配兩個部分。數(shù)據(jù)分片和分布是分布式數(shù)據(jù)庫中兩個重要慨念,分布式數(shù)據(jù)庫大部分問題均與數(shù)據(jù)分片和分布有關,它們對整個系統(tǒng)的可用性、可靠性、及效率都有極大的影響,同時也與分布式數(shù)據(jù)庫系統(tǒng)的其他方面密切相關,尤其是分布式查詢處理問題。以關系數(shù)據(jù)庫為例,在關系型分布式數(shù)據(jù)庫系統(tǒng)(RDDB)中,數(shù)據(jù)分片是從邏輯上將全局關系劃分為邏輯片斷即子關系,而數(shù)據(jù)分配就是再以一定的冗余度將子關系分配到多個結點上,數(shù)據(jù)存儲即數(shù)據(jù)分片與數(shù)據(jù)分配的總和。數(shù)據(jù)分片是一種對關系的劃分,在集中式數(shù)據(jù)庫中可以將所有的表視為一個總全局表的邏輯子表,而總全局表是這些子表的并集,其屬性包括這些子表的所有屬性,元組包括這些子表的所有元組,對應的在這個總全局表上元組的非空值呈塊狀區(qū)域分布。數(shù)據(jù)分配則是將這些子表以不同的冗余度存放在一個或多個場地或節(jié)點,這兩者間的區(qū)別在于集中式數(shù)據(jù)庫不存在數(shù)據(jù)復制的問題,不需要存在多副本,但也會出現(xiàn)表名不同。但表屬性和屬性值完全相同。
二 分布式數(shù)據(jù)庫的設計
如何在不同的計算機上分布文獻資料的數(shù)據(jù)和程序才能提高系統(tǒng)效率,增加系統(tǒng)的可靠性和可用性。這是我們面臨的重要問題。為了增加系統(tǒng)的可靠性。系統(tǒng)就必須使數(shù)據(jù)重復,也就是系統(tǒng)應保持幾個相同的副本,每個副本放在不同的結點內形成數(shù)據(jù)重復,數(shù)據(jù)重復不但可以增加系統(tǒng)的堅定性,還可以提高系統(tǒng)的并行性。借助于多個副本,幾個結點可以并行地處理有關查詢。然而,系統(tǒng)存在著多副本就必須要保證全部副本的一致性結果會增加系統(tǒng)的總開銷。因此,我們必須認真考慮文獻資料數(shù)據(jù)資源共享的合理分布。
而在分布式數(shù)據(jù)庫中,由于數(shù)據(jù)的分布和冗余,使得查詢處理中需要考慮站點間傳輸數(shù)據(jù)的通信費用,所以除了考慮CPU代價和I\O代價之外。還應該包括數(shù)據(jù)在網絡上的傳輸代價。即總代價=CPU代價+I\O代價+通信代價。因此,分布式數(shù)據(jù)庫進行分布式設計時,一個重要原則是使數(shù)據(jù)和應用程序實現(xiàn)最大程度的本地性,這樣就可以使應用數(shù)據(jù)盡可能地本地化,以減少通信開支。對于建立在各場所的分布式數(shù)據(jù)庫,不需要過分進行限制,但也必須要有規(guī)范的設計要求。
(1)硬件規(guī)范,必須支持局域網乃至Internet的包括聲音,文字,圖像的交流,支持IE或Netscape瀏覽web界面,支持開放性數(shù)據(jù)源的建立。
(2)數(shù)據(jù)庫形式規(guī)范,原則上Access、Paradox,甚至文本文件都可以進行數(shù)據(jù)傳輸,但必須保證自己有開放式數(shù)據(jù)源的特征及關系繼承的特征。
(3)域的統(tǒng)一和分類、分科的統(tǒng)一,數(shù)據(jù)庫在各個分布場所必須有統(tǒng)一的域結構,以確保給用戶提供完整統(tǒng)一的視圖,科目分類的命名必須要求規(guī)范,以確保查詢和統(tǒng)計工作的準確性,在方便工作的條件下,可以不要求唯一確定的主關鍵字。
三 傳統(tǒng)數(shù)據(jù)庫存在的問題
隨著計算機技術的發(fā)展和應用的深入,分布式技術在構建企業(yè)級應用程序中更為廣泛流行。是因為分布式數(shù)據(jù)庫存儲方式給企業(yè)帶來了很多的方便以及好處。在沒興起分布式浪潮之前,由于傳統(tǒng)的數(shù)據(jù)存儲方式過于簡單化,過于集中管理而造成了大量數(shù)據(jù)的堆積。這樣一來一個公司或企業(yè)要使用大量的數(shù)據(jù)就需要大量的存儲數(shù)據(jù)的介質,而導致服務器的回應下降乃至崩潰,這樣一來就會有大量數(shù)據(jù)會隨著服務器的崩潰而丟失,而數(shù)據(jù)對于大型企業(yè)來說數(shù)據(jù)量會很大,數(shù)據(jù)的丟失,沒有了數(shù)據(jù)的對照會使企業(yè)的業(yè)績虧損,更嚴重的說也可能導致企業(yè)倒閉。這種方式存儲還不能解決的問題就是異地的存儲,有的企業(yè)會有很多的分公司,這樣一來就傳統(tǒng)的數(shù)據(jù)存儲就會帶來大量人力、資金的浪費。這些問題的存在也促進了分布式數(shù)據(jù)庫的發(fā)展。
四 剖析分布式數(shù)據(jù)庫存儲的優(yōu)勢
分布式數(shù)據(jù)庫顧名思義,具有分布數(shù)據(jù)的功能,實際上它的數(shù)據(jù)存儲方式是物理上是分布的,邏輯上是集中的。也就是說分布式數(shù)據(jù)就是指數(shù)據(jù)和程序可以不位于一個服務器上,而是分散到多個服務器,以網絡上分散分布的地理信息數(shù)據(jù)及受其影響的數(shù)據(jù)庫操作為研究對象的一種理論計算模型。而分布式數(shù)據(jù)庫數(shù)據(jù)存儲是在不同地域或者不同網絡之間的存儲,進而達到數(shù)據(jù)共享,數(shù)據(jù)交換的目的。分布式數(shù)據(jù)存儲是先經過一個鈍化,然后序列化成文件從內存中的一端傳到網絡的另一端,到另一端后在激活的一系列過程,詳細的說數(shù)據(jù)流在加工過程中產生的臨時文件或加工過程中需要查找的信息。數(shù)據(jù)以某種格式記錄在計算機內部或外部存儲介質上。數(shù)據(jù)存儲要命名,這種命名要反映信息特征的組成含義。數(shù)據(jù)流反映了系統(tǒng)中流動的數(shù)據(jù),表現(xiàn)出動態(tài)數(shù)據(jù)的特征;數(shù)據(jù)存儲反映系統(tǒng)中靜止的數(shù)據(jù),表現(xiàn)出靜態(tài)數(shù)據(jù)的特征。這就是它的存儲過程。
五 總結分布式數(shù)據(jù)庫存儲的優(yōu)勢
分布式數(shù)據(jù)的優(yōu)勢也正體現(xiàn)在這分布這兩個字,讓操作終端的人感覺不到數(shù)據(jù)庫的分散,當然這也需要好的網絡的努持。使使用者感覺是在本地數(shù)據(jù)庫操作一樣。這樣既方便又快捷,使維護起來不用操作大量的數(shù)據(jù)。它綜合了計算機(Computer)、通訊(Communication)、顯示(CRT)和控制(Control)等4項技術,其基本思想是分散控制,集中操作、分級管理、配置靈活、高可靠性,易于維護等基本特點,從而實現(xiàn)了異地存儲的實現(xiàn)。
六 結語
通過分布式數(shù)據(jù)庫的學習,對分布式數(shù)據(jù)庫有了初步的了解和掌握,學到了分布式存儲、交換、事務處理、網絡存儲等機制和方法。
分享到微信 ×
打開微信,點擊底部的“發(fā)現(xiàn)”,
使用“掃一掃”即可將網頁分享至朋友圈。