筆者參加了在加利福尼亞州圣克拉拉市舉行的2010年Cloud Connect大會,這是今年最早舉行的云計算重大會議之一。到目前為止,會議一個較大的議題是不使用關系型數據庫來保持數據的持久性。這被稱為 NoSQL運動,其宗旨是使用其他形式的數據庫,更有效地處理大規
筆者參加了在加利福尼亞州圣克拉拉市舉行的2010年Cloud Connect大會,這是今年最早舉行的云計算重大會議之一。到目前為止,會議一個較大的議題是“不使用關系型數據庫來保持數據的持久性”。這被稱為 “NoSQL”運動,其宗旨是使用其他形式的數據庫,更有效地處理大規模的數據。而關于圍繞云計算出現的“大規模數據”,這一運動更為重要,它將推動數據回歸到以更簡單、但卻可能更有效的模型進行物理存儲的方式。
NoSQL系統在運行時一般會把數據存放在內存中,或者是并行地從許多磁盤上讀取數據。其中就有一個問題,“傳統”的關系數據庫不提供這種模式,因此也沒法提供同樣的性能。在過去那種數據庫中,如果只有幾個GB數據,這一問題還不是很明顯,但是許多云計算的數據庫已經超過了1TB,還會有更多的大規模數據庫會被用來支撐不斷發展的云計算系統。在關系型數據庫上對大規模數據進行操作是兵家大忌,因為在處理數據時SQL請求會占用大量的CPU周期,并且會導致大量的磁盤讀寫。
如果你覺得以前好像在哪里聽過這種說法,那么我告訴你其實你是對的。早在上世紀90年代,對象數據庫和XML數據庫就取得過一些進展,盡管那時許多非關系型數據庫確實能提供更好的性能,但很多企業卻守住了關系型數據庫的江山,如Oracle、Sybase和Informix。然而,由于從關系型數據庫上遷移出去的花費和風險太高,而且數據的規模也相對較小,使得關系型數據庫幾乎一統天下。
不過,云計算改變了一切。在云計算中需要對大量的數據進行處理,這一需求導致新的數據庫處理方法運用在了舊模型上。MapReduce是Hadoop處理數據的基本方法,它是基于幾年前的“無共享”(share-nothing)數據庫處理模型,但現在我們有了實現它的處理能力、磁盤空間以及帶寬。
我估計云計算的發展將會減少對關系型數據庫的使用。這并非新鮮事物,但這回我們卻實實在在需要改變了。
聲明:本網頁內容旨在傳播知識,若有侵權等問題請及時與本網聯系,我們將在第一時間刪除處理。TEL:177 7030 7066 E-MAIL:11247931@qq.com