1, 索引支持。關(guān)系型數(shù)據(jù)庫創(chuàng)立之初沒有想到今天的互聯(lián)網(wǎng)應(yīng)用對可擴(kuò)展性提出如此高的要求,因此,設(shè)計時主要考慮的是簡化用戶的工作,SQL語言的產(chǎn)生促成數(shù)據(jù)庫接口的標(biāo)準(zhǔn)化,從而形成了Oracle這樣的數(shù)據(jù)庫公司并帶動了上下游產(chǎn)業(yè)鏈的發(fā)展。關(guān)系型數(shù)據(jù)庫在單機(jī)存儲引擎支持索引,比如Mysql的Innodb存儲引擎需要支持索引,而NOSQL系統(tǒng)的單機(jī)存儲引擎是純粹的,只需要支持基于主鍵的隨機(jī)讀取和范圍查詢。NOSQL系統(tǒng)在系統(tǒng)層面提供對索引的支持,比如有一個用戶表,主鍵為user_id,每個用戶有很多屬性,包括用戶名,照片ID(photo_id),照片URL,在NOSQL系統(tǒng)中如果需要對photo_id建立索引,可以維護(hù)一張分布式表,表的主鍵為
2, 事務(wù)并發(fā)處理。關(guān)系型數(shù)據(jù)庫有一整套的關(guān)于事務(wù)并發(fā)處理的理論,比如鎖的粒度是表級,頁級還是行級,多版本并發(fā)控制機(jī)制MVCC,事務(wù)的隔離級別,死鎖檢測,回滾,等等。然而,互聯(lián)網(wǎng)應(yīng)用大多數(shù)的特點都是多讀少些,比如讀和寫的比例是10 : 1,并且很少有復(fù)雜事務(wù)需求,因此,一般可以采用更為簡單的copy-on-write技術(shù):單線程寫,多線程讀,寫的時候執(zhí)行copy-on-write,寫不影響讀服務(wù)。NOSQL系統(tǒng)這樣的假設(shè)簡化了系統(tǒng)的設(shè)計,減少了很多操作的overhead,提高了性能。
3, 動態(tài)還是靜態(tài)的數(shù)據(jù)結(jié)構(gòu)。關(guān)系型數(shù)據(jù)庫的存儲引擎總是一顆磁盤B+樹,為了提高性能,可能需要有insert buffer聚合寫,query cache緩存讀,經(jīng)常需要實現(xiàn)類似Linux page cache的緩存管理機(jī)制。數(shù)據(jù)庫中的讀和寫是互相影響的,寫操作也因為時不時需要將數(shù)據(jù)flush到磁盤而性能不高。簡而言之,關(guān)系型數(shù)據(jù)庫存儲引擎的數(shù)據(jù)結(jié)構(gòu)是通用的動態(tài)更新的B+樹,然而,在NOSQL系統(tǒng)中,比如Bigtable中采用SSTable + MemTable的數(shù)據(jù)結(jié)構(gòu),數(shù)據(jù)先寫入到內(nèi)存的MemTable,達(dá)到一定大小或者超過一定時間才會dump到磁盤生成SSTable文件,SSTable是只讀的。如果說關(guān)系型數(shù)據(jù)庫存儲引擎的數(shù)據(jù)結(jié)構(gòu)是一顆動態(tài)的B+樹,那么SSTable就是一個排好序的有序數(shù)組。很明顯,實現(xiàn)一個有序數(shù)據(jù)比實現(xiàn)一個動態(tài)B+樹且包含復(fù)雜的并發(fā)控制機(jī)制要簡單高效地多。
4, Join操作。關(guān)系型數(shù)據(jù)庫需要在存儲引擎層面支持Join,而NOSQL系統(tǒng)一般根據(jù)應(yīng)用來決定Join實現(xiàn)的方式。舉個例子,有兩張表:用戶表和商品表,每個用戶下可能有若干個商品,用戶表的主鍵為
關(guān)系型數(shù)據(jù)庫的性能瓶頸往往不在SQL語句解析上,而是在于需要支持完備的SQL特性。互聯(lián)網(wǎng)公司面臨的問題是應(yīng)用對性能和可擴(kuò)展性要求很高,并且DBA和開發(fā)工程師水平比較高,可以通過犧牲一些接口友好性來換取更好的性能。NOSQL系統(tǒng)的一些設(shè)計,比如通過寬表實現(xiàn)Join操作,互聯(lián)網(wǎng)公司的DBA和開發(fā)工程師也做過,NOSQL系統(tǒng)只是加強(qiáng)了這種約束。從長遠(yuǎn)來看,可以總結(jié)一套約束集合,并且定義一個SQL子集,只需要支持這個SQL子集就可以在不犧牲可擴(kuò)展性的前提下支持比如90%以上的互聯(lián)網(wǎng)應(yīng)用。我想,NOSQL技術(shù)發(fā)展到這一步的時候就算是比較成熟了,這也是我們最終想做的事情。我們在設(shè)計和使用NOSQL系統(tǒng)的時候也可以適當(dāng)轉(zhuǎn)化一下思維,如下:
1, 更大的數(shù)據(jù)量。很多人在使用Mysql的過程遇到記錄條數(shù)超過一定值,比如2000W的時候,數(shù)據(jù)庫性能開始下降,這個值的得出往往需要經(jīng)過大量的測試。然而,大多數(shù)的NOSQL系統(tǒng)可擴(kuò)展性都比較好,能夠支持更大的數(shù)據(jù)量,因此也可以采用一些空間換時間的做法,比如通過寬表的方式實現(xiàn)Join。
2, 性能預(yù)估更加容易。關(guān)系型數(shù)據(jù)庫由于復(fù)雜的并發(fā)控制,insert buffer及類似page cache的讀寫優(yōu)化機(jī)制,性能估算相對較難,很多時候需要憑借經(jīng)驗或者經(jīng)過測試才能得出系統(tǒng)的性能。然后,NOSQL系統(tǒng)由于存儲引擎實現(xiàn),并發(fā)控制機(jī)制等相對簡單,可以通過硬件的性能指標(biāo)在系統(tǒng)設(shè)計之處大致預(yù)估系統(tǒng)的性能,性能預(yù)估可操作性相對更強(qiáng)
聲明:本網(wǎng)頁內(nèi)容旨在傳播知識,若有侵權(quán)等問題請及時與本網(wǎng)聯(lián)系,我們將在第一時間刪除處理。TEL:177 7030 7066 E-MAIL:11247931@qq.com