《電子技術應用》
您所在的位置:首頁 > 嵌入式技術 > 設計應用 > 一種云數據庫的設計與實現
一種云數據庫的設計與實現
2014年微型機與應用第16期
裴文斌,馬 軍,石 輝,方 偉
西安雷迪維護系統(tǒng)設備有限公司,陜西 西安 710075
摘要: 云數據庫是把各種關系型數據庫看成一系列簡單的二維表,并基于簡化版本的SQL或訪問對象進行操作的數據庫。云數據庫能夠為多個用戶同時提供類似于單節(jié)點數據庫的服務。在當前云計算技術不斷發(fā)展中,數據庫不斷發(fā)展進化,從原始的單節(jié)點數據庫逐漸發(fā)展成為云數據庫,數據存儲能力相對于過去提高了數倍。目前云數據庫服務不斷增多,在此背景下,討論了一種云數據庫的設計與核心子系統(tǒng)的實現。
Abstract:
Key words :

  摘  要云數據庫是把各種關系型數據庫看成一系列簡單的二維表,并基于簡化版本的SQL或訪問對象進行操作的數據庫。云數據庫能夠為多個用戶同時提供類似于單節(jié)點數據庫的服務。在當前云計算技術不斷發(fā)展中,數據庫不斷發(fā)展進化,從原始的單節(jié)點數據庫逐漸發(fā)展成為云數據庫,數據存儲能力相對于過去提高了數倍。目前云數據庫服務不斷增多,在此背景下,討論了一種云數據庫的設計與核心子系統(tǒng)的實現。

  關鍵詞: 云數據庫;云計算;數據分布;高可用;一致性hash

  隨著計算機網絡的飛速發(fā)展以及網絡帶寬的不斷增長,利用網絡技術來建立云數據庫中心已經成為可能。近年來,云數據庫已經成為數據庫發(fā)展的新趨勢。云數據庫可以將分散在各個數據中心的數據庫資源有效地組織利用起來,構成海量數據存儲中心。云數據庫能夠更快地、更好地解決各個客戶海量數據的存儲問題,能夠打破傳統(tǒng)的單節(jié)點數據庫的網絡帶寬和磁盤I/O的限制,為客戶提供高帶寬、高I/O、高并發(fā)的數據連接服務。同時,云數據庫中心具有系統(tǒng)設備利用率高、數據節(jié)點擴容方便、數據的多備份、數據高可用等特點。本文對云數據庫的各功能模塊進行研究,并分析了各功能模塊的實現方式。

1 云數據庫的設計

  云數據庫建立在互聯(lián)網上的數據庫中心,能夠同時為多個客戶提供數據庫服務,并且其互相之間不影響。系統(tǒng)整體框圖如圖1所示。

001.jpg

  云數據庫對外提供統(tǒng)一的API,統(tǒng)一的API能夠屏蔽云數據庫內部實現的細節(jié)。對外提供一種統(tǒng)一的數據庫連接協(xié)議,使用戶能夠通過不同的編程語言、不同的連接工具進行連接使用。

  云數據庫的核心服務是為用戶提供數據庫服務,其主要功能有:

 ?。?)用戶檢測。引進用戶認證系統(tǒng)檢測多用戶狀態(tài),認證系統(tǒng)在用戶登錄、退出時進行狀態(tài)記錄,在用戶每次進行數據操作時,必須確定該操作是否安全。

 ?。?)安全檢測。安全系統(tǒng)全程監(jiān)控用戶的操作,以確認用戶的操作對數據庫中其他用戶和數據庫整體安全沒有影響,以及檢測來自網絡上的各種數據庫的攻擊。

 ?。?)多租戶。云數據庫多租戶服務是為解決多個用戶同時接入云數據庫系統(tǒng)而設計實現的。多個用戶同時接入云數據庫,不僅要求各個用戶之間互相隔離,而且要求各個用戶之間的數據互不影響,各個用戶只能訪問自己的數據庫。

 ?。?)數據分布。為了存儲用戶的海量數據,將用戶的數據分布在數據庫集群中不同的節(jié)點上,這樣不僅方便系統(tǒng)的擴容,而且數據I/O操作被分配到多個節(jié)點上。數據的分布使用一致性hash[1]算法,保證在加入節(jié)點時,數據庫中的數據以最小的代價擴展到新節(jié)點中。

 ?。?)數據高可用。云數據庫中的數據每份至少需要存在于3個副本中,3個副本進行實時同步,當某一數據節(jié)點宕機出現故障時,數據能夠在其他節(jié)點正常讀取。多副本的存在,還可以使用負載均衡算法,把數據I/O操作分散到負載低的數據節(jié)點[2]。

 ?。?)緩存。基于大數據的負載特性,以內存作為存儲介質,用以解決數據查詢性能延遲的問題[3]。使用Memcached或者Redis緩存系統(tǒng)[4],將數據放入內存,讀寫時若能命中,系統(tǒng)的I/O能力至少能夠提高8~10個數量級。

  (7)數據快照。數據快照功能能夠在某個時間點給用戶數據生成快照,該快照能夠供用戶下載保存,同時用戶能夠把數據回滾至該快照。

  數據庫節(jié)點集群提供用戶數據實際的保存位置,該集群一般由多個數據庫中心組成,各個數據庫中心的數據互相備份,以保證在一個或多個數據庫中心遭到災難性損壞時,云數據庫依然能夠正常運行。當各個數據庫中心的節(jié)點無法提供足夠容量時,可以動態(tài)地、無需關機地添加數據節(jié)點至云數據庫中心。

2 云數據庫的實現

  云數據庫為了實現高擴展性,所有子系統(tǒng)均由單獨模塊構成,所有模塊均可由新的相關功能模塊代替。云數據庫核心模塊包括:安全審計模塊、通信模塊、SQL解析模塊、路由管理模塊、消息分發(fā)模塊、策略管理模塊、緩存模塊、消息處理、結果集處理模塊、數據快照模塊。

  2.1 系統(tǒng)核心流程

  應用系統(tǒng)發(fā)送數據庫請求,云數據庫通過通信管理模塊接收到請求,調用安全審計模塊進行安全審計[5]。安全審計模塊負責所有云數據庫連接的安全管理。通信管理模塊管理內部消息的編碼解碼工作,管理著內部所有的連接對象。

  連接對象將消息轉發(fā)給消息轉換模塊;消息轉換模塊將發(fā)送過來的消息進行包協(xié)議處理,然后發(fā)送給SQL解析模塊;SQL解析模塊生成相應的SQL對象。SQL解析模塊有SQL解析和SQL過濾功能,能夠過濾掉SQL中非法的字符串等。

  SQL對象將數據流交給路由管理模塊。路由管理模塊進行SQL路由解析、SQL分發(fā)等SQL操作。同時,路由管理模塊監(jiān)控數據庫節(jié)點池中的數據庫節(jié)點和數據節(jié)點的心跳信息。路由管理模塊的配置只能由云數據庫管理員進行操作,其中配置規(guī)則包括:路由規(guī)則、虛擬節(jié)點規(guī)則、物理數據庫節(jié)點規(guī)則和數據快照規(guī)則。同時,數據快照功能直接作用于路由管理模塊,通過路由管理模塊的消息分發(fā)功能把快照命令發(fā)送到物理數據庫節(jié)點中。

  策略管理模塊管理物理數據庫節(jié)點中的數據切分規(guī)則。數據切分規(guī)則使用一致性hash算法進行數據切分,當添加新的數據庫節(jié)點到數據節(jié)點池中時,能夠以最小的代價把數據遷移至新節(jié)點中。同時,云數據庫服務能夠保證在不影響用戶使用的情況下能夠完成節(jié)點的加入以及數據的遷移。

  消息分發(fā)模塊接收來自路由管理模塊發(fā)送的消息隊列,把消息隊列中的消息按照規(guī)則發(fā)送至相應的數據庫節(jié)點中,進行相應的數據節(jié)點操作。把數據庫操作完成返回的信息通過結果集返回給結果集合并器,結果集合并器將合并的結果返回給通信管理模塊,最終響應應用系統(tǒng)的請求。當然,如果云數據庫接入緩存系統(tǒng),消息分發(fā)器首先會從緩存中查詢是否有需要的數據信息。如果有,直接操作緩存中的數據并返回給應用系統(tǒng);如果沒有,則從數據節(jié)點中查詢出需要的數據,并保存至緩存系統(tǒng)中,以備下次使用。

  云數據庫核心數據流圖如圖2所示。

002.jpg

  2.2 核心子系統(tǒng)的實現

  本文所描述的云數據庫多租戶技術采用共享數據、隔離數據庫的架構。物理數據庫使用數據庫集群中的數據庫。當初始化一個用戶時,默認會創(chuàng)建一個新的數據庫實例分配給該用戶使用,該用戶所有數據操作都在此數據庫中進行。用戶可以創(chuàng)建新的數據庫實例,為了確保系統(tǒng)資源的合理使用,用戶創(chuàng)建的數據庫實例數量是一定的。如果兩個用戶創(chuàng)建的數據庫實例名稱相同,云數據庫可以根據用戶的信息和用戶輸入的信息進行md5值計算,使用md5值作為創(chuàng)建數據庫實例的名稱。云數據庫把用戶信息、用戶輸入的信息和生成的md5值進行對應保存,每次訪問時進行相應的轉換。

  云數據庫中數據的存放方式是根據數據不同的存放方式進行設置的。本文在此提出一種經過大量實踐總結而得出的切分方式,該切分方式可以保證云數據庫在不減少性能損失的情況下,高效、快捷地切分數據。同時,在增加新的數據庫節(jié)點時,能夠使數據的遷移代價降到最低。

  一致性hash算法的出現就是為了解決分布式系統(tǒng)中數據分布的問題。要使用一致性hash算法,首先,將需要映射的數據節(jié)點通過hash算法計算出其hash值,并分布在hash環(huán)上;其次,將需要存儲的數據經過hash算法,獲得其hash值,并映射到hash環(huán)上;最后,從數據映射到的位置順時針開始查找,將數據保存在找到的第一個數據庫節(jié)點中。232與0重合,超過232則從0位置開始尋找數據庫節(jié)點,如圖3所示。

003.jpg

  例如,存放數據的物理數據節(jié)點數為4個,則計算這4個數據節(jié)點的hash值,并分布在hash環(huán)上。一條數據寫入后,系統(tǒng)首先生成其唯一的ID,并計算該ID值對應的hash值,根據hash值映射到hash環(huán)上,順時針尋找第一個遇到的數據庫節(jié)點,將數據保存至該節(jié)點中。假設該hash值落在數據庫節(jié)點1與數據庫節(jié)點2之間,則順時針找到的第一個數據庫節(jié)點為2,數據最終會被保存在節(jié)點2中。

  如果,在數據庫節(jié)點2和數據庫節(jié)點3中增加一個數據庫節(jié)點5,則數據庫節(jié)點2到數據庫節(jié)點5中間的數據需要重新映射到數據庫節(jié)點5中。數據庫節(jié)點3刪除數據庫節(jié)點2到數據庫節(jié)點5之間的數據,如圖4所示。

004.jpg

  數據庫節(jié)點保存的數據都有多個備份,以防止單點的出現。同時,在數據庫節(jié)點增加或刪除時,可以使用備份節(jié)點提供服務,從而使得整個云數據庫系統(tǒng)無需停機就能夠完成節(jié)點的擴展、移除。

  云數據庫中的通信管理系統(tǒng)負責整個云數據庫中應用系統(tǒng)到云數據庫之間通信過程的檢測。安全審計檢測系統(tǒng)使用了防火墻技術,同時結合了數據過濾、包過濾技術。其核心是安全審計規(guī)則,規(guī)則配置得是否合理是安全審計系統(tǒng)能否正常、高效運行的基礎。

  為了兼容多種應用使用不同的連接方式連接至云數據庫,云數據庫中通信管理系統(tǒng)配置了多種消息編碼、解碼規(guī)則。當使用不同數據庫協(xié)議進行連接時,通信管理系統(tǒng)調用不同的規(guī)則進行編碼、解碼后,數據信息存放到數據節(jié)點中。例如,當使用MySQL協(xié)議連接云數據庫時,云數據庫系統(tǒng)通信管理模塊使用MySQL協(xié)議解碼連接,當需要發(fā)送給應用系統(tǒng)結果時,通信管理模塊使用MySQL協(xié)議進行編碼。使用其他協(xié)議連接時,其過程相同。為了使云數據庫兼容更多的協(xié)議,不能使用某個數據庫的方言,應該使用基于標準的SQL語言。

  云數據庫中存放數據的物理節(jié)點可以使用多種不同的數據庫系統(tǒng)。當不同的數據庫系統(tǒng)接入云數據庫時,云數據庫使用后端中對應的連接協(xié)議連接數據庫。使用該方法能夠使云數據庫兼容多種數據庫系統(tǒng),提高系統(tǒng)的可用性。

  路由管理模塊是云數據庫核心模塊之一。數據節(jié)點分為虛擬節(jié)點、物理節(jié)點。物理數據庫節(jié)點組成虛擬節(jié)點,多個虛擬節(jié)點組成更大的虛擬節(jié)點。每個虛擬節(jié)點對云數據庫來說就是一個數據存儲點,云數據庫對數據的存取就是對虛擬節(jié)點的操作。虛擬節(jié)點中一般有多個物理數據庫節(jié)點,并且數據互為備份。當其中某個物理數據庫節(jié)點宕機,路由管理模塊中的心跳檢測機制能夠立即獲得節(jié)點掉線信息,并且把該物理數據庫節(jié)點操作分散到備份節(jié)點中。

  路由管理模塊能夠把SQL解析器解析的SQL對象分發(fā)到不同的數據節(jié)點中。路由管理模塊的核心是路由規(guī)則,在該規(guī)則中,記錄該管理器下所有的節(jié)點配置信息,包括連接數、連接時長、超時時長等所有基本信息。同時,路由管理器還提供用戶虛擬數據節(jié)點、物理節(jié)點及用戶數據庫容量使用接口API查詢的功能。

3 性能測試

  測試環(huán)境為:(1)云數據庫服務平臺:IBM高性能服務器,磁盤≥100 GB,內存≥16 GB,網絡≥100 Mb/s,數量1臺;運行環(huán)境:Linux。(2)數據庫節(jié)點:IBM刀片機,磁盤空間≥1T,內存≥4 GB,網絡≥100 Mb/s,數量4臺,運行環(huán)境:Linux。

  測試環(huán)境架構圖如圖5所示。

005.jpg

  測試采用4臺數據庫節(jié)點服務器,兩兩備份,云數據庫數據按照數據生成ID切分,分別寫入節(jié)點數據庫1和節(jié)點數據庫3。節(jié)點數據庫2和節(jié)點數據庫4作為讀數據庫。表1是100線程并發(fā)數測試結果,表2是500線程并發(fā)數測試結果。

006.jpg

  從測試結果可以總結出,云數據庫中單個用戶的并發(fā)數在500以下,不存在性能瓶頸問題;云數據庫的性能與服務器的配置存在很大的關系;云數據庫節(jié)點的增加對于服務的讀性能有很大提高,基本成水平增長;數據庫節(jié)點的寫性能在不開通事務的情況下也隨著節(jié)點數量的增加而增加,在開通事務時,對寫性能的影響很大。

  參考文獻

  [1] DARGER D, LEHMAN E, LEIGHTON T, et al. Consistent hashing and random trees: distributed caching protocols for relieving hot spots on the world wide Web[C]. ACM Symposium on Theory of Computing, 1997. 1997:654-663.

  [2] 張青鳳, 張鳳琴, 王磊. 多數據中心的數據同步模型研究與設計[J].微型機與應用,2013,32(12):60-62.

  [3] Jia Zhen, Wang Lei ,Zhan Jianfeng, et al. Characterizing data analysis workloads in data centers[C]. In Workload Characterization(IISWC), 2013 IEEE International Symposium on. IEEE, 2013.

  [4] 曾超宇,李金香.Redis在高速緩存系統(tǒng)中的應用[J].微型機與應用,2013,32(12):11-13.

  [5] 梁鋼,茅秋吟.云計算IaaS平臺的信息安全和運維服務設計[J].電子技術應用,2013,39(7):68-70.


此內容為AET網站原創(chuàng),未經授權禁止轉載。
主站蜘蛛池模板: 亚洲国产成人九九综合 | 国产男女视频在线观看 | 欧美xxxxx毛片| 亚洲图片 自拍 | 亚洲国产情侣一区二区三区 | 日本成人在线免费观看 | 免费观看一级特黄三大片视频 | 国产亚洲人成网站观看 | 91精品综合 | 亚洲精品影院一区二区 | 欧美一级欧美三级 | 亚洲三级黄色 | 日韩亚洲国产综合久久久 | 国产免费一区二区三区在线观看 | 国产成人综合亚洲一区 | www.乱| 日韩视频欧美视频 | 欧美成人h精品网站 | 久草在在线视频 | 玖玖国产在线观看 | 国产亚洲精品久久久久久久 | 成人欧美一区二区三区视频 | 一区二区三区欧美日韩国产 | 欧美大片在线播放 | 欧美高清视频在线观看 | 日产乱码精品一二三区 | 一区精品视频 | 亚洲综合色就色手机在线观看 | 成人高清在线观看 | 亚洲色视频在线播放网站 | 成人毛片一区二区三区 | 国产成人精品亚洲77美色 | 另类二区三四 | 日韩国产成人资源精品视频 | 成人精品视频一区二区三区 | 亚洲欧美卡通动漫丝袜美腿 | 国产亚洲男人的天堂在线观看 | 日本欧美中文 | www.亚洲天堂网 | 中国内地毛片免费高清 | 91视频国内 |