一、數(shù)據(jù)庫和數(shù)據(jù)庫管理系統(tǒng)的關系
數(shù)據(jù)庫管理系統(tǒng)(Database Management System,DBMS)是指用于管理數(shù)據(jù)庫的軟件系統(tǒng),負責實現(xiàn)數(shù)據(jù)庫中數(shù)據(jù)的組織、儲存、查詢、修改和刪除等基本操作。數(shù)據(jù)庫管理系統(tǒng)是數(shù)據(jù)庫系統(tǒng)的核心組成部分,它是介于用戶與操作系統(tǒng)之間的一層數(shù)據(jù)管理軟件,是用戶和數(shù)據(jù)庫的接口,用于協(xié)調和管理數(shù)據(jù)庫中的數(shù)據(jù)和操作。而數(shù)據(jù)庫是數(shù)據(jù)庫管理系統(tǒng)的主要對象。
二、數(shù)據(jù)庫與數(shù)據(jù)庫系統(tǒng)的關系
數(shù)據(jù)庫系統(tǒng)(Database System)則是指數(shù)據(jù)庫及其管理軟件,同時還涉及到一些與數(shù)據(jù)庫相關的硬件、網(wǎng)絡、安全等方面的技術,是一個更加全面的概念。數(shù)據(jù)庫系統(tǒng)是由數(shù)據(jù)庫、數(shù)據(jù)庫管理系統(tǒng)和相應的應用程序組成的。數(shù)據(jù)庫系統(tǒng)是實現(xiàn)應用程序和數(shù)據(jù)之間交互和數(shù)據(jù)的存儲、管理、維護、保護等的一個整體系統(tǒng)。數(shù)據(jù)庫是在數(shù)據(jù)庫系統(tǒng)中使用的數(shù)據(jù)集合。
三、數(shù)據(jù)庫介紹
1、定義
數(shù)據(jù)庫是存放數(shù)據(jù)的倉庫。它的存儲空間很大,可以存放百萬條、千萬條、上億條數(shù)據(jù)。但是數(shù)據(jù)庫并不是隨意地將數(shù)據(jù)進行存放,是有一定的規(guī)則的,否則查詢的效率會很低。當今世界是一個充滿著數(shù)據(jù)的互聯(lián)網(wǎng)世界,充斥著大量的數(shù)據(jù)。即這個互聯(lián)網(wǎng)世界就是數(shù)據(jù)世界。數(shù)據(jù)的來源有很多,比如出行記錄、消費記錄、瀏覽的網(wǎng)頁、發(fā)送的消息等等。除了文本類型的數(shù)據(jù),圖像、音樂、聲音都是數(shù)據(jù)。
數(shù)據(jù)庫是一個按數(shù)據(jù)結構來存儲和管理數(shù)據(jù)的計算機軟件系統(tǒng)。數(shù)據(jù)庫的概念實際包括兩層意思:
數(shù)據(jù)庫是一個實體,它是能夠合理保管數(shù)據(jù)的“倉庫”,用戶在該“倉庫”中存放要管理的事務數(shù)據(jù),“數(shù)據(jù)”和“庫”兩個概念結合成為數(shù)據(jù)庫。數(shù)據(jù)庫是數(shù)據(jù)管理的新方法和技術,它能更合適的組織數(shù)據(jù)、更方便的維護數(shù)據(jù)、更嚴密的控制數(shù)據(jù)和更有效的利用數(shù)據(jù)。數(shù)據(jù)庫作為最重要的基礎軟件,是確保計算機系統(tǒng)穩(wěn)定運行的基石。
2、發(fā)展現(xiàn)狀
在數(shù)據(jù)庫的發(fā)展歷史上,數(shù)據(jù)庫先后經(jīng)歷了層次數(shù)據(jù)庫、網(wǎng)狀數(shù)據(jù)庫和關系數(shù)據(jù)庫等各個階段的發(fā)展,數(shù)據(jù)庫技術在各個方面的快速的發(fā)展。特別是關系型數(shù)據(jù)庫已經(jīng)成為目前數(shù)據(jù)庫產(chǎn)品中最重要的一員,80年代以來, 幾乎所有的數(shù)據(jù)庫廠商新出的數(shù)據(jù)庫產(chǎn)品都支持關系型數(shù)據(jù)庫,即使一些非關系數(shù)據(jù)庫產(chǎn)品也幾乎都有支持關系數(shù)據(jù)庫的接口。這主要是傳統(tǒng)的關系型數(shù)據(jù)庫可以比較好的解決管理和存儲關系型數(shù)據(jù)的問題。隨著云計算的發(fā)展和大數(shù)據(jù)時代的到來,關系型數(shù)據(jù)庫越來越無法滿足需要,這主要是由于越來越多的半關系型和非關系型數(shù)據(jù)需要用數(shù)據(jù)庫進行存儲管理,以此同時,分布式技術等新技術的出現(xiàn)也對數(shù)據(jù)庫的技術提出了新的要求,于是越來越多的非關系型數(shù)據(jù)庫就開始出現(xiàn),這類數(shù)據(jù)庫與傳統(tǒng)的關系型數(shù)據(jù)庫在設計和數(shù)據(jù)結構有了很大的不同, 它們更強調數(shù)據(jù)庫數(shù)據(jù)的高并發(fā)讀寫和存儲大數(shù)據(jù),這類數(shù)據(jù)庫一般被稱為NoSQL(Not only SQL)數(shù)據(jù)庫。 而傳統(tǒng)的關系型數(shù)據(jù)庫在一些傳統(tǒng)領域依然保持了強大的生命力。
3、數(shù)據(jù)庫管理系統(tǒng)
數(shù)據(jù)庫管理系統(tǒng)是為管理數(shù)據(jù)庫而設計的電腦軟件系統(tǒng),一般具有存儲、截取、安全保障、備份等基礎功能。數(shù)據(jù)庫管理系統(tǒng)可以依據(jù)它所支持的數(shù)據(jù)庫模型來作分類,例如關系式、XML;或依據(jù)所支持的計算機類型來作分類,例如服務器群集、移動電話;或依據(jù)所用查詢語言來作分類,例如SQL、XQuery;或依據(jù)性能沖量重點來作分類,例如最大規(guī)模、較高運行速度;亦或其他的分類方式。不論使用哪種分類方式,一些DBMS能夠跨類別,例如,同時支持多種查詢語言。?
數(shù)據(jù)庫管理系統(tǒng)是數(shù)據(jù)庫系統(tǒng)的核心組成部分,主要完成對數(shù)據(jù)庫的操作與管理功能,實現(xiàn)數(shù)據(jù)庫對象的創(chuàng)建、數(shù)據(jù)庫存儲數(shù)據(jù)的查詢、添加、修改與刪除操作和數(shù)據(jù)庫的用戶管理、權限管理等。它的安全直接關系到整個數(shù)據(jù)庫系統(tǒng)的安全,其防護手段主要有:
使用正版數(shù)據(jù)庫管理系統(tǒng)并及時安裝相關補丁。做好用戶賬戶管理,禁用默認超級管理員賬戶或者為超級管理員賬戶設置復雜密碼;為應用程序分別分配專用賬戶進行訪問;設置用戶登錄時間及登錄失敗次數(shù)限制, 防止暴力破解用戶密碼。分配用戶訪問權限時,堅持最小權限分配原則,并限制用戶只能訪問特定數(shù)據(jù)庫,不能同時訪問其他數(shù)據(jù)庫。修改數(shù)據(jù)庫默認訪問端口,使用防火墻屏蔽掉對 外開放的其他端口,禁止一切外部的端口探測行為。對數(shù)據(jù)庫內存儲的重要數(shù)據(jù)、敏感數(shù)據(jù)進行加密存儲,防止數(shù)據(jù)庫備份或數(shù)據(jù)文件被盜而造成數(shù)據(jù)泄露。設置好數(shù)據(jù)庫的備份策略,保證數(shù)據(jù)庫被破壞后能迅速恢復。對數(shù)據(jù)庫內的系統(tǒng)存儲過程進行合理管理,禁用掉不必要的存儲過程,防止利用存儲過程進行數(shù)據(jù)庫探測與攻擊。啟用數(shù)據(jù)庫審核功能,對數(shù)據(jù)庫進行全面的事件跟蹤和日志記錄。4、關系型數(shù)據(jù)庫
關系型數(shù)據(jù)庫,存儲的格式可以直觀地反映實體間的關系。關系型數(shù)據(jù)庫和常見的表格比較相似,關系型數(shù)據(jù)庫中表與表之間是有很多復雜的關聯(lián)關系的。 常見的關系型數(shù)據(jù)庫有Mysql,SqlServer等。在輕量或者小型的應用中,使用不同的關系型數(shù)據(jù)庫對系統(tǒng)的性能影響不大,但是在構建大型應用時,則需要根據(jù)應用的業(yè)務需求和性能需求,選擇合適的關系型數(shù)據(jù)庫。
5、非關系型數(shù)據(jù)庫(NoSQL)
隨著近些年技術方向的不斷拓展,大量的NoSql數(shù)據(jù)庫如MongoDB、Redis、Memcache出于簡化數(shù)據(jù)庫結構、避免冗余、影響性能的表連接、摒棄復雜分布式的目的被設計。
指的是分布式的、非關系型的、不保證遵循ACID原則的數(shù)據(jù)存儲系統(tǒng)。NoSQL數(shù)據(jù)庫技術與CAP理論、一致性哈希算法有密切關系。所謂CAP理論,簡單來說就是一個分布式系統(tǒng)不可能滿足可用性、一致性與分區(qū)容錯性這三個要求,一次性滿足兩種要求是該系統(tǒng)的上限。而一致性哈希算法則指的是NoSQL數(shù)據(jù)庫在應用過程中,為滿足工作需求而在通常情況下產(chǎn)生的一種數(shù)據(jù)算法,該算法能有效解決工作方面的諸多問題但也存在弊端,即工作完成質量會隨著節(jié)點的變化而產(chǎn)生波動,當節(jié)點過多時,相關工作結果就無法那么準確。這一問題使整個系統(tǒng)的工作效率受到影響,導致整個數(shù)據(jù)庫系統(tǒng)的數(shù)據(jù)亂碼與出錯率大大提高,甚至會出現(xiàn)數(shù)據(jù)節(jié)點的內容遷移,產(chǎn)生錯誤的代碼信息。但盡管如此,NoSQL數(shù)據(jù)庫技術還是具有非常明顯的應用優(yōu)勢,如數(shù)據(jù)庫結構相對簡單,在大數(shù)據(jù)量下的讀寫性能好;能滿足隨時存儲自定義數(shù)據(jù)格式需求,非常適用于大數(shù)據(jù)處理工作。
NoSQL數(shù)據(jù)庫適合追求速度和可擴展性、業(yè)務多變的應用場景。對于非結構化數(shù)據(jù)的處理更合適,如文章、評論,這些數(shù)據(jù)如全文搜索、機器學習通常只用于模糊處理,并不需要像結構化數(shù)據(jù)一樣,進行精確查詢,而且這類數(shù)據(jù)的數(shù)據(jù)規(guī)模往往是海量的,數(shù)據(jù)規(guī)模的增長往往也是不可能預期的,而NoSQL數(shù)據(jù)庫的擴展能力幾乎也是無限的,所以NoSQL數(shù)據(jù)庫可以很好的滿足這一類數(shù)據(jù)的存儲。NoSQL數(shù)據(jù)庫利用key-value可以大量的獲取大量的非結構化數(shù)據(jù),并且數(shù)據(jù)的獲取效率很高,但用它查詢結構化數(shù)據(jù)效果就比較差。
延伸閱讀1:分布式數(shù)據(jù)庫
所謂的分布式數(shù)據(jù)庫技術,就是結合了數(shù)據(jù)庫技術與分布式技術的一種結合。具體指的是把那些在地理意義上分散開的各個數(shù)據(jù)庫節(jié)點,但在計算機系統(tǒng)邏輯上又是屬于同一個系統(tǒng)的數(shù)據(jù)結合起來的一種數(shù)據(jù)庫技術。既有著數(shù)據(jù)庫間的協(xié)調性也有著數(shù)據(jù)的分布性。這個系統(tǒng)并不注重系統(tǒng)的集中控制,而是注重每個數(shù)據(jù)庫節(jié)點的自治性,此外為了讓程序員能夠在編寫程序時可以減輕工作量以及系統(tǒng)出錯的可能性,一般都是完全不考慮數(shù)據(jù)的分布情況,這樣的結果就使得系統(tǒng)數(shù)據(jù)的分布情況一直保持著透明性。