一 . NoSQL的简介
NoSQL是海量数据增删改查的, 基本不支持SQL语法,
NoSQL(NoSQL = Not Only SQL ),意即“不仅仅是SQL”,互联网的早期我们的数据大多以关系型数据库来存储的。其特点是规范的数据结构(预定义模式)、强一至性、表与表之间通过外键进行关联,这些特征使我们对数据的管理更加清晰和严谨,但随着互联网的发展数据成爆炸式的增长我们对数据库需要更好的灵活性和更快的速度。这就是NoSql可以做到的。它不需要预先定义模式,没有主外键关联、支持分片、支持复本。
NoSQL的横向扩展是很方便的,只需要加节点,加机器就可以了.比普通数据库方便很多.
NoSQL 可扩展是很强的.
二 . Nosql和关系型数据库的区别
1.存储方式
关系型数据库是表格式的,因此存储在表的行和列中。他们之间很容易关联协作存储,
通常存储在数据集中,就像文档、键值对或者图结构。
2.存储结构
关系型数据库对应的是结构化数据,数据表都预先定义了结构(列的定义),
结构描述了数据的形式和内容。这一点对数据建模至关重要,
虽然预定义结构带来了可靠性和稳定性,但是修改这些数据比较困难。
而Nosql数据库基于动态结构,使用与非结构化数据。
因为Nosql数据库是动态结构,可以很容易适应数据类型和结构的变化。
3.存储规范
关系型数据库的数据存储为了更高的规范性,把数据分割为最小的关系表以避免重复,
获得精简的空间利用。虽然管理起来很清晰,但是单个操作设计到多张表的时候,
数据管理就显得有点麻烦。而Nosql数据存储在平面数据集中,
数据经常可能会重复。单个数据库很少被分隔开,而是存储成了一个整体,
这样整块数据更加便于读写
4.存储扩展
这可能是两者之间最大的区别,关系型数据库是纵向扩展,也就是说想要提高处理能力,
要使用速度更快的计算机。因为数据存储在关系表中,操作的性能瓶颈可能涉及到多个表,
需要通过提升计算机性能来克服。虽然有很大的扩展空间,
但是最终会达到纵向扩展的上限。而Nosql数据库是横向扩展的,
它的存储天然就是分布式的,可以通过给资源池添加更多的普通数据库服务器来分担负载。
5.查询方式
关系型数据库通过结构化查询语言来操作数据库(就是我们通常说的SQL)。
SQL支持数据库CURD操作的功能非常强大,是业界的标准用法。
而Nosql查询以块为单元操作数据,使用的是非结构化查询语言(UnQl),
它是没有标准的。关系型数据库表中主键的概念对应Nosql中存储文档的ID。
关系型数据库使用预定义优化方式(比如索引)来加快查询操作,
而Nosql更简单更精确的数据访问模式。
6.事务
关系型数据库遵循ACID规则(原子性(Atomicity)、一致性(Consistency)、
(基本可用(Basically Availble)、软/柔性事务(Soft-state )、最终一致性(Eventual Consistency))。由于关系型数据库的数据强一致性,
所以对事务的支持很好。关系型数据库支持对事务原子性细粒度控制,
并且易于回滚事务。而Nosql数据库是在CAP(一致性、可用性、分区容忍度)中任选两项,因为基于节点的分布式系统中,很难全部满足,所以对事务的支持不是很好,
虽然也可以使用事务,但是并不是Nosql的闪光点。
7.性能
关系型数据库为了维护数据的一致性付出了巨大的代价,读写性能比较差。
而Nosql存储的格式都是key-value类型的,并且存储在内存中,非常容易存储,
而且对于数据的 一致性是 弱要求。Nosql无需sql的解析,提高了读写性能。
8.授权方式
关系型数据库通常有SQL Server,Mysql,Oracle。主流的Nosql数据库有redis,
成本较大,而Nosql数据库通常都是开源的。
三 . 为什么使用NoSQL ?
今天我们可以通过第三方平台(如:Google,Facebook等)可以很容易的访问和抓取数据。
用户的个人信息,社交网络,地理位置,用户生成的数据和用户操作日志已经成倍的增加。
我们如果要对这些用户数据进行挖掘,那SQL数据库已经不适合这些应用了,
NoSQL数据库的发展也却能很好的处理这些大的数据
四 . NoSql的分类
1.键值(Key-Value)存储数据库
更快的存取,速度比较快,
这一类数据库主要会使用到一个哈希表,这个表中有一个特定的键和一个指针指向特定的数据。Key/value模型对于IT系统来说的优势在于简单、易部署。但是如果DBA只对部分值进行查询或更新的时候,Key/value就显得效率低下了。举例如:Tokyo Cabinet/Tyrant, Redis, Voldemort, Oracle BDB.
2.列存储数据库。
这部分数据库通常是用来应对分布式存储的海量数据。键仍然存在,但是它们的特点是指向了多个列。这些列是由列家族来安排的。如:Cassandra, HBase, Riak.
3.文档型数据库
基于Bson 或者json存储,不需要预先定义格式,在一个表中两条数据的类型可以不一样.
文档型数据库的灵感是来自于Lotus Notes办公软件的,而且它同第一种键值存储相类似。该类型的数据模型是版本化的文档,半结构化的文档以特定的格式存储,比如JSON。文档型数据库可 以看作是键值数据库的升级版,允许之间嵌套键值。而且文档型数据库比键值数据库的查询效率更高。如:CouchDB, MongoDb. 国内也有文档型数据库SequoiaDB,已经开源。
4.图形(Graph)数据库
图形结构的数据库同其他行列以及刚性结构的SQL数据库不同,它是使用灵活的图形模型,并且能够扩展到多个服务器上。NoSQL数据库没有标准的查询语言(SQL),因此进行数据库查询需要制定数据模型。许多NoSQL数据库都有REST式的数据接口或者查询API。如:Neo4J, InfoGrid, Infinite Graph.
参考