一、 NoSQL简介
NoSQL(Not Only SQL),意思是”不仅仅是SQL”,值的是非关系型数据库,是一项全新的数据库革命性运动,早期就有人提出,发展至2009年趋势越发的高涨,NoSQL的拥护者们提倡运用非关系型的数据存储,相对于铺天盖地的关系型数据库运用,这一概念无疑是一种全新的思维的注入。
关系型数据库中的表都是存储一些格式化的数据结构,每条记录的字段的组成都一样,即使不是每条记录都需要所有的字段,但数据库会为每条数据分配所有的字段。而非关系型数据库以键值对(key-value)存储,它的结构不固定,每一条记录可以有不一样的键,每条记录可以根据需要增加一些自己的键值对,这样就不会局限于固定的结构,可以减少一些时间和空间的开销。
1.1见的NoSQL数据库
CouchDB
Redis
MongoDB
Neo4j
HBase
BigTable(Hadoop常用)
1.2NoSQL数据库的优缺点
优点:
1.简单的扩展
2.快速的读写
3.低廉的成本
4.灵活的数据模型
缺点:
1.不提供对SQL的支持
2.支持的特性不够丰富
3.现有的产品部够成熟
1.3关系数据库对比非关系数据库
关系型数据库 NoSQL 数据库
高度组织化结构化数据 代表着不仅仅是SQL
结构化查询语言(SQL) 没有声明性查询语言
数据和关系都存储在单独的表中 没有预定义的模式
数据操作语言,数据定义语言 键-值对存储,列存储,文档存储,图形数据库
严格的一致性 最终一致性,而非ACID 属性
基础事务 非结构化和不可预知的数据
CAP 定理
高性能,高可用性和可伸缩性
1.4NoSQL数据库分类
列存储:Hbase/Cassandra
文档存储:MongoDB/CounchDB
key-value存储:Redis/Memcache
图存储:Neo4j/FlockDB
对象存储:Db4o
XML数据库:BaseX
1.5CAP原则
CAP 定理(CAP theorem), 又被称作布鲁尔定理(Brewer’s theorem), 它指出对于一个分布式计算系统来说,不可能同时满足以下三点:
一致性(Consistency) (所有节点在同一时间具有相同的数据)
可用性(Availability) (保证每个请求不管成功或者失败都有响应)
分区容错性(Partition tolerance) (系统中任意信息的丢失或失败不影响系统的继续运行)
CAP 理论的核心是:
一个分布式系统不可能同时很好的满足一致性,可用性和分区容错性这三个需求,最多只能同时较好的满足两个
根据CAP 原理将NoSQL 数据库分成了满足CA 原则、满足CP 原则和满足AP 原则三大类:
CA - 单点集群,满足一致性,可用性的系统,通常在可扩展性上不太强大。
CP - 满足一致性,分区容错性的系统,通常性能不是特别高。
AP - 满足可用性,分区容错性的系统,通常可能对一致性要求低一些。
二、MongoDB概述
MongoDB 是一个基于分布式文件存储的数据库。由C++语言编写
2.1MongoDB体系结构
2.2MongoDB数据类型
BSON
1.BSON( Binary Serialized Document Format) 是一种二进制形式的存储格式
2.采用了类似于 C 语言结构体的名称、对表示方法,支持内嵌的文档对象和数组对象,具有轻量性、可遍历性、高效性的特点
2.3MongoDB底层原理
MongoDB 的集群部署方案中有三类角色:
实际数据存储结点、配置文件存储结点和路由接入结点。
MongDB客户端访问过程:
连接的客户端直接与路由结点相连,从配置结点上查询数据,根据查询结果到实际的存储结点上查询和存储数据。
MongoDB 的部署方案:
单机部署、复本集(主备)部署、分片部署、复本集与分片混合部署。
2.4MongoDB 的分片:
分片(sharding)是将数据拆分,将其分散存到不同机器上的过程。MongoDB 支持自动分片,可以使数据库架构对应用程序不可见。对于应用程序来说,好像始终在使用一个单机的 MongoDB 服务器一样,另一方面,MongoDB 自动处理数据在分片上的分布,也更容易添加和删除分片。
2.5 MongoDB路由结点:
路由角色的结点在分片的情况下起到负载均衡的作用。
2.6MongoDB应用场景
1、网站实时数据量大
2、数据读写都很频繁
3、价值较低
三、MySQL