什么是NoSQL
NoSQL,指的是非关系型的数据库。NoSQL有时也称作Not Only SQL的缩写,是对不同于传统的关系型数据库的数据库管理系统的统称,它具有非关系型、分布式、不提供ACID的数据库设计模式等特征。
NoSQL用于超大规模数据的存储。(例如谷歌或Facebook每天为他们的用户收集万亿比特的数据)。这些类型的数据存储不需要固定的模式,无需多余操作就可以横向扩展。
SQL 和 NoSQL 的区别
SQL数据库适合那些需求确定和对数据完整性要去严格的项目。NoSQL数据库适用于那些对速度和可扩展性比较看重的那些不相关的,不确定和不断发展的需求。简单来说就是:
- SQL是精确的。它最适合于具有精确标准的定义明确的项目。典型的使用场景是在线商店和银行系统。
- NoSQL是多变的。它最适合于具有不确定需求的数据。典型的使用场景是社交网络,客户管理和网络分析系统。
SQL和Nosql的选型和比较
1.关系型数据库和非关系型数据库
SQL (Structured Query Language) 数据库,指关系型数据库。主要代表:SQL Server,Oracle,MySQL等。
NoSQL(Not Only SQL)泛指非关系型数据库,主要代表:MongoDB,Redis等。
2.关系型数据库适合存储结构化数据
如用户的帐号、地址等:
1)这些数据通常需要做结构化查询,比如join,这时候,关系型数据库就要胜出一筹
2)这些数据的规模、增长的速度通常是可以预期的
3)保证数据的事务性、一致性要求。
3.NoSQL适合存储非结构化数据
如发微博、文章、评论:
1)这些数据通常用于模糊处理,如全文搜索、机器学习
2)这些数据是海量的,而且增长的速度是难以预期的,
3)根据数据的特点,NoSQL数据库通常具有无限(至少接近)伸缩性
4)按key获取数据效率很高,但是对join或其他结构化查询的支持就比较差
目前许多大型互联网项目都会选用MySQL(或任何关系型数据库) + NoSQL的组合方案。
NoSQL的常见类型和比较
有四种常见的 NoSQL 数据库类型:列式、文档、图形和内存键值。
1.列式数据
顾名思义,是按列存储数据的。最大的特点是方便存储结构化和半结构化数据,方便做数据压缩,对针对某一列或者某几列的查询有非常大的IO优势。
1)对应的nosql: HBase,BigTable等。
2)典型应用场景:按列存储,针对某一列或者某几列的查询有非常大的IO优势。
3)优点:查找速度快,可扩展性强,更容易进行分布式扩展。
4)缺点:功能相对局限。
2.文档数据库
旨在将半结构化数据存储为文档,通常采用 JSON 或 XML 格式。与传统关系数据库不同的是,每个 NoSQL 文档的架构是不同的,可让您更加灵活地整理和存储应用程序数据并减少可选值所需的存储。
1)对应的nosql:CouchDB, MongoDb
2)典型应用场景:存储类似JSON格式的内容,可对某些字段建立索引功能,是最像关系型的数据库。
3)优点:数据结构要求不严格,表结构可变,不需要像关系型数据库一样需要预先定义表结构。
4)缺点:查询性能不高,而且缺乏统一的查询语法。
3.图形数据库
可存储顶点以及称为边缘的直接链路。图形数据库可以在 SQL 和 NoSQL 数据库上构建。顶点和边缘可以拥有各自的相关属性。
1)数据模型:图结构
2)典型应用场景:社交网络,推荐系统等。专注于构建关系图谱,善于处理大量复杂、互连接、低结构化的数据,数据往往变化迅速,且查询频繁。
3)优点:利用图结构相关算法。比如最短路径寻址,N度关系查找等。
4)缺点:很多时候需要对整个图做计算才能得出需要的信息,而且这种结构不太好做分布式的集群方案。
4.内存键值存储
可以通过key快速查询到其value。一般来说,存储不管value的格式,照单全收,是针对读取密集型应用程序工作负载(例如社交网络、游戏、媒体共享和 Q&A 门户)。内存缓存可将重要数据存储在内存中以实现低延迟访问,从而提高应用程序性能。
1)对应的nosql:Redis,Memcached等
2)典型应用场景:内容缓存,主要用于处理大量数据的高访问负载,也用于一些日志系统等等。
3)优点:查找速度快。
4)缺点:数据无结构化,通常只被当作字符串或者二进制数据。