SQL、NoSQL、NewSQL的优缺点比较
SQL
SQL是关系型数据库管理系统(RDBMS),顾名思义,它是围绕关系代数和元组关系演算构建的。
70年代以来,它一直是主要的数据库解决方案,只是最近才有了其他产品的空间。
优点:
1.综合统一:
集数据定义、数据操纵、数据管理的功能于一体,语言风格统一,可以独立完成数据库的全部操作。
2.高度非过程化——提出“做什么”而不是“怎么做”
面向集合的操作方式——结果是元组的集合。
3.语言简洁,易学易用
只有7个动词(select、drop、alter、create、insert、update、delete)
4.它坚持ACID准则(原子性、一致性、隔离性、持久性),这些准则保证了数据库,尤其是每个事务的稳定性,安全性和可预测性。
Sql的好处来源于它的统一性,舒适性和易用性。即使只有非常有限的sql知识,可以在像online SQL Query Builder这样的特殊工具帮助下使用它。
online SQL Query Builder:在线SQL查询生成器
然而,它的缺点使得它非常不适合某些类型的项目。SQL的主要问题是它难以扩展,因为它的性能随着数据库的变大而快速下降。分布式也是有问题的。
NoSQL和NewSQL出现的原因之一是,以前的RDBMS的设计不能满足现代数据库每秒处理的事务数量。像亚马逊和阿里巴巴等需要处理惊人数据量的巨头,以前的RDBMS会在几分钟内出现问题。
NoSQL(Not Only SQL)
NoSQL越来越受欢迎,其中最重要的实现是Cassandra,MongoDB等产品。它主要用于解决SQL的可扩展性问题。因此,它是没有架构的并且建立在分布式系统上,这使得它易于扩展和分片。
然而,这些好处是以放宽ACID原则为代价的:NoSQL采取最终一致性原则,而不是所有四个参数在每个事务中保持一致。这意味着如果在特定时间段内没有特定数据项的更新,则最终对其所有的访问都将返回最后更新的值。这就是这样的系统通常被描述为提供基本保证的原因(基本可用,软状态,最终一致性)——而不是ACID。
虽然这个方案极大地增加了可用时间和伸缩性,它也会导致数据丢失----这个问题的严重程度取决于数据库服务器的支持情况和应用代码质量。在某些情况下,这个问题十分严重。
另一个NoSQL出现的问题是现在有很多类型的NoSQL系统,但它们之间却几乎没有一致性。诸如灵活性,性能,复杂性,伸缩性等等特性在不同系统间差别巨大,这使得甚至是专家在它们之间都很难选择。不过,当你根据项目特点做出了合适的选择,NoSQL可以在不显著丢失稳定性的情况下提供一个远比SQL系统更高效的解决方案。
NewSQL
https://yq.aliyun.com/product/756/ NewSQL是一种相对较新的形式。旨在使用现有的编程语言和以前不可用的技术来结合SQL和NoSQL中最好的部分。NewSQL目标是将SQL的ACID保证与NoSQL的可扩展性和高性能相结合。 即SQL+NoSQL = NewSQL
NewSQL被定义为下一代数据库的发展方向。甚至在今天的数据库特性上已经可以看到这个趋势: 最流行的开源关系型数据库MySQL,总5.7版本开始具有JSON,KV解决方案;而最流行的NoSQL数据库:MongoDB,也推出Join解决方案。
显然,因为结合了过去仅单独存在的优点,NewSQL看起来很有前途;或许,在未来的某个时候,它将成为大多数人使用的标准。
除此之外,NewSQL在每个方面比较均匀,每个解决方案都有自己的缺点和优势。例如,SAP HANA可以轻松处理低到中等的事务性工作负载,但不使用本机集群,MemSQL对于集群分析很有用,但在ACID事务上表现出较差的一致性。 因此,在这些解决方案变得真正普及之前,可能还需要一段时间。
SAP HANA:是一款支持企业预置型部署和云部署模式的内存计算平台。
Mem SQL:是世界上最快的关系型数据库,能实现每秒150万次事务。
结论:
围绕SQL有许多谬见和误解:例如,SQL已经过时,应该尽可能替换为NoSQL或New SQL。当然,这不是真的。目前,在三种基本替代方案中没有明确的领导者----每一种都有更合适的项目,而在其他情况下不太适合(或完全不适合)。因此,没有普遍的理想选择。例如,如果你主要考虑数据库应始终可用于接受新的内容,则应考虑最终一致性解决方案,如Cassandra或Riak。如果你追求高速缓存SQL,新的缓存数据库比如VoltDB似乎是明智的选择,等等。
Cassandra:一套开源分布式NoSQL数据库系统。
Riak:云数据库 HBase 版(ApsaraDB for HBase)是基于 Hadoop 的一个分布式数据库,支持海量的PB级的大数据存储,适用于高吞吐的随机读写的场景。
VoltDB:一个内存数据库,提供了 NoSQL 数据库的可伸缩性和传统关系数据库系统的 ACID 一致性。