一因为新的数据项目的数据量级较大,因此考虑将mysql替换更高性能的数据库。
介绍一下NoSQL(不仅仅是关系型数据库)的不同种类和其擅长的业务。
NoSQL的一个比较明显的特点是适用于现代大数据的存储.(支持hadoop,保证了数据量级的同时对读写性能有一定要求)
目前市面上主流的开源NoSQL有以下几类:
MongoDB, Cassandra, CouchDB, Hypertable, Redis, Riak, Neo4j, HBASE, Couchbase, MemcacheDB, RevenDB and Voldemort
以上均免费且开源。作者选了几种国内比较通用的进行分析。
NoSQL | 优点 | 缺点 | 适用场景与备注 | 应用场景 |
Hbase | 支持数十亿行X上百万列 | 维护开发复杂,需要手工MapReduce | 1.简单数据写入(如“消息类”应用) | 1.Facebook的消息类应用,包括Messages、Chats、Emails和SMS系统 |
Mangodb | 功能丰富,数据类型灵活,各个性能特性都比较平衡 | 性能在同类中比较低 | 1.二级索引,支持相比于HBase更复杂的集合查找 | 例如:你本打算采用 MySQL或 PostgreSQL,但因为它们本身自带的预定义栏让你望而却步。 |
Redis | 速度快,简单,容易维护,支持多种数据结构 | 数据可靠性无保障,功能较少。 | 1.处理数据量小于以上两种的极高速读写 | 1.例如:股票价格、数据分析、实时数据搜集、实时通讯。 |
Cassandra | 对大型表格和Dynamo支持得最好,高写入性能 | 臃肿和复杂,java配置异常频出 | 适用于写入较多于读取操作(记录日志).快速开发应用程序,大量写入、统计和分析,需要扩展的部署结构 | 例如:银行业,金融业(虽然对于金融交易不是必须的,但这些产业对数据库的要求会比它们更大)写比读更快,所以一个自然的特性就是实时数据分Neo4j析 |
Neo4j | 图形类数据 | 非图形数据不适用 | 适用于图形一类数据。这是Neo4j与其他nosql数据库的最显著区别 | 例如:社会关系,公共交通网络,地图及网络拓谱 |
综合以上特征,如果想要对用户出行的数据进行统计,不同用户单日的行程数目与充电次数均不相同,mangodb的不同结构的文件存储更适用于当前场景。