最近在设计一些复杂的 MySQL 数据库表。
碰到一些需要存储用户所得成就、用户所得称号、用户消息之类的数据的需求。
感觉这类数据其实可以直接用 JSON 格式存储在 user_meta 表的 text 类型字段里。
而不需要设计过于复杂的表。
当然并不是所有数据都存储在一起,可能按照 100 条数据/条记录的方法。
优点是:
每页显示 50 条用户数据的话,每页只要读一次数据库的一条记录就行了,而不需要遍历 50 条记录。
把数据库的压力分担到程序执行上,貌似更多情况是数据库压力过大导致网站挂掉。
不需要设计复杂的数据库表,因为这类数据的结构可能经常变动,用 JSON 可以在程序中做好处理。
但是我不知道这样设计的缺点,因为我没有足够的经验。
所以我的问题是:
在关系型数据库中频繁使用 JSON 格式来存储不需要索引的数据好么?
或者有没有更好的方案呢?
麻烦大家了,谢谢 =w=
回答
既然不需要索引,这种情况看起来用KeyValue库更合适一些,比如TC/TT, Bdb, Redis;或者MongoDb这种文档型数据库也可以(但也有很多设计上的坑)。
其他理由如下:
1. Mysql库里慎用text字段,性能不乐观……
2. 一旦需要对这些数据进行索引或者统计,从MySQL中解出所有的数据并重新入库成本相当巨大……
3. 大JSON的parse性能同样不乐观,而且对于中文数据,纯JSON太占空间了……
4. 100条/记录的存储方式,如果需要对其中一条进行增加/删除/更新,即需要更新整个100条,更新量比较大;同样可能会产生并发问题,需要自行实现行锁。
一般情况下,如果你用了关系数据库,不要轻易(为了性能/空间)做违反范式的设计,除非你有足够的理由和把握,否则会给未来的维护升级带来无尽的麻烦。
通常建议:
1. 换Key-Value库/文档库(mangodb)
2. 或者关系库做好缓存和索引优化,可以把一个用户相关的勋章称号都缓存在一个key下,这个是经过被各大网站验证过无数遍的设计……
数据库 = PAYLOAD + INDEX
以上不是公理, 却是更好的了解数据库的一个新视角
提问者的数据库设计方案, 有点类似大神Bret Taylor(FB ex-CTO)的一篇blog
相信这种解决方法已经在frendfeed被验证过, 经得起考验
KV的编程的一条核心思想, 就是把那些需要query的东西, 变成已经存在的数据.
比如用户发的所有帖子, 以前需要按照user_id查询, 现在我们把帖子id放到users表的json里面, 那么一句查询(依赖索引)就变成了n条k/v的get操作.(请灵活运用)
我的个人建议, 无需一开始就使用key/value数据库, 但是将mysql设计的可以轻易的用kv数据库代替, 以提高数据库PAYLOAD部分的吞吐能力. 而在INDEX部分, B Tree算法没有过时, mysql就不会过时.
对于mongodb的复杂算法和实现, 我更加倾向于memcachedb/redis这种一句话就可以讲清楚自己在做什么的数据库方案.
总之, 解决问题的思想无需被范式捆绑.
多看一看别人怎么做的, 你的奇思妙想可能已经不是独一无二的了.
目前能想到的问题有两个:
1、无法对这些数据进行排序
2、搜索好像不是很方便?
感觉若是要对json操作的话挺耗费性能的吧