一:随机查询一条数据
方法1
SELECT * FROM `table` ORDER BY RAND() limit 1
评价: 不建议使用,效率非常低,官方文档中进行说明:Order By和RAND()连用,会多次扫描表,导致速度变慢。
方法2
SELECT * FROM `table`
WHERE id >= (SELECT FLOOR(RAND() * (SELECT MAX(id) FROM `table`)))
ORDER BY id LIMIT 1;
解释:
-
SELECT MAX(id) FROM table
这段查询出最大的id值 -
SELECT floor(RAND() * (SELECT MAX(id) FROM table))
这段获取一个小于MAX(id)的随机数 -
WHERE id >= (SELECT floor(RAND() * (SELECT MAX(id) FROM table)))
这段筛选出所有的大于生成随机数的id的行 - 然后最后就把大于这个随机id的行查询出来,然后按照id排序,选择第一个,就相当与获取了所有行中随机的一行
评价: 这个方法还是有缺陷的,如果id不是从0开始的话,比如从10000开始自增,那么SELECT floor(RAND() * (SELECT MAX(id) FROM table))
得到的将是会有很大概率得到小于10000的值,经过where限定的查询结果将会是所有的查询结果的几率变大,最后limit 1
获取的是第一行数据的几率变高。
方法3
SELECT * FROM TABLE
WHERE
id >= ( SELECT FLOOR(
RAND()
* (
(SELECT MAX( id ) FROM TABLE ) -
(SELECT MIN( id ) FROM TABLE )
)
+ ( SELECT MIN( id ) FROM TABLE ))
)
ORDER BY id LIMIT 1;
评价: 解决了方法2的问题,但仍然有缺陷,如果有一个数据id为1,其余都是10000以上,那么效果与方法2几乎一致,因此部分数据的id有较大跨度时也会导致结果不平均
方法4
SELECT * FROM table AS t1 JOIN
(
SELECT ROUND(
RAND() * (
(SELECT MAX(id) FROM table) -
(SELECT MIN(id) FROM table)
)
+ (SELECT MIN(id) FROM table)
) AS id
) AS t2
WHERE t1.id >= t2.id
ORDER BY t1.id LIMIT 1;
评价:解决了方法二中MAX(id)的问题,RAND() * ((SELECT MAX(id) FROM table) - (SELECT MIN(id) FROM table)) + (SELECT MIN(id) FROM table)
可以获取MAX(id)和MIN(id)中的随机数。
以上解决方案都默认有一个不重复的数字字段,其实现在很多表的设计都是以一个自增段作为主键,当然还有一些是以uuid作为主键的,而没有数字键,这样的话,可以用mysql的函数将uuid的字符串转换成数字。而且还有一个问题,如果id字段的数字分布不均匀的话(比如按照1,4,5,6,7,8,45这样分布),也会造成随机查询的不合理,但是这里就不讨论那么复杂的问题了。
二:随机查询多条数据
方法一
把随机查询一条数据的limit 1修改成limit 5
评价: 这样获取的数据会是连续的
方法二
SELECT * FROM table AS t1 JOIN
(
SELECT ROUND(
RAND() *
((SELECT MAX(id) FROM table) - (SELECT MIN(id) FROM table)) +
(SELECT MIN(id) FROM table)
) AS id FROM table LIMIT 50
) AS t2
ON t1.id = t2.id
ORDER BY t1.id LIMIT 5;
解释:
SELECT ROUND(
RAND() *
((SELECT MAX(id) FROM table) - (SELECT MIN(id) FROM table)) +
(SELECT MIN(id) FROM table)
) AS id FROM table LIMIT 50
这样会获取50个随机数字,然后on t1.id=t2.id
会挑选出不大于50行的随机数据,然后取5条就好了。