如何理解数仓doris的这句话：BE会通过索引和谓词下推快速过滤数据，可以在后台执行Compact任务，减少查询时的读放大。_学亮编程手记的技术博客_51CTO博客

如何理解数仓doris的这句话：BE会通过索引和谓词下推快速过滤数据，可以在后台执行Compact任务，减少查询时的读放大。

关注 a772304419

如何理解数仓doris的这句话：BE会通过索引和谓词下推快速过滤数据，可以在后台执行Compact任务，减少查询时的读放大。

原创

a772304419 2024-09-29 11:07:11 ©著作权

文章标签 doris 数据仓库 apache 数据 SQL 文章分类 HarmonyOS 后端开发

©著作权归作者所有：来自51CTO博客作者a772304419的原创作品，请联系作者获取转载授权，否则将追究法律责任

这句话描述了Doris（一个现代化的、分布式的SQL数据库，常用于构建数据仓库）中的Backend（BE）节点在处理查询时的一些优化机制。让我们逐句来理解：

BE会通过索引和谓词下推快速过滤数据：

索引：Doris支持多种类型的索引（如Bloom Filter, Bitmap Index等），这些索引可以加速对特定列的数据查找速度。
谓词下推：当执行SQL查询时，如果查询中包含了WHERE子句定义的条件（即谓词），Doris能够将这些条件尽可能“下推”到存储层去执行。这意味着，在真正从磁盘读取数据之前，就根据这些条件对数据进行了初步筛选，从而减少了需要读取和处理的数据量。

可以在后台执行Compact任务：

在持续写入或更新过程中，表内可能会产生许多小文件或者碎片化的数据。Compaction（紧凑化）是一种定期或按需触发的过程，它将多个较小的数据文件合并成较大的文件，并且在这个过程中可能还会进行一些清理工作，比如删除不再需要的历史版本数据。
这个过程通常是在系统负载较低的时候由后台自动完成，以避免影响前台业务的正常运行。

减少查询时的读放大：

“读放大”指的是为了满足一次查询需求而实际从存储介质上读取的数据量远大于最终返回给用户的结果集大小的现象。
通过上述提到的索引使用、谓词下推以及合理的Compaction策略，Doris能够在物理层面有效地组织存储布局，使得查询过程中仅访问必要的最小范围的数据，从而降低读放大效应，提高整体性能。

综上所述，这句话强调了Doris如何利用底层技术和策略来优化查询效率及资源利用率，确保即使面对大规模数据集也能提供高效的服务。

赞
收藏
评论
分享
举报

上一篇：解决docker安装mysql容器后，navcat连接mysql提示2013错误：lost connection Lost connection to MySQL server at

下一篇：Flink CDC介绍：基于流的数据集成工具

提问和评论都可以，用心的回复会被更多人看到评论

发布评论

相关文章

举报文章

请选择举报类型

内容侵权涉嫌营销内容抄袭违法信息其他

具体原因

包含不真实信息涉及个人隐私

原文链接（必填）

补充说明

0/200

上传截图

格式支持JPEG/PNG/JPG，图片不超过1.9M

已经收到您得举报信息，我们会尽快审核

鸿蒙开发者社区

WOT技术大会

公众号矩阵

移动端

视频课免费课排行榜短视频直播课软考学堂

全部课程软考华为认证厂商认证 IT技术 PMP项目管理免费题库

在线学习

文章资源问答课堂专栏直播

51CTO

鸿蒙开发者社区

51CTO技术栈

51CTO官微

51CTO学堂

51CTO博客

CTO训练营

鸿蒙开发者社区订阅号

51CTO软考

51CTO学堂APP

51CTO学堂企业版APP

鸿蒙开发者社区视频号

51CTO软考题库

51CTO博客

首页
关注
排行榜
精品课程
免费资料
软考题库

科目全、试题精、讲解专业，扫码免费刷

搜索历史清空

热门搜索

查看【】的结果
写文章
创作中心
登录注册