微软LazyGraphRAG：新一代超低成本RAG

原创

沈页dd 2024-12-03 14:55:34 ©著作权

文章标签 人工智能 ai 大模型 LLM AI大模型 文章分类 HarmonyOS 后端开发

©著作权归作者所有：来自51CTO博客作者沈页dd的原创作品，请联系作者获取转载授权，否则将追究法律责任

微软GraphRAG自发布以来，引起了很大关注（目前19.6k star），但是成本/慢一直被诟病，微软LazyGraphRAG应运而生，其只有完整GraphRAG成本的 0.1%。低成本的核心：

使用 NLP 名词短语提取来提取概念及其共现
使用图形统计来优化概念图并提取分层社区结构

微软LazyGraphRAG：新一代超低成本RAG_ai

示例对比，LazyGraphRAG论据更加详细，Query：描述 2024 年健康保险计划开放注册期间，美国个人在选择健康保险计划时应考虑哪些因素。

微软LazyGraphRAG：新一代超低成本RAG_ai_02

一、LazyGraphRAG效果评测

LazyGraphRAG的一个关键优势是其在成本和质量方面的固有可扩展性。在一系列竞争方法（标准向量RAG、RAPTOR、GraphRAG本地、GraphRAG全局和DRIFT搜索机制）中，LazyGraphRAG在成本-质量上显示出强大的性能，如下所示：

LazyGraphRAG数据索引成本与向量RAG相同，是完整GraphRAG成本的0.1%。
对于与向量RAG相当的查询成本，LazyGraphRAG在本地查询上超越了所有竞争方法，包括长上下文向量RAG和GraphRAG DRIFT搜索（我们最近引入的RAG方法，已被证明优于向量RAG）以及GraphRAG本地搜索。
相同的LazyGraphRAG配置还显示出与GraphRAG全局搜索相当的答题质量，但对于全局查询，查询成本降低了700多倍。
对于GraphRAG全局搜索查询成本的4%，LazyGraphRAG在本地和全局查询类型上显著超越了所有竞争方法，包括C2级别的GraphRAG全局搜索（社区层级中的第三层，推荐大多数应用使用）。

微软LazyGraphRAG：新一代超低成本RAG_ai_03

图1显示了LazyGraphRAG在与八个竞争条件的对比中的胜率。在最低预算水平，即使用低成本LLM模型进行100次相关性测试（与SS_8K成本相同）时，LazyGraphRAG在本地和全局查询上显著超越了所有条件，除了全局查询的GraphRAG全局搜索条件。在预算增加到500次相关性测试时，使用的是更先进的LLM模型（C2查询成本的4%），LazyGraphRAG在本地和全局查询上显著超越了所有条件。随着相关性测试预算增加到1,500，LazyGraphRAG的胜率持续上升，展示了其在成本与质量方面的可扩展性。

微软LazyGraphRAG：新一代超低成本RAG_AI大模型_04

二、GraphRAG无价值了？

这是否意味着所有支持图形的 RAG 都应该采用LazyGraphRAG模式？微软认为答案是否定的，原因有三：

GraphRAG 实体、关系和社区摘要的数据索引具有超越问答的使用价值（例如，阅读和分享为报告）。
实体、关系和社区摘要的 GraphRAG 数据索引与类似 LazyGraphRAG 的搜索机制相结合，可能会比单独使用 LazyGraphRAG 取得更好的效果。
一种旨在支持类似 LazyGraphRAG 的搜索机制（例如，通过预先声明和主题提取）的新型 GraphRAG 数据索引可能会实现最佳结果。

https://www.microsoft.com/en-us/research/blog/lazygraphrag-setting-a-new-standard-for-quality-and-cost/

上一篇：提示工程中的 Zero-shot、One-shot、Multi-shot：它们到底是什么？进阶必看！

下一篇：LazyGraphRAG:微软重磅推出高性价比下一代GraphRAG

提问和评论都可以，用心的回复会被更多人看到评论

发布评论

相关文章

官方博客	全部文章	热门标签	班级博客
了解我们	网站地图	意见反馈

鸿蒙开发者社区	51CTO学堂
51CTO	软考资讯