1、什么是知识图谱

知识图谱本质上是一种基于图模型的关联网络知识表达。知识图谱将实体抽象为顶点,将实体之间的关系抽象为边,通过结构化的形式对知识进行建模和描述,并将知识可视化。

知识图谱数据挖掘文献 知识图谱数据模型_应用场景

 

2、知识图谱与图数据库

知识图谱是图数据库关联最为紧密、场景最广泛的应用方向。知识图谱以图数据库作为存储引擎,对海量信息进行智能化处理,形成大规模的知识库并进而支撑业务应用。

知识图谱根据知识形式的不同,可以分为面向语义网络的RDF图模型,和面向结构化实体的属性图模型。传统知识图谱的数据源主要是是文本,以RDF图模型为主,随着大数据时代的到来,属性图模型由于其可理解性更好而收到越来越多的开发者青睐。

知识图谱中图数据库具有存储和查询两方面的技术优势:

l 存储方面,图数据提供了灵活的设计模式。知识图谱中存储了多样、海量的数据。在关系型数据库中所有的数据库模式都需要提前定义,后续改动代价高昂。而图模型中,只需要重新增加模式定义, 再局部调整图数据,便可完成在原有的数据源上增加标签或添加属性。

l 查询方面,图数据库提供了高效的关联查询。在用图数据库存 储的知识图谱中,可以通过查询实体的边和其边上的标签(即联系) 来快速地获取与其相联系的另一实体,省去了复杂的各种表格的关联操作,关系查询更加便捷,效率显著提高。

3、应用场景

知识图谱是图数据库最为基础的底层应用场景,充分利用了其图模型 在存储和查询的优势为多行业提供知识服务,具体应用场景例如电商、金融、法律、医疗、智能家居等多个领域的决策系统、推荐系统、智能问答等等。

知识图谱数据挖掘文献 知识图谱数据模型_图数据库_02

上图描述的是用图数据库建立的针对足球明星的知识图谱实例。案例中,用户可以方便,高效地查询感兴趣的信息。例如,哪位巴塞罗那的球员曾经获得“法国足球”举办的赛事的奖项?通过图数据库可以快速建立知识图谱,完成精准、快速的查询。

图数据库善于处理大量的、复杂的、互联的、多变的网状数据,其效率远远高于传统的关系型数据库的百倍、千倍甚至万倍。基于图数据库应用广泛的优势,国内越来越多的公司开始尝试使用图数据库为业务发展助力。