OpenKE是THUNLP基于TensorFlow,PyTorch开发的用于将知识图谱嵌入到低维连续向量空间进行表示的开源框架。在OpenKE中,我们提供了快速且稳定的各类接口,也实现了诸多经典的知识表示学习模型。该框架易于扩展,基于框架设计新的知识表示模型也十分的方便。具体来说,OpenKE具有如下特点:
1.接口设计简单,可以轻松在各种不同的训练环境下部署模型。
2.底层的数据处理进行了优化,训练速度较快。
3.提供了轻量级的C++模型实现,在CPU多线程环境下也能快速运行。
4.提供了大规模知识图谱的预训练向量,可以直接在下游任务中使用。
5.长期的工程维护来解决问题和满足新的需求。
- OpenKE工具包地址:https://github.com/thunlp/OpenKE
总体介绍
知识图谱是由实体(节点)和关系(不同类型的边)组成的多关系图。每条边都表示为形式(头实体,关系,尾实体)的三个部分,也称为事实,表示两个实体通过特定的关系连接在一起,例如(北京,首都,中国)。虽然在表示结构化数据方面很有效,但是这类三元组的底层符号特性通常使知识图谱很难操作。为了解决这个问题,知识图谱表示学习被引入,将实体和关系转化为连续的向量空间,从而简化操作,同时保留知识图谱的原有结构。那些实体和关系嵌入能进一步应用于各种任务中,如知识图谱补全,关系提取,实体分类和实体解析。下表给出一些典型知识图谱的评分函数与模型形式:
设计思路与样例
整体设计分为三层,包括底层数据处理,中层模型构建和上层训练与评测策略,每一块均有足够封装,确保调用的方便。如下图所示,通过简单的代码可以对不同层的模块进行调用,最终支持知识图谱表示学习模型的训练与部署。