J. 知识图谱 知识运维

概述

  • 由于构建全量的行业知识图谱成本很高,在真实的场景落地过程中, 一般遵循小步快走、快速迭代的原则进行知识图谱的构建和逐步演化。
  • 知识运维是指在知识图谱初次构建完成之后,根据用户的使用反馈、不断出 现的同类型知识以及增加的新的知识来源进行全量行业知识图谱的演化和 完善的过程,运维过程中需要保证知识图谱的质量可控及逐步的丰富衍 化。
  • 知识图谱的运维过程是个工程化的体系,覆盖了知识图谱的从知识获 取至知识计算等的整个生命周期。
  • 知识图谱的运维包括两个方面的关注点:
  • 一个是从数据源方面的基于 增量数据的知识图谱的构建过程监控;
  • 另一个是通过知识图谱的应用层发 现的知识错误和新的业务需求:例如错误的实体属性值、缺失的实体间关 系、未识别的实体、重复实体等问题。

研究现状

  • 基于增量数据的知识运维,主要存在以下两种增量方式:
  • 数据从消息队列导入图谱
  • 利用工作流引擎定时更新图谱
  • 图谱内容统计监控
  • 如果知识运维人员要高效的进行知识图谱的运维工作,需要对知识图 谱中的实体、本体、属性、关系进行统计,掌握目前的知识图谱的规模和 状况,也可以对图谱中的知识进行上传或者下载操作,方便进行图谱内知 识的管理。
  • 同时系统需具备对图谱运行中间产生的各种异常情况进行集中 的展示、问题提醒等功能,报告知识图谱中出现的问题,方便运维人员及 时进行修正。
  • 知识审核与修正
  • 按照业务的正确率的要求程度、数据的量级等角度考虑,需要对知识 图谱有明确的新增知识入库的标准和流程。
  • 知识版本管理
  • 在知识图谱的管理中,可以引入版本概念,按照知识的更迭进行管理,可以设置当前对外服务的知识版本,可以对历史的知识版本进行作废 或者回滚处理。
  • 知识安全管理
  • 知识图谱在构建的过程中往往倾向于将各种不同来源的数据进行融合 构建成为一个完整的知识体系,这样的好处是打破数据壁垒造成的知识缺 失。
  • 融合的知识对于决策与分析价值更大,但是也减低了原始数据源中的 数据访问权限的控制,带来了数据的安全风险。
  • 知识容灾备份
  • 一个完善的知识图谱 通常拥有重大的价值,高可用只保证了服务阶段的可用性,保证在意外发 生的时候图谱数据不至于完全丢失是图谱灾备需要解决的重要问题

技术发展趋势

  • 知识图谱的全生命周期质量保障
  • 多知识图谱的运维管控
  • 面向按照不同领域和范围下多个知识图谱的构建和运维,有待开发一套完备的平台对多个不同知识应用提供支撑。
  • 该平台本身需具备完 整的安全管控及权限管理,并可满足动态本体的多人协同构建、冲突检测 及讨论确定统一的版本的机制及功能,最终可对外开放给上层应用,提高 应用的智能化。