什么是知识图谱+知识图谱应用
- 知识图谱:
本质上,是一种揭示实体之间关系的语义网络,一种对现实世界的一种语义化的表示形式。知识图谱是由一条条知识组成,每条知识表示为一个三元组(Subject-Predicate-Object):实体、属性、关系。构建知识图谱的过程:信息抽取、知识融合、知识加工。 - 语义网:是利用结构化数据,加快数据流动速度的方法。
- 知识:对客观事物的归纳总结,在信息的基础之上,建立起实体之间的联系就形成了知识。
- 本体:本体是形式化、对于共享概念的明确、详细的说明。知识图谱的核心技术之一就是本体。本体融合是属于本体学习技术之一。
知识图谱的体系架构
陌生学术词记录
- 数据清洗:
是指发现并纠正数据文件中可识别的错误的最后一道程序,包括检查数据一致性,处理无效值和缺失值等。录入后的数据清理一般是由计算机而不是人工完成。 - 冷启动问题:
个性化推荐是需要依赖用户的历史行为才能预测用户的兴趣,因此大量的用户行为数据是用户的重要组成部分和先决条件。那么对于在开始阶段就像要一个个性化推荐系统的网站或应用来说,如何在没有用户历史数据的情况下设计个性化推荐并且让用户对推荐结果满意从而使用推荐系统,(个人理解:就像第一次玩抖音,如何让推荐的视频刚好符合用户的喜好)就是冷启动问题。 - 稀疏性问题:
在数据库中,稀疏数据是指在二维表中含有大量空值的数据;即稀疏数据是指,在数据集中绝大多数数值缺失或者为零的数据。稀疏数据绝对不是无用数据,只不过是信息不完全,通过适当的手段是可以挖掘出大量有用信息。
知识图谱的应用
通过知识图谱,不仅可以将互联网的信息表达成更接近人类认知世界的形式,而且提供了一种更好的组织、管理和利用海量信息的方式。目前的知识图谱技术主要用于智能语义搜索、移动个人助理、以及深度问答系统,支撑这些应用的核心技术正是知识图谱技术。除此之外还囊括法律、金融、军事、教育、医疗、科技等数十个垂直领域。
1. 深度问答
问答系统是信息检索系统的一种高级形式,能够以准确简洁的自然语言为用户提供问题的解答。多数问答系统更倾向于将给定的问题分解为多个小的问题,然后逐一去知识库中抽取匹配的答案,并自动检测其在时间与空间上的吻合度等,最后将答案进行合并,以直观的方式展现给用户。
在深度问答应用中,系统同样会首先在知识图谱的帮助下对用户使用自然语言提出的问题进行语义分析和语法分析,进而将其转化成结构化形式的查询语句,然后在知识图谱中查询答案。比如,如果用户提问:“如何判断是否感染了埃博拉病毒?”,则该查询有可能被等价变换为埃博拉病毒的症状有哪些?然后再进行推理变换,最终形成等价的三元组查询语句。
如果由于知识库不完善而无法通过推理解答用户的问题,深度问答系统还可以利用搜索引擎向用户反馈搜索结果,同时根据搜索结果更新知识库,从而为回答后续的提问提前做出准备。
2. 个性化推荐:
知识图谱的应用(来源于网络)
3.教育领域:
近些年随着教育信息化的不断推进,AI技术的广泛应用,5G网络技术的发展,也为教育行业带来了新的机遇。教育智能化也在国家政策层面,被提到了新的高度。
教育知识图谱,以学科知识为核心,建立各个学科的知识点概念建立层级关系,知识点与知识点之间的关联关系,不同知识点之间的前后序关系,构成学科知识图谱。利用这个图谱,可以把知识点间的关系,通过可视化的形式展示给学生,一目了然,可以很天然的用来帮助学生构建知识体系,查阅知识要点,发现知识点之间的关联,帮助学生做总结沉淀,消灭知识盲区。
教育图谱,本体层构建,主要是对教育领域内概念的梳理,关系,属性以及相关约束的定义,核心是schema(图表)的定义,需要深度的领域业务的理解。
关键词:智能备课、智慧学堂、自适应学习、精准的学习资源搜索、个性化教育、教育知识图谱更新与维护、Trans E算法、Trans H算法