应用背景
在阅读文献、写综述、写论文的related works的时候,总会苦恼如何查阅该领域的论文呢?怎么才能尽可能的查找齐全?
以前在看论文的时候,我都是先用谷歌学术搜索,然后看到优秀的相关文文献后,再去查看它的参考文献,以及引用了该文章的后续论文。
现在,connected papers这个工具就非常好地契合了需求,不仅论文知识图谱比自己寻找的齐全的多,还以可视化的界面将其中的关系展示了出来。秒啊!
connected papers简介
网址:
https://www.connectedpapers.com
界面实例:
Connected Papers,顾名思义,将相关领域已发表论文进行关联分析。这是一款帮助科研工作者完成文献探索和信息挖掘的线上可视化工具,于2020年6月份正式面向大众开放。
Connected Papers基于Semantic Scholar的数据构建图表,不需手动进行文献条目导出。Semantic Scholar是由微软联合创始人 Paul Allen运用机器学习技术创建的一款免费学术搜索引擎。该数据库囊括了1.8亿多篇学术论文,涉及计算机科学、分子生物学、微生物学和神经科学等多学科领域。
运用Connected Papers检索文献非常方便,目前支持文章标题、DOI号、以及arXiv、Semantic Scholar 和 PubMed多种来源文章的URL检索。非常适合研究者用来写综述或者初探一个新领域【1】。
可视化元素和解释
- 线条: 越粗代表相似性越强,相关度越高。
- 圆圈大小:代表引用度。
- 颜色深浅:代表发表时间,越新的论文颜色越深。
- Prior Works:以前的工作,这篇论文的引文们。这些是图表中最常被引用的论文,它们是该领域重要的开创性工作。选择这些论文的时候,有引用关系的论文会被高亮。
- Derivative Works:衍生的工作,这篇论文的后代们。这些论文可能是受到图表中的论文启发的近期相关工作,或者是对该领域的调查。
通常包括该领域的现状,系统综述,元分析等。同样,选择这些论文的时候,有引用关系的论文会被高亮。 - 每次创建图表时,该工具会分析~50000份论文,并选取与原论文相关度最高的一些论文构建图表。
- 重构关系图谱:可以随便选一个节点接着重新构建图表。
- 基于相似性(Similarity)的图表构建,意味着就算两篇文章没有互相引用,依然可能有很高的相关度。如果两篇文章引用了很多一样的文献,那么它们就有很高的相似性。【2】