NLP结构化处理

转载

mob64ca1416f1ef 2024-07-29 17:05:38

近些年杂七杂八读了很多文献，但是没有一个较为系统的总结，尤其是经常会钻进死胡同，因此，今天巩固了一下@CQU弟中弟总结的怎样阅读NLP论文，对其中的部分内容做一个系统总结。

1.文献查找和归类

1.1 文献查找

1.2 文献归纳

2.文献阅读与笔记

2.1 阅读顺序

2.2 笔记

3.讨论与总结

1.文献查找和归类

面对一个新的课题时，文献查找和归类显得极为重要，这里主要有两个核心问题：

(1)找的文献是否“足够好”？

(2)文献如何分类？

在确定开始某个研究方向以后，首先就是要大量阅读这个方向的论文，NLP可以参考的文献检索网站有：

ACL Anthology：这是ACL学会建立的网站，支持该领域绝大部分国际学术会议论文的免费下载，甚至包含了其他组织主办的学术会议，例如COLING、IJCNLP等。

NLP结构化处理_nlp

检索文献的同时还需要注意上述第一个问题，“足够好”是指这篇文献具有很好的质量。通常来说，可以通过下面这些指标来识别高质量文章：

从刊物和会议角度来说，NLP方向可以参考以下会议/期刊：

ACL	会议	http://dblp.uni-trier.de/db/conf/acl/	NLP
EMNLP	会议	http://dblp.uni-trier.de/db/conf/emnlp/	NLP
NAACL	会议	http://dblp.uni-trier.de/db/conf/naacl/	NLP
COLING	会议	http://dblp.uni-trier.de/db/conf/coling/	NLP
AAAI	会议	dblp: AAAI	AI
IJCAI	会议	dblp: IJCAI	AI
NeurIPS	会议	dblp: NeurIPS	AI
ICLR	会议	dblp: ICLR	AI
NLPCC	会议	dblp: NLPCC	NLP
CCIR	会议	dblp: CCIR	NLP

Computational Linguistics	期刊	http://www.mitpressjournals.org/loi/coli	NLP
Transactions of the Association for Computational Linguistics	期刊	Transactions of the Association for Computational Linguistics	NLP

在上述表格中，会议的地址都来自 DBLP 。

下载好论文以后，还需要对文献有科学的分类和管理，这样有利于后期快速找到自己下载好的论文。这里可以参考：

合理的分类可以帮助自己梳理文献和总结。

文献不仅要读，更要记笔记！

为了快速知道作者的研究问题、内容和结论，必须有一套有效的论文阅读方法，这里推荐如下阅读顺序：

Title+Abstract——一般来说，标题中可以获得本文的大致研究内容，通常也用于大家快速检索与自己研究相关的内容，不过部分论文的标题非常含蓄，可能会让我们出现遗漏，例如Attention is all you need。进一步阅读摘要能更加有效获取文章的工作核心，这里也还需要注意，有的文章可能做了与自己相同的研究，但因为不是其核心创新而没有写到摘要中，这就需要进一步阅读更多内容。
Abstract+Introduction (The second half)——因为引言的前半部多半在介绍研究背景和早期研究，只有后半部才是自己的工作，因此核心看后半部分。
Experiments+Conclusion——学习作者的实验思路和分析方法，获得有效的研究结论
Proposal——根据自己的敏感程度进行阅读，分析作者工作和自己的不同之处和效果