点击上方,选择星标或置顶,每天给你送干货!
![【EMNLP2020】“自言自语”来实现无监督常识问答_算法](https://s2.51cto.com/images/blog/202106/24/9eb77eb238c290e709c32b700fde87d8.png?x-oss-process=image/watermark,size_16,text_QDUxQ1RP5Y2a5a6i,color_FFFFFF,t_30,g_se,x_10,y_10,shadow_20,type_ZmFuZ3poZW5naGVpdGk=/resize,m_fixed,w_1184)
Paper: Unsupervised Commonsense Question Answering with Self-Talk
Link: arxiv.org/pdf/2004.0548NLP中的很多任务都需要引入背景知识,也就是一些基本常识,去年EMNLP主会上的一篇文章提出一个新方法来引入commonsense——‘self-talk’,简单来说就是提出问题回答问题。模型本身并不复杂,在结果上和之前的baseline相比稍好一些,但也不是碾压式超越。不过这篇文章重点在于提出了一个新的思路,一个更符合人类思考方式的思路。目前主流的方法是预训练语言模型和引入知识库,这篇文章中作者提出了一个无监督模型,用一个LM(language model)给答案打分,以及一个LM作为知识源。整个过程是基于提问的发现学习。我们来看下图中的例子,这个问题是,因为Brett在大学期间找了份实习然而Ian没有,所以谁在毕业后更慢找到了实习。(这是个选择题,选项是Brett和Ian)。1) 作者对于不同的QA任务提前整理了question prefix,如图中的‘What is the purpose of’2) 然后对于每个prefix使用Nucleus采样生成五个问题,一个问题最长是6个token,例如图中生成的’What is the purpose of internship?’3) 接下来对每一个问题生成多个答案,每一个question prefix都对应一个answer prefix,例如‘What is the purpose of’ 对应’The purpose of is’, 结合文本,第二步得到的问题和answer prefix得到十个答案。
![【EMNLP2020】“自言自语”来实现无监督常识问答_算法_02](https://s2.51cto.com/images/blog/202106/24/ab877fb267341526883f3fbfe9422050.jpeg?x-oss-process=image/watermark,size_16,text_QDUxQ1RP5Y2a5a6i,color_FFFFFF,t_30,g_se,x_10,y_10,shadow_20,type_ZmFuZ3poZW5naGVpdGk=/resize,m_fixed,w_1184)
![【EMNLP2020】“自言自语”来实现无监督常识问答_算法_03](https://s2.51cto.com/images/blog/202106/24/e4325273b4b27bff02bd2051523092bd.jpeg?x-oss-process=image/watermark,size_16,text_QDUxQ1RP5Y2a5a6i,color_FFFFFF,t_30,g_se,x_10,y_10,shadow_20,type_ZmFuZ3poZW5naGVpdGk=/resize,m_fixed,w_1184)
![【EMNLP2020】“自言自语”来实现无监督常识问答_算法_04](https://s2.51cto.com/images/blog/202106/24/9268cac33d68ffa9c5775a0df8576899.jpeg?x-oss-process=image/watermark,size_16,text_QDUxQ1RP5Y2a5a6i,color_FFFFFF,t_30,g_se,x_10,y_10,shadow_20,type_ZmFuZ3poZW5naGVpdGk=/resize,m_fixed,w_1184)
说个正事哈
由于微信平台算法改版,公号内容将不再以时间排序展示,如果大家想第一时间看到我们的推送,强烈建议星标我们和给我们多点点【在看】。星标具体步骤为:
(1)点击页面最上方“深度学习自然语言处理”,进入公众号主页。
(2)点击右上角的小点点,在弹出页面点击“设为星标”,就可以啦。
感谢支持,比心。
投稿或交流学习,备注:昵称-学校(公司)-方向,进入DL&NLP交流群。
方向有很多:机器学习、深度学习,python,情感分析、意见挖掘、句法分析、机器翻译、人机对话、知识图谱、语音识别等。
记得备注呦
推荐两个专辑给大家:专辑 | 李宏毅人类语言处理2020笔记专辑 | NLP论文解读专辑 | 情感分析
整理不易,还望给个在看!