[1] 参考论文信息

  论文名称:《基于预训练语言模型的案件要素识别方法》

  发布期刊:《中文信息学报》

  期刊信息:CSCD

【论文写作分析】之三《基于预训练语言模型的案件要素识别方法》_数据集


  论文写作分析摘要:本文非常典型。首先网络模型是直接用的一篇英论的;亮点仍然在于应用领域的新颖,即案件;其次本文的题目起得不错,要素识别(而不是多标签文本分类);论文的实验部分个人觉得写的非常好,三组对比实验,看起来很充实。

【注】:看完这篇论文,感觉我和论文之间就差一个新颖的领域(数据集)。

[2] 参考论文分解

  这篇论文前大部分都比较普通吧。下面是模型图:

【论文写作分析】之三《基于预训练语言模型的案件要素识别方法》_多标签文本分类_02


  模型几乎是直接使用的《SGM: Sequence Generation Model for Multi-Label Classification》中的模型。

  比较好的是,论文开头,对新领域“案件”的要素识别介绍的挺好的。

【注】:​​论文 SGM: Sequence Generation Model for Multi-Label Classification 讲解博客地址​​

  实验部分,论文做了3组实验:

  1、论文模型与其他​​baseline​​​的实验对比。
  2、生成式模型与阈值式模型的实验对比。
  3、Layer-attentive策略的作用 。

  我觉得最好的是论文对阈值式模型使用方法的介绍:

【论文写作分析】之三《基于预训练语言模型的案件要素识别方法》_多标签文本分类_03


【论文写作分析】之三《基于预训练语言模型的案件要素识别方法》_中文信息_04,模型的输出经过sigmoid之后,只要大于【论文写作分析】之三《基于预训练语言模型的案件要素识别方法》_中文信息_04,就算文本有这个标签,这样肯定不对,但是一直没看到好的方法。