本周 Paper 推荐丨依存分析方法、命名实体识别、词汇信息的融合、微表情检测、人脸反欺骗数据集

.

  推荐目录

利用一种优秀的依存分析方法构建命名实体识别模型

基于实例的区域表示学习:基于命名实体识别的实例研究

简化中文命名实体识别任务中词汇信息的融合

微表情检测:一种新的基准

CelebA-Spoof:具有丰富标注的大规模人脸反欺骗数据集

  利用一种优秀的依存分析方法构建命名实体识别模型

论文名称:Named Entity Recognition as Dependency Parsing

作者:Juntao Yu / Bernd Bohnet / Massimo Poesio

发表时间:2020/6/13

论文链接://arxiv.org/abs/2005.07150

推荐原因

1 作者参考一种基于仿射变换的依存分析方法,提出了一种用于命名实体识别的网络结构,主要包括四部分。其一,输入引入了多种预训练词向量(fasttext, bert)、预训练字符向量,其二,对句子中的每一个词经过BILSTM编码后的输出引入两个前馈神经网络(FN) 进行二次编码分别代表该词作为实体结构(span)首尾时的表征,其三,采用仿射变换网络(bi)计算span的分数,其四,根据既定的规则以及所有spans的分数,筛选出有效的实体

2 本文的模型在多个数据集上达到了SOTA,并且优势较明显

3 其中关于仿射变换网络的部分,需要看一下原文,才能更好理解公式中的每一项的含义,原文地址如下

//arxiv.org/pdf/1611.01734.pdf

1.jpeg

  基于实例的区域表示学习:基于命名实体识别的实例研究

论文名称:Instance-Based Learning of Span Representations: A Case Study through Named Entity Recognition

作者:Hiroki Ouchi / Jun Suzuki / Sosuke Kobayashi / Sho Yokoi / Tatsuki Kuribayashi / Ryuto Konno / Kentaro Inui

发表时间:2020/4/29

论文链接://arxiv.org/abs/2004.14514

推荐原因

1 这是我最近读过的文章里最喜爱的一篇

2 作者研究句子中区域(span)的表示,针对普通(flat)与嵌套(nest)实体识别的数据集分别定义区域(span)的表示,同时定义了邻近区域(span)的概念,即同样标签的训练集中相同标签的区域(span),  并用于训练区域(span)的表示。预测阶段,根据相似度获取邻近区域,使用argmax方法为其分配标签

3 作者从区域(span)间相似度的角度出发,提出了可解释的命名实体模型,并且在普通与嵌套实体识别的数据集上分数超过了使用softmax训练的baseline。此外,验证了这一方法在其他与区域(span)相关的nlp任务中同样有效。

2.jpeg


  简化中文命名实体识别任务中词汇信息的融合

论文名称:Simplify the Usage of Lexicon in Chinese NER

作者:Minlong Peng / Ruotian Ma / Qi Zhang / Xuanjing Huang

发表时间:2019/8/16

论文链接://arxiv.org/abs/1908.05969

推荐原因

1 作者对lattice lstm的效率进行优化,提出一种更高效的融合词语来增强汉字表示的方法,具体分为四步: 1 将句子中的每一个字,创建 ‘BMES’ 词集,分别代表以字开始(Begin)的词等;2 根据数据集中词的频率为词分配静态的权重以模仿注意力机制;3 字的词集的表示与权重结合起来得到固定长度的向量与字的表示进行融合得到最终表示;4 基于上述结果继续进行序列标注任务

2 相对于lattice结构的LSTM模型,本文的模型效率大幅度领先,分数表现上也优于lattice结构的LSTM模型及其优化的变种LSTM模型

3 文章中的汉字表示增强方法,将lattice结构压平,简化了模型,运行速度得到很快提升,同时,这种方法能很好地兼容其他模型。

3.jpeg

  微表情检测:一种新的基准

论文名称:Micro-expression spotting: A new benchmark

作者:Tran Thuong-Khanh /Vo Quang-Nhat /Hong Xiaopeng /Li Xiaobai /Zhao Guoying

发表时间:2020/7/24

论文链接://arxiv.org/abs/2007.12421

推荐原因

这篇论文关注的是微表情检测的问题。

微表情检测和识别是计算机视觉技术在心理学等领域的应用,之前已经有相关的研究。但是之前的研究更加关注微表情的识别部分,而放弃了检测步骤。而且目前已有的公开数据集还不足以支持一个强大的检测算法。这篇论文的贡献在SMIC-E数据集的基础上拓展出了SMIC-E-Long数据集,并提出了新的评估方法,使得微表情检测的算法评估更加标准化。这篇论文也在这个新的数据集的基础上评估了一系列深度学习方法,也可以帮助到后续的研究进一步开发有效的微表情检测模型。

4.jpeg

  CelebA-Spoof:具有丰富标注的大规模人脸反欺骗数据集

论文名称:CelebA-Spoof: Large-Scale Face Anti-Spoofing Dataset with Rich Annotations

作者: Zhang Yuanhan /Yin Zhenfei /Li Yidong /Yin Guojun /Yan Junjie /Shao Jing /Liu Ziwei

发表时间:2020/7/24

论文链接://arxiv.org/abs/2007.12342

推荐原因

这篇论文被ECCV 2020接收,要解决的是人脸反欺骗的问题。

由于人脸识别应用的大规模部署,人脸活体检测或者反欺诈也逐渐成为重要的研究方向。这篇论文的最大贡献是提出了一个新的大规模的人脸反欺骗公开数据集CelebA-Spoof,包含了10177个人物个体的625,537张照片,在规模上超过了现有的其他数据集。而且这个新数据集有丰富的标注,包含了10个欺骗类型标注,能够对未来的研究有很大的促进作用。


如何参与到更多论文讨论学习中?

AI研习社论文讨论微信群,分别有【NLP论文讨论群】【CV论文讨论群】【强化学习讨论群】,未来将会更细分方向和内容,群里面可以分享你觉得不错的论文,可以和同学一起讨论论文复现结果等细节,欢迎大家加入并积极参与活跃!

小助手222.jpeg

扫码添加小助手微信,发送【XX论文】,如:强化学习论文,即可进入相关的论文讨论群。

Tags: