UC伯克利拿下EMNLP最佳論文,復旦黃萱菁當選下一屆程式主席

  • 2020 年 12 月 1 日
  • AI
作者 | 陳大鑫

今日上午, EMNLP 2020各項大獎出爐!

其中最佳論文獎由加州大學伯克利分校的David Gaddy、Dan Klein兩人獲得,愛丁堡大學華人博士生 Yanpeng Zhao 獲得了最佳論文榮譽提名獎(共4篇)。

另外,本屆大會的最佳 Demo 獎由大家所熟知的 Hugging Face 團隊摘得。

復旦大學電腦科學學院教授黃萱菁將出任下一屆大會的程式主席。

除此之外,比較遺憾的是,今年的最佳短論文暫未頒發。

作為國際語言學會(ACL)下屬的 SIGDAT 小組主辦的自然語言處理領域的頂級國際會議。EMNLP每年舉辦一次,去年則與 IJCNLP 聯合在香港舉辦,今年由於疫情轉為線上舉辦。

EMNLP 2020 共收到3677篇投稿,有效投稿為3359 篇,總接收論文752 篇,包括602篇長論文、150篇短論文。

從接收率看,EMNLP 2020的論文接受率創下近五年新低,為22.4%,其中長論文接收率為 24.6%,短論文接收率為16.6%。

更多關於EMNLP 2020的論文相關資訊請移步「中國投稿量第二,接收率卻僅有13.2% ? 十張圖帶你讀懂EMNLP 2020開幕式!」一文。


1
最佳論文
榮獲EMNLP 2020最佳論文獎的是來自加州大學伯克利分校的一篇論文:
《Digital Voicing of Silent Speech》
  • 論文鏈接://www.aclweb.org/anthology/2020.emnlp-main.445.pdf
  • 開源鏈接://github.com/dgaddy/silent_speech
  • 作者:David Gaddy、Dan Klein(加州大學伯克利分校)
論文介紹:
在本文中,我們研究了對無聲語音進行數字化語音處理以使其發聲的任務:我們基於捕獲到的肌肉衝動的肌電圖(EMG)感測器測量結果,將無聲口語單詞轉換為可聽語音。
下圖展示了放置在臉上的肌電圖(EMG)電極可以檢測語音發音器的肌肉運動:
儘管先前的工作集中在訓練發聲期間從EMG收集到的語音合成模型,但我們是第一個利用在無聲發音期間從EMG收集到的語音進行模型訓練。
圖註:模型中所使用到數據的三個組成部分
具體而言,我們介紹了一種通過將音頻目標從發聲訊號轉換為靜默訊號來對靜默EMG進行訓練的方法:

與僅使用發聲數據進行訓練的baseline方法相比,我們的方法極大地提高了從靜默EMG生成音頻的清晰度,在某種數據條件下將轉錄詞誤差率從64%降低到4%,在另一種數據條件下將轉錄詞誤差率從88%降低到68%。
最後,為了促進此任務的進一步發展,我們共享了無聲和發聲面部EMG測量的新數據集。
據集下載地址://zenodo.org/record/4064409#.X7ZDfcIzZhE

2
最佳論文榮譽提名獎:
本次EMNLP 2020共有四篇論文獲得最佳論文榮譽提名獎,其中包括華人作者愛丁堡大學的Yanpeng Zhao一篇論文《Visually Grounded Compound PCFGs》。
以下是EMNLP 2020四篇最佳論文榮譽提名獎基本情況。
最佳論文榮譽提名獎論文一:
《If beam search is the answer, what was the question?》
  • 論文鏈接://arxiv.org/pdf/2010.02650.pdf

  • 作者:Clara Meister(蘇黎世聯邦理工學院)、Tim Vieira(美國約翰霍普金斯大學)、Tim Vieira(劍橋大學)

最佳論文榮譽提名獎論文二
《GLUCOSE: GeneraLized and COntextualized Story Explanations》
  • 論文鏈接://arxiv.org/pdf/2009.07758.pdf

  • 作者:Nasrin Mostafazadeh、Aditya Kalyanpur、Lori Moon、David Buchanan、Lauren Berkowitz、Or Biran、Jennifer Chu-Carroll

最佳論文榮譽提名獎論文三:
《Spot The Bot: A Robust and Efficient Framework for the Evaluation of Conversational Dialogue Systems》
  • 論文鏈接://arxiv.org/pdf/2010.02140v1.pdf
  • 作者:Jan Deriu、Don Tuggener、Pius von Daniken、Mark Cieliebak、Alvaro Rodrigo、Jon Ander Campos、Aitor Soroa、Aitor Soroa、Thiziri Belkacem
最佳論文榮譽提名獎論文四:《Visually Grounded Compound PCFGs》
  • 論文鏈接://arxiv.org/pdf/2009.12404.pdf

  • 項目地址://github.com/zhaoyanpeng/vpcfg

  • 作者:Yanpeng Zhao、Ivan Titov(愛丁堡大學)


3
最佳 Demo 論文
今年榮獲EMNLP 2020最佳Demo論文獎項的是來自Hugging Face團隊的一篇論文:《Transformers: State-of-the-art Natural Language Processing》
  • 論文鏈接://arxiv.org/pdf/1910.03771.pdf
  • Transformers 庫地址://github.com/huggingface/transformers
  • 作者:Hugging Face 團隊
論文介紹:

模型體系架構和模型預訓練的發展推動了自然語言處理的最新進展。

Transformer體系架構有助於構建更高容量的模型,而預訓練使得在大量任務中高效利用大模型容量成為可能。

Hugging Face 團隊創建了Transformers開源程式碼庫,旨在將這些NLP進步開放給更廣泛的機器學習社區。

該庫包含了在統一API下經過精心設計的SOTA模型的Transformer架構。

該庫彙集了由社區製作並可供社區使用的精選預訓練模型的集合。Transformer設計可由研究人員不斷擴展,對從業人員使用而言簡單易行,並且可以快速而強大的進行工業部署。

目前,該庫的 star 量高達 36.9K,包含數千個預訓練模型,如知名度非常高的ALBERT、BERT、GPT、GPT-2、Transformer-XL、RoBERTa、ELECTRA、XLNet等模型。

4
下一屆大會
在會議上,EMNLP組委會還宣布了下一屆會議將會在明年的11月7號到11月11日於多明尼加舉行。
此外恭喜復旦大學黃萱菁老師,她將成為下一屆的程式主席!本次EMNLP 2020中她也有6篇論文入選。

黃萱菁,復旦大學電腦科學學院教授,2008年至2009年,UMass Amherst CIIR的訪問學者。她的研究興趣包括自然語言處理、資訊檢索、人工智慧、深度學習等。她在頂級會議上發表了數十篇論文,包括SIGIR、ACL、ICML、IJCAI、AAAI、CIKM、ISWC、EMNLP、WSDM和COLING。她曾擔任NLPCC 2017、CCL 2016、SMP 2015和SMP 2014的PC聯合主席……

Google學術主頁://scholar.google.com/citations?user=RGsMgZA4H78C&hl=en

以下是黃萱菁團隊本次EMNLP 2020主會錄取論文:

1、《Tasty Burgers, Soggy Fries: Probing Aspect Robustness in Aspect-Based Sentiment Analysis》.

 Xiaoyu Xing, Zhijing Jin, Di Jin, Bingning Wang, Qi Zhang and Xuanjing Huang.

2、《A Knowledge-Aware Sequence-to-Tree Network for Math Word Problem Solving》. 

Qinzhuo Wu, Qi Zhang, Jinlan Fu and Xuanjing Huang.

3、《Uncertainty-Aware Label Refinement for Sequence Labeling》. 

Tao Gui, Jiacheng Ye, Qi Zhang, Zhengyan Li, Zichu Fei, Yeyun Gong and Xuanjing Huang.

4、《Leveraging Declarative Knowledge in Text and First-Order Logic for Fine-Grained Propaganda Detection》

. Ruize Wang, Duyu Tang, Nan Duan, Wanjun Zhong, Zhongyu Wei, Xuanjing Huang, Daxin Jiang and Ming Zhou.

5、《PathQG: Neural Question Generation from Facts》

. Siyuan Wang, Zhongyu Wei, Zhihao Fan, Zengfeng Huang, Weijian Sun, Qi ZHANG and Xuanjing Huang.

6、《RethinkCWS: Is Chinese Word Segmentation a Solved Task?》

. Jinlan Fu, Pengfei Liu, Qi Zhang and Xuanjing Huang.


參考鏈接:
//2020.emnlp.org/blog/2020-11-19-best-papers
//2020.emnlp.org/blog/2020-09-18-decisions/


點擊閱讀原文,直達EMNLP小組!