捷報!清華孫茂松領導的NLP團隊榮獲ACL 2022「最佳演示論文獎」

  • 2022 年 5 月 26 日
  • AI

作者|王玥

編輯|陳彩嫻

ACL 2022官方發佈消息稱,清華大學自然語言處理與社會人文計算實驗室獲得ACL 2022最佳演示論文獎(Best Demo Paper Award)。

該獎項是ACL系列會議對System Demonstration論文授予的最佳論文獎項,每屆會議基於評審人員評估的系統貢獻度、完成度、影響力及會議演示綜合效果的綜合評價評選出一篇獲獎論文。

圖註:ACL 2022 官網宣布獎項頁面


1

獲獎論文

據悉,清華NLP此次獲獎的論文題為「OpenPrompt:一種用於提示學習的開源框架(OpenPrompt: An Open-source Framework for Prompt-learning)」。作者為丁寧*,胡聲鼎*,趙威霖*,陳雨琳,劉知遠,鄭海濤,孫茂松(*代表共同第一作者)。

論文地址://arxiv.org/abs/2111.01998

該篇論文提出了OpenPrompt,這是一個統一的易於使用的提示學習(Prompt-learning)編程工具包。

圖註:OpenPrompt的總體架構

提示學習是現代自然語言處理驅動預訓練語言模型的新範式,提示學習通過插入額外的上下文和標籤映射,直接將下游任務組織成模型的預訓練任務(如Masked Language Model)來進行訓練,在多種NLP任務上取得了很好的表現。

然而,目前尚且沒有一套針對提示學習的編程框架,現有的提示學習代碼庫往往在傳統的微調範式下做出改動,只為特定場景提供有限的實現。由於提示學習是預訓練任務與模型、NLP下游任務、先驗知識的綜合過程,在實現中往往需要考慮很多細節,如模板(Template)和標籤(Verbalizer)映射生成策略等等,這些細節問題在實踐中可能會給編程者帶來諸多障礙。

這篇文章提出了OpenPrompt。據介紹,它具有高效、模塊化和可擴展性的特點,同時其可組合性允許使用者在一個統一的範式中自由組合不同的預訓練模型、任務形式和提示模塊。使用者可以方便地部署提示學習框架,並不受限制地評估它們在不同的NLP任務和模型上的通用性。OpenPrompt在GitHub上已開源,目前已收到約1500顆星標,受到了業界的關注和認可。



2

清華NLP實驗室

清華大學計算機系自然語言處理與社會人文計算實驗室(THUNLP)成立於20世紀70年代末,最初在黃昌寧教授的帶領下從事中文信息處理方面的研究工作,是國內開展自然語言處理研究最早、深具影響力的科研單位。

THUNLP 實驗室學術帶頭人為孫茂松教授。據清華大學官網介紹,孫茂松教授為清華大學計算機系教授,清華大學人工智能研究院常務副院長及博士生導師。他的主要研究領域為自然語言處理、互聯網智能、機器學習、社會計算和計算教育學。

圖為孫茂松教授

孫茂松教授在國際刊物、會議及國內核心刊物上發表多篇論文,Google Scholar總引用數約2,4300次。

亮點工作

THUNLP的亮點工作,要屬孫茂松教授帶領的THUAIPoet團隊研發的「九歌」中文詩歌自動生成系統。「九歌」支持集句詩、絕句、藏頭詩、詞等不同體裁詩歌的在線生成。作為目前最有影響的詩歌生成系統之一,「九歌」曾於2017年登上央視一套大型科技類挑戰節目《機智過人》第一季的舞台,與當代優秀青年詩人同台競技比拼詩詞創作。

圖註:「九歌」工作界面

2017年上線至今,「九歌」已累計為用戶創作超過700萬首詩詞,並於全國計算語言學學術會議(CCL)榮獲最佳論文獎(2018)和兩次最佳系統展示獎(2017, 2019)。

THUNLP實驗室瞄準以中文為核心的自然語言處理前沿課題,在中文信息處理、機器翻譯、社會計算、智慧教育和知識圖譜等方面開展系統深入的研究,不僅手握「九歌」這樣的亮點工作,更取得了一系列有世界影響力的原創成果,培養了一批人工智能優秀人才,在國內外具有較大的學術影響。

參考鏈接:

//www.2022.aclweb.org/

//www.2022.aclweb.org/best-demo-paper-award

//114.215.64.60:8094/site2/index.php/en

//www.cs.tsinghua.edu.cn/info/1121/3554.htm

//openhownet.thunlp.org/about_thunlp

//scholar.google.com/citations?user=zIgT0HMAAAAJ&hl=en

雷峰網