「CCF-NLP走進高校」系列分享報告會(河北科技大學站)圓滿結束
AI科技評論按:2020年11月8日,由中國電腦學會自然語言處理專業委員會(CCF-NLP)發起,聯合AI研習社及各個知名高校開展的「CCF-NLP走進高校」系列高校NLP研究分享報告會——河北科技大學站,通過線下報告會和線上會議直播相結合的方式進行。
本期報告會邀請了南京大學電腦科學與技術系副教授-黃書劍、浙江大學電腦學院副教授-趙洲、西湖大學特聘研究員-張岳三位特邀報告嘉賓,北京大學語言計算與互聯網挖掘研究室負責人&自然語言處理專業委員會秘書長萬小軍和西湖大學特聘研究員張岳主持了本次報告會。
在本次報告會上,專家們圍繞《機器翻譯中的注意力機制及其控制》、《非自回歸多模態翻譯》、《對話系統的兩個挑戰》等NLP熱門話題展開了精彩報告。
本次報告會採取「線上+線下」相結合的分享方式,東道主河北科技大學組織部分師生在線下校內會議廳聽講交流,線上通過AI研習社和Bilibili等平台線上觀看和互動,同學們互動踴躍。
北京大學語言計算與互聯網挖掘研究室負責人&自然語言處理專業委員會秘書長萬小軍老師作為主持人進行了開場介紹。萬老師首先對主辦方和承辦方的精心策劃以及分享嘉賓、老師和同學們的積极參与表示熱烈的歡迎和衷心的感謝,接著介紹了「CCF-NLP走進高校系列活動」的宗旨和目的:為了讓NLP領域的最新知識和成果得到更好地傳播,為了搭建起各地高校師生互動交流的橋樑,為了更好地促進NLP領域的不斷向前發展。
隨後,東道主河北科技大學資訊科學與工程學院院長張冬雯老師向大家介紹了河北科技大學的矚目成就和學校概況,對分享嘉賓和主持人以及現場同學們的到來表示衷心的感謝。
接下來的報告環節中,首先進行分享的是南京大學電腦科學與技術系副教授-黃書劍老師,分享主題是《機器翻譯中的注意力機制及其控制》。
黃老師從神經網路翻譯的建模方式入手講述了注意力機制以及與其相關的一些研究。注意力機制是現在自然語言處理中普遍使用的學習機制,它可以自動獲取跟當前內容相關的資訊,並且自注意力可以進行高效的計算。針對這一機制,黃老師介紹了所在團隊進行的以下三個方面的研究:1.注意力機制中的位置建模,2.多頭注意力機制及其利用,3.篇章中的注意力機制學習。這些研究也是整個機器翻譯和自然語言可解釋性研究的一部分,能更好地幫助我們理解當前的模型,更好地發揮注意力機制的作用。
在問答環節,黃老師對同學們提出的「機器翻譯還有哪些瓶頸?」「位置向量建模有哪些弊端?」「多頭注意力中如何進行pair-wise評估?」等問題進行了細緻的解答。
在黃書劍老師之後,浙江大學電腦學院的副教授-趙洲老師進行了題為《非自回歸跨模態翻譯》的報告。
報告首先從介紹機器翻譯的背景開始,接著講述了跨模態翻譯的多種應用(例如語音合成、語音識別、唇語識別等),並分別對比了自回歸建模和非自回歸建模的優缺點和常用方法。趙老師通過分析TDS的例子,講述了基於隱變數的建模方式;通過分析機器翻譯和語音識別中的例子介紹了序列蒸餾的方式;以及介紹了什麼是概率密度蒸餾及其作用。最後趙老師通過CoMMA模型架構介紹了幾個具有啟發意義的多模態翻譯工作。
接下來的問答環節中,趙老師對同學們提出的「非自回歸跨模態翻譯的競爭力是什麼?」「唇語識別如何處理歧義?」「多模態翻譯有哪些應用場景?對哪些人的幫助會比較大」等多個提問進行了解答。
最後一位進行報告的是西湖大學特聘研究員張岳老師,報告主題為《對話系統的兩個挑戰》。

張岳老師首先介紹了對話系統的一些發展現狀和進展,引出對話系統分為閑聊型對話系統和任務型對話系統兩個方面。接著分別從數據採集、工作實驗、項目分析方面對閑聊式對話系統的工作-MuTual進行了介紹,進而指出對於閑聊對話系統,社會常識和場景的識別具有重要意義,只有理解對話情境,才能做出有理有據地回答。隨後,張岳老師還介紹和分析了DST和DSI工作,通過介紹研究所的DSI項目,指出任務型對話系統的最新研究成果和後續發展方向。
在最後的問答環節,同學們提出了「閑聊對話系統中如果要提升社會常識和推理能力,主要的困難是什麼?」、「低資源場景下的命名實體任務有哪些解決思路?」、「隱變數預測錯誤是否會影響到演算法準確率?」等問題,張岳老師均作出了相應的解答。
最後,萬小軍老師進行了活動總結,再次向參加活動的各位專家學者和河北科技大學以及AI研習社表示感謝,並期待更多的專家、老師和同學能持續關注NLP領域的研究進展,一起推動這一領域繼續向前發展。
此後還將會有更多的高校加入CCF -NLP走進高校系列活動,下一站分享活動已經定於2020年11月29日(星期日) 走進新疆大學,更多分享會資訊請持續關注「AI科技評論」和AI研習社官網(//www.yanxishe.com/)。
中國電腦學會自然語言處理專委會(CCF-NLP)1987年10月成立, 專委會成立之初即確定了「中國語言文字處理的電腦系統」和「以電腦為工具研究語言文字處理技術」兩個主要研究方向,主要包括(或涉及)中國各民族語言文字的自然語言處理、機器翻譯、資訊抽取、數據挖掘、資訊檢索、智慧問答、語音識別與合成、社會網路計算等眾多學術領域,以及中文計算,即中國語言文字處理的應用技術領域。專委會致力於團結、聯合、組織中文資訊技術相關領域的各界專業人士,開展學術/技術交流、發展戰略研究、專業技術標準制定、專業技術評測、專業培訓等相關活動,提高中文資訊技術領域的科研、教學、應用水平,促進研究成果的應用和向產品的轉化,提升在國家科技活動和國際學術方面的影響力。
河北科技大學是河北省重點建設的多科性骨幹大學。2007年以「優秀」的成績通過教育部本科教學工作水平評估,2011年入選教育部「卓越工程師教育培養計劃」高校。2016年入選河北省重點支援的國家一流大學建設高校。河北科技大學資訊學院秉持學校辦學宗旨和辦學理念,立足河北,服務區域經濟建設。與中電集團五十四所、軍械工程學院等科研機構建立了長期的科研合作關係。近三年承擔國家級、省部級以上的科研課題多項,並獲省級教學成果獎、科技進步獎、軍隊科技進步獎等多項獎項。資訊學院電腦科學與技術專業於1985年開始招生,是河北省最早開設電腦類本科教育的專業之一,2010年入選 「河北省電子資訊本科教育創新高地」。目前擁有「電腦軟體與理論」河北省重點學科,「電腦科學與技術」一級學科碩士授予權,河北省省級一流專業,專業綜合實力強。
為了促進更多師生對自然語言處理前沿進展的了解,幫助在校電腦及相關專業大學生成長和發展,CCF-NLP致力於讓領域內的權威大牛們走進更多的高校,與師生進行溝通和交流。這是成為中國NLP領域發展的迫切需求。自然語言處理專委會為此將舉辦一系列 CCF -NLP走進高校系列活動。CCF-NLP後續還將與更多高校合作,繼續召開一系列的「走進高校」分享活動,進一步促進各高校之間的學術交流,推動科研合作發展,為 NLP 的研究添磚加瓦。
掃碼獲取本次以及歷次活動的影片回放和嘉賓PPT分享:
