共同探討人工智慧的下一個十年北京智源大會倒計時:2天只有大膽求真的學者,才敢於在四十歲的年齡,在業已成名之際,開啟一個完全陌生的研究方向。 MIT 教授 Regina Barzilay 便是這樣的學者。2014年,43歲的她開啟了學術的第二生命。作為自然語言處理學者,Regina Barzilay在自動文摘生成、古語言解析等方面享有盛譽。然而在這一年,她卻被告知自己罹患了乳腺癌。正當事業輝煌,卻遭此噩運,Barzilay經歷了一段極為暗淡的時光,隨後她重拾勇氣,向癌症進軍;數年之後,Regina Barzilay 已然成為智慧醫療領域的領軍人物。二排左四。6月22日,MIT 教授 Regina Barzilay 將作為特邀嘉賓在第二屆智源大會做主題報告《Learning Molecular Representation》。長按圖片免費報名
一、 NLP 巔峰之路
Regina Barzilay,以色列裔美國人,本、碩畢業於以色列 本-古里安大學,隨後前往哥倫比亞大學讀博,師從著名NLP學者Kathleen McKeown。Kathleen 是哥大歷史上首位女性電腦系主任,其導師為ACL終身成就獎獲得者Aravind Joshi。來到哥大後,Barzilay 選擇了自動文本摘要的研究方向。自動文本摘要的歷史可以追溯到上世紀 50 年代。然而直到上世紀90年代,基於統計的機器學習方法在NLP領域得到廣泛應用後,自動文本摘要的研究才真正興盛起來。1997年,Barzilay在ACL上發表了自己的第一篇論文《使用辭彙鏈進行文本摘要》,這篇論文提出了一種摘要融合的技術,這種技術不需要完整語義解釋,而是依賴從詞法鏈衍生的文本主題發展模型。這奠定了她在隨後多年的研究方向,也引導著她逐步成為該領域的領軍人物。 2001年,911事件的發生讓Kathleen 和Barzilay產生了將研究應用於實際環境的念頭。在當時,幾乎所有的媒體都在關注恐怖襲擊的事件,每天產生大量新聞,但是追根溯源,會發現這些新聞內容大同小異,對於讀者,不得不從大量新聞中獲取資訊。在Kathleen的支援下(此時Barzilay還是博士生),Barzilay啟動了一個新的項目,稱為 Newsblaster。這個項目試圖將多個在線新聞源的內容進行融合,並生成簡潔的摘要,從而減少新聞冗餘。Newsblaster 從各種資訊源(例如Yahoo、CNN、路透社、華盛頓郵報、今日美國、有線新聞等)尋找相似主題,針對每一個主題,Newsblaster 會在摘要中生成一個句子,並根據解析找出重複短語,然後通過剪切、粘貼等方式,生成該主題新聞事件的摘要。其準確性很高,根據用戶調查,其中88%的新聞摘要被認為是可以接受的。2003年,Regina Barzilay在其博士論文《Information Fusion for Multidocument Summarization: Paraphrasing and Generation》中對這些研究進展做了全面總結,這也成為多文檔自動摘要的基石。博士畢業後,Regina Barzilay去到康奈爾大學,做了為期一年的博士後研究員,隨後加入MIT。在此期間,除了繼續在文本摘要方面發力外,在計算語言學領域,Barzilay 也創造了一種演算法,可以從常用語言(例如英語)中學習注釋,從而分析人們理解較少的語言。次年,Barzilay 便獲得了NAACL 2004的最佳論文獎,並於同年入選「2004年科技研究進展榜」;2005年,獲得NSF事業獎,同年入選「MIT TR 35」;2006年,又獲得IEEE智慧系統的「AI Ten to Watch」、微軟研究獎、Ross 事業發展教授獎等。作為一名冉冉升起的新星,Regina 在NLP領域逐漸成為備受關注的焦點人物。隨後,Regina 又先後獲得了ACL 2009、SLT 2010、EMNLP2016 的最佳論文獎,NAACL 2014 的最佳學生論文獎,EMNLP 2015的最佳論文提名獎。拿獎拿到手軟,此之謂也。但凡資深一些的 NLP 研究者,誰人不識 Barzilay。
[1]//people.csail.mit.edu/regina/[2]MIT教授罹患乳腺癌,用NLP甄別患者胸前「定時炸彈」, //www.leiphone.com/news/201702/p8v6bxeqe99bKlie.html[3]Putting data in the hands of doctors,//news.mit.edu/2017/putting-data-in-the-hands-of-doctors-regina-barzilay-0216[4]三位女科學家用AI演算法將乳腺癌篩查速度提高100倍,//www.techwalker.com/2017/1023/3099554.shtml[5]//www.aminer.cn/profile/regina-barzilay/53f4567bdabfaeee22a34751[6]Cell | 利用深度學習發現新型抗生素, //www.sohu.com/a/374703970_650136[7]Regina Barzilay: Deep Learning for Cancer Diagnosis and Treatment | Artificial Intelligence Podcast, //www.youtube.com/watch?v=x0-zGdlpTeg