​清華&中國工程院聯合發布:人工智慧全球2000位最具影響力學者

  • 2020 年 2 月 12 日
  • 筆記

今天上午,清華和中國工程院知識智慧聯合研究中心在清華大學聯合發布《人工智慧全球2000位最具影響力學者》,通過AMiner學術數據在全球範圍內遴選出了2000位人工智慧學科最有影響力、最具活力的頂級學者並進行了分析,揭秘了人工智慧領域人才現狀。

概述

AI 2000簡介

AI 2000 人工智慧全球最具影響力學者榜單(以下稱為AI 2000)旨在未來10年通過AMiner學術數據在全球範圍內遴選2000位人工智慧學科最有影響力、最具活力的頂級學者。AMiner由清華大學研發,檢索了19世紀以來全球1億3千餘萬學者發表的2億7千萬餘篇學術論文數據,已吸引全球220個國家/地區1000多萬獨立IP訪問,數據下載量230萬次,年度訪問量超過1100萬。

AI 2000 涵蓋人工智慧學科20個子領域,具體遴選方法為每個子領域每年選出10名獲獎者,未來10年共產生2000名;每年遴選的時候,參考過去十年該領域最有影響力的會議和期刊發表論文的引用情況,排名前10的學者當選該領域當年【AI 2000最具影響力學者獎】,排名前100的其他學者獲【AI 2000最具影響力學者提名獎】;每個領域的期刊和會議由技術委員會專家確定。20個子領域分別為經典AI(AAAI/IJCAI)、機器學習、電腦視覺、自然語言處理、機器人、知識工程、語音識別、數據挖掘、資訊檢索與推薦、資料庫、人機交互、電腦圖形、多媒體、可視化、安全與隱私、電腦網路、電腦系統、計算理論、晶片技術和物聯網。

清華大學AMiner團隊秉持「植根學術土壤,促進學科發展」的初衷,以「客觀公正」為原則,以數據為基礎構建的全球學術知識圖譜、採用人工智慧技術自動生成榜單。AMiner歷次榜單發布都受到世界著名大學和研究機構的官方認可,比如加州伯克利大學、康奈爾大學、杜克大學和 新加坡國立大學,其影響力、公信力和專業性,可見一斑。

評選規則

1、具體規則

AI 2000 涵蓋人工智慧學科20個子領域,具體遴選方法為每個子領域每年選出10名獲獎者,未來10年共產生2000名;每年遴選的時候,參考過去10年該領域最有影響力的會議和期刊發表論文的引用情況,排名前10的學者當選該領域當年【AI 2000最具影響力學者獎】,排名前100的其他學者獲【AI 2000最具影響力學者提名獎】。

榜單通過AMiner系統中所收錄的學術數據用電腦演算法自動化生成榜單排名,確保了榜單的客觀、公平、公正、公開。榜單採用的引用數據來源於Google Scholar,更新日期為2019年12月31日。

2、領域劃分

人工智慧既是電腦科學的一個分支,又是一個融合了多種學科的交叉學科,加上其最近幾年的高速發展,內涵和外延也在不斷的變化,新興的子領域不斷湧現,導致工業界和學術界並沒有一個對人工智慧的明確定義。在進行榜單生成時,綜合參考了電腦領域較為公認的具有權威性的機構(包括:ACM—Association for Computing Machinery 國際電腦學會;CCF—China Computer Federation 中國電腦學會;IEEE—Institute of Electrical and Electronics Engineers 電氣和電子工程師協會 )中關於學科的分類 。同時,又融合了中國外專家學者的建議,選擇了經典AI(AAAI/IJCAI)、機器學習、電腦視覺、自然語言處理、機器人、知識工程、語音識別、數據挖掘、資訊檢索與推薦、資料庫、人機交互、電腦圖形、多媒體、可視化、安全與隱私、電腦網路、作業系統、計算理論、晶片技術和物聯網20個子領域。

AI 2000各子領域導圖

領域會議和期刊

每個子領域所參考的頂級會議和期刊是根據《CCF推薦國際學術期刊和會議目錄》和ACM計算分類系統相關子領域的A類期刊和會議作為數據的來源。然後徵求相關專家和團體意見,補充新湧現的學科頂級期刊和會議。以下列表給出了20個子領域所採用的頂級會議和期刊。

領域

期刊/會議

經典AI(AAAI/IJCAI)

AAAI Conference on Artificial Intelligence (AAAI)

International Joint Conference on Artificial Intelligence (IJCAI)

機器學習

Annual Conference on Neural Information Processing Systems (NeurIPS)

International Conference on Machine Learning (ICML)

International Conference on Learning Representations (ICLR)

電腦視覺

IEEE Conference on Computer Vision and Pattern Recognition (CVPR)

IEEE International Conference on Computer Vision (ICCV)

European Conference on Computer Vision (ECCV)

自然語言處理

Annual Meeting of the Association for Computational Linguistics (ACL)

Conference on Empirical Methods in Natural Language Processing (EMNLP)

North American Chapter of the Association for Computational Linguistics (NAACL)

機器人

IEEE International Conference on Robotics and Automation (ICRA)

IEEE/RSJ International Conference on Intelligent Robots and Systems (IROS)

知識工程

International Semantic Web Conference (ISWC)

International Conference on Principles of Knowledge Representation and Reasoning (KR)

語音識別

IEEE International Conference on Acoustics, Speech and Signal Processing (ICASSP)

數據挖掘

ACM SIGKDD International Conference on Knowledge Discovery and Data Mining (KDD)

ACM International Conference on Web Search and Data Mining (WSDM)

資訊檢索與推薦

International ACM SIGIR Conference on Research and Development in Information Retrieval (SIGIR)

ACM Recommender Systems (RecSys)

International World Wide Web Conference (WWW)

資料庫

ACM SIGMOD International Conference on Management of Data (SIGMOD)

International Conference on Very Large Data Bases (VLDB)

人機交互

ACM CHI Conference on Human Factors in Computing Systems (CHI)

ACM Conference on Computer-Supported Cooperative Work & Social Computing (CSCW)

電腦圖形

ACM SIGGRAPH Conference (SIGGRAPH)

多媒體

ACM International Conference on Multimedia (MM)

可視化

IEEE Transactions on Visualization & Computer Graphics (TVCG)

IEEE Visualization Conference (IEEE VIS)

安全與隱私

ACM Conference on Computer and Communications Security (CCS)

IEEE Symposium on Security and Privacy (S&P)

USENIX Security Symposium (USS)

電腦網路

ACM International Conference on Mobile Computing and Networking (MobiCom)

ACM SIGCOMM Conference (SIGCOMM)

電腦系統

ACM Symposium on Operating Systems Principles (SOSP)

USENIX Symposium on Operating Systems Design and Implementation (OSDI)

計算理論

ACM Symposium on Theory of Computing (STOC)

IEEE Annual Symposium on Foundations of Computer Science (FOCS)

晶片技術

IEEE International Solid-State Circuits Conference (ISSCC)

Design Automation Conference (DAC)

Symposium on Field Programmable Gate Arrays (FPGA)

物聯網

IEEE Internet of Things Journal (IoT-J)

IEEE Transactions on Wireless Communications (TWC)

子領域相應會議/期刊

數據分析

美國學者數量領跑全球

學者地圖用於描述特定領域學者的分布情況,對於進行學者調查、分析各地區競爭力現況尤為重要,下圖為AI 2000全球學者分布情況:

AI 2000學者全球分布

地圖根據學者當前就職機構地理位置進行繪製,其中不同圖標顏色代表不同地區的學者,圖標大小代表學者數量。從地區角度看,AI 2000的學者主要集中在北美洲的美國地區;歐洲中西部也有一定的學者分布;亞洲的人才主要分布於中國及日韓地區;其他諸如南美洲、非洲等地區的學者非常稀少。學者人數TOP10國家如下所示:

學者人數TOP10國家

從國家角度看,美國學者人數的佔比最高,有1128人,佔比61.4%,超過總人數的一半,獨自領跑第一梯隊。中國排在美國之後,領跑第二梯隊,有171人,佔比9.3%。德國位列第三,是歐洲國家中擁有高影響力學者最多的地方;其餘國家的學者人數量均少在100人以下。

美國機構數量多實力強

統計各領域高引學者數TOP10的研究機構如下圖所示,位居首位的是Google公司,共165人入選榜單,也是唯一一家學者數過百的機構。從國家分布來看,只有清華大學為中國入選機構,其餘均為美國研究機構,且美國機構學者總體人數遙遙領先。

學者人數TOP10機構

此外,各領域榜首機構統計如下圖所示。Google在經典人工智慧等10個領域的學者數量都位居榜首;麻省理工學院在機器人以及計算理論2個領域的學者數量位居榜首;其他領域的榜首分布在不同的機構中,其中,中國科學院在多媒體領域的學者數量最多。

各領域學者數榜首機構統計

男女比例差異明顯

本報告高影響力學者資訊的統計中,我們針對所有上榜學者性別做出統計。男性在各領域中均占多數,共1663人;女性學者稀少,共175人。其中,機器學習領域的男性學者比例最高,達98%;人機交互領域的女性學者比例最高,但也只佔該領域的24%。

學者整體水平較高

h-index是中國外公認的評價學者學術成就的方法,從下圖可以看出本次AI 2000學者均具有較高h-index值,其中h-index大於60的人數最多,有385人,佔比20.9%。

AI 2000學者h-index分布

研究領域多點開花

AI 2000的學者中,有多位學者的研究方向涉及了多個領域,其中有2位學者出現在四個領域,他們分別是Yoshua Bengio以及Alex J. Smola;此外,有19位學者出現在3個領域,有118位學者出現在2個領域。

領域技術分析系統

領域技術分析系統可以基於AMiner大量的論文和學者資訊進行深入挖掘,對技術趨勢、國際趨勢等方面進行分析。在本榜單期刊/會議基礎上,AI 2000的趨勢分析如下:

1、技術發展趨勢

AI 2000技術趨勢分析如下圖所示。圖中每條色帶表示一個話題,其寬度表示該術語在當年的熱度,與當年該話題的論文數量呈正相關,每一年份中按照其熱度由高到低進行進行排序。通過技術趨勢分析可以發現當前熱點研究話題TOP10是:Neural Network(神經網路)、Convolutional Neural Network(卷積神經網路)、Machine Learning(機器學習)、Computer Vision(電腦視覺)、Mobile Device(移動設備)、Social Network(社交網路)、Speech Recognition(語音識別)、Information Retrieval(資訊檢索)、Support Vector Machine(支援向量機)、Data Mining(數據挖掘)。技術趨勢分析描述了技術的出現、變遷過程,可以幫助研究人員理解領域的研究歷史和現狀,快速識別研究的前沿熱點問題,例如下圖反映出的神經網路、卷積神經網路等領域在近期的快速發展

AI 2000技術發展趨勢

2、國家發展趨勢

AI 2000國家趨勢分析如下圖所示。圖中每條色帶表示一個國家,其寬度表示該國家在當年的研究熱度,與當年該國論文數量呈正相關,每一年份中按照其熱度由高到低進行排序。通過國家趨勢分析可以發現熱度TOP10的國家分別是:United States(美國)、China(中國)、United Kingdom(英國)、Germany(德國)、Canada(加拿大)、Japan(日本)、Australia(澳大利亞)、South Korea(韓國)、Italy(義大利)、France(法國)。當前研究熱度最高的國家是美國,從全局熱度來看,美國早期就有著領先優勢並一直保持著最高的熱度,同時中國的研究熱度緊隨美國之後。

AI 2000國家發展趨勢

3、國家合作

國家間論文合作情況可以根據論文中的單位資訊,將作者映射到各個國家中,進而統計各國之間的論文合作情況,合作論文數量T OP10的關係如下圖所示。在合作論文數量上,中美合作的論文數遙遙領先;在合作對象上,絕大多數的合作關係都包含美國,體現出美國的突出地位。

國家間論文合作情況

結語

通過以上分析可以發現,在學者數量方面,美國在人工智慧整體層面上佔有絕對優勢,擁有超過一半的高水平學者,為美國人工智慧的發展奠定了堅實的人才基礎;這些學者又廣泛分布在高校、企業等研究機構中,人才聚集必然會帶動各機構的快速發展。

相較而言,雖然中國在學者規模上位列第二,但是與美國還有很大的差距,相應地,中國高水平學者集中的研究機構也很匱乏,中國人工智慧領域的人才隊伍亟待加強。

在學者特點方面,AI 2000涵蓋的學者整體研究水平高,跨領域學者數量多,有利於各領域的協同發展,但是也有男女比例不均衡等問題。

在趨勢發展方面,我們可以通過分析技術趨勢了解先進技術的歷史和現狀,例如洞察神經網路的發展進程;通過分析國家趨勢了解各個國家的發展情況,通過分析國家合作認識國際合作潮流,例如美國是現在發展熱度最高的國家,由此也帶動了其他國家與美國的合作。

相信不久的將來會有更多的人工智慧關鍵技術實現突破,中國人工智慧的發展也將更加耀眼,培養更多的人才投入到人工智慧領域的發展建設中去。