斯坦福最新調研:中國在AI期刊論文被引用數、會議論文與專利申請上均排名第一,超過美國
- 2022 年 3 月 21 日
- AI

作者 | 西西
編輯 | 陳彩嫻
剛剛,斯坦福大學發布了著名的《2022年人工智慧報告》(Artificial Intelligence Index Report 2021,以下簡稱「報告」),迅速在人工智慧領域引起傳閱。
報告鏈接://aiindex.stanford.edu/wp-content/uploads/2022/03/2022-AI-Index-Report_Master.pdf
從2017年至今,斯坦福大學 AI Index 每年都會發布一份報告,由於數據詳細、調查來源清晰、觀點充實等等優點,在總結過去一年的 AI 發展上有著較為權威的發聲,一向為讀者關注。到今年,由李飛飛領導的 HAI 實驗室領導,已是第五版。
除了原先的技術趨勢分析,今年該報告還增加了對全球機器人的調查,以及25個國家與地區(不包含中國,所以此處不討論)在 AI 層面的立法活動。
更值得注意的是,今年斯坦福的AI指數報告首次大篇幅地討論了人工智慧在現實生活中的落地問題,包括 AI 在經濟發展中的角色,以及 AI 在落地推廣過程中所引起的潛在倫理問題。
報告指出,一方面,外界對 AI 領域的投資比例在上升:與2020年(460億美元)相比,2021年 AI 投資的資金增長了103%(965億美元)。同時,AI 出現「物更美、價更廉」的特徵,例如,自 2018 年以來,訓練影像分類系統的成本降低了 63.6%,而訓練效率卻了 94.4%。
但另一方面,AI 在現實生活中的日益滲透也加劇了社會倫理的危機。因此,接下來,我們也許會看到,越來越多對 AI 的討論不僅再局限於模型與演算法的創新,或連接主義與符號主義孰劣孰優,而是:在人工智慧時代全面來臨之前,我們應該做好哪些「基建層面」的準備工作?
由於報告內容長達200多頁,所以AI科技評論僅從中美對比的角度對報告進行了整理:
根據報告,從研究機構看,全球範圍內高校對 AI 研究出版物的貢獻比例最高,高達59.58%,而公司僅占 5.21%:
單就這一層面,美國的 AI 出版物中,高校比例不斷下降,2021年占 57.63%,企業占 9.76%:
而中國的 AI 出版物中,高校比例不斷上升,佔比 60.24%,企業佔比雖然也不斷上升,但2021年僅佔比 3.93%:
儘管中美關係緊張,但報告發現,在 2010 年到 2021 年期間,中美合作的AI論文數量在跨國合作論文數量排行中位居榜首,是第二名(中英合作)的2.7倍:
報告還對比了中國、歐盟&英國、與美國在過去12年的AI出版物佔比,其中中國的數量一直保持第一,佔比31.04%,其次是歐盟與英國(19.05%),美國為 13.67%:
在 AI 期刊論文的引用數上,中國的佔比逐漸上升,2021年排名第一(27.84%),美國的被引用數則為 17.45%:
在 AI 會議上,中國的論文發表數量也是排名全球第一,佔比 27.6%,而美國為 16.9%,位居第三:
儘管出版數量上中國佔優勢,但報告發現,美國在 AI 會議上的論文被引數最高,佔比29.52%,中國則只有15.32%:
在AI存儲庫(如arXiv)出版物上,美國自2011年以來一直保持領先地位,2021年佔比 32.52%,但中國也不甘落後,比例一直上升,2021年佔比16.6%:
在AI存儲庫出版物的引用數上,美國在2021年也是位居第一,引用率高達 38.6%,而中國為 16.4%:
在人工智慧專利的申請上,2021年中國申請了全球一半以上的人工智慧專利(51.69%),美國則為 16.92%:
2
中美 AI 市場對比
首先,在人才招聘一塊,報告顯示,中國香港在 AI 人才的招聘增長速度上位於全球第二,較 2016 年增長了 1.56 倍:
通過計算 2015 年至 2021 年期間 LinkedIn 用戶在給定領域的自我添加技能的頻率,報告發現,在AI 技能的滲透率上,印度的平均滲透率最高,其次是美國(2.24),而中國為 1.56,排名全球第四:
此外,在 AI 產業的投資上,美國的 AI 公司在獲得總體私人投資上位居世界第一,約為 529 億美元,而中國位居第二,為 172 億美元,美國是中國的三倍:
而在2013年至2021年的私人投資總額上,美國投資總額為 1490 億美元,中國投資總額為 619 億美元:
值得注意的是,從 2013 年到 2021 年,美國對人工智慧公司的私人投資是中國的兩倍多,而中國本身是同期英國總投資的六倍左右。按地理區域劃分,如圖 4.2.6 所示,2020 年至 2021 年美國、中國和歐盟的投資均有所增長,其中美國分別領先中國和歐盟的 3.1 倍和 8.2 倍:
從 AI 公司的數量上看,2021 年,美國以 299 家公司領先,其次是中國,有 119 家:
在 AI 的採用率上,2021年採用率最高的是高科技/電信的產品和/或服務開發(45%),其次是金融服務的服務運營(40%), 高科技/電信(34%)和金融服務的風險職能(32%):
而採用的 AI 能力類型上,2021 年,嵌入率最高的是高科技/電信行業的自然語言文本理解(34%),其次是金融服務和汽車和裝配行業的機器人流程自動化(33%)和金融服務的自然語言文本理解(32%):
那麼,採用人工智慧的風險可能有哪些?
報告稱,55% 的受訪者認為 2021 年最突出的 AI 應用風險是網路安全,其次是監管合規性(48%)、可解釋性(41%)和個人隱私(41%):
3
最後,談談 AI 倫理
報告還稱,「儘管人工智慧在全球範圍內部署,許多研究人工智慧倫理的論文還是集中在英語模型與數據集上」。
由於 AI 系統已被部署到世界各地,研究人員開始加大對 AI 與現實交互的關注度,尤其是 AI 落地可能帶來的危害,例如帶有種族歧視的人臉識別系統、帶有性別歧視的簡歷篩選系統,以及經濟收入歧視的 AI 臨床工具等。
AI 模型在落地過程中展示出來的社會偏見,使研究者們增加了對研究 AI 倫理、公平與偏見的興趣,並驅使相關從業者積極尋找解救措施。
如前所述,該報告還增加了對 AI 倫理的探討。報告發現:
-
語言模型所展現出的「偏見」問題最明顯,且新數據表明:語言模型的規模越大,在訓練數據中反映出來的偏見也越普遍。比如,一個2021年開發的 2800 億參數模型比 2018 年 1.17 億參數的模型的毒性增加了 29%
-
自 2014 年以來,針對 AI 公平性與透明性的研究呈爆炸式增長,相關出版物增加了五倍,演算法公平與偏見的研究逐漸成為主流研究課題,而且工業界在該方向的研究工作發表同比增加了 71%
-
多模態模型也呈現出多種多樣的、創紀錄的「偏見」,例如,關於 CLIP 的實驗表明,黑人影像被錯誤分類為非人類的比率是其他種族的兩倍以上
此外,報告指出,雖然全球範圍內的研究者都對 AI 公平性、問責性與透明性的研究越發感興趣,但在相關會議 FAccT 上,大多數的論文都由美國的研究人員撰寫。從2020年到2021年,來自北美機構的論文比例從70.2%上升到75.4%:
與其他語言的事實檢驗數據集相比,英語數據集的比例最高,有 142 個,而非英語數據集只有35個(其中中文數據集只有5個):
這一點間接地諷刺了人工智慧領域的中文研究者缺少對 AI 倫理的論文發表。換言之:較少中國研究者從事 AI 倫理層面的科研工作。那麼,報告的觀點是否有失偏頗呢?也許只能評論區見分曉。
在 AI 的落地研究上,如何縮小中美差距?談談你的看法。
參考鏈接:
//aiindex.stanford.edu/report/

雷峰網