高三學生髮表AI論文,提出針對網絡暴力問題的新模型AdaGCN

  • 2019 年 11 月 27 日
  • 筆記

作者 | 神經小兮 來源 | HyperAI超神經(ID:HyperAI)

【導讀】近日,在清華大學舉行的丘成桐中學科學獎半決賽落下帷幕,來自海內外的 72 支隊伍獲得了總決賽的入場券,北京師範大學附屬實驗中學的高三學生白行健,也在其中。他憑藉一篇利用圖卷積神經網絡檢測網絡暴力的論文,在比賽中脫穎而出。長江後浪推前浪,瞧,00 後也要出道了。

高三的時候,你在做什麼呢?刷《五年高考三年模擬》?還是背英語單詞?

一名叫做白行健的北京師範大學附屬實驗中學高三學生,已經在研究神經網絡了,而且帶着最新論文,入圍丘成桐中學科學獎決賽。

用卷積神經網絡,檢測網絡暴力

白行健目前是北京師範大學附屬實驗中學(簡稱北師大實驗)國際部高三學生,熱愛數學和計算機科學,擔任學校計算機社社長和⼈⽂社社長。

他本次參賽的論文標題為《基於自適應性圖卷積神經網絡的暴力用戶檢測》,論⽂提出了⼀種新的⾃適應圖卷積神經⽹絡模型(Adaptive Graph Convolutional Neural Networks,簡稱AdaGCN),是在傳統的 GCN 模型的基礎上做了改進和創新。

在新模型中,邊權被設置為可訓練的變量,這允許模型⾃適應性地學習⽤戶之間關係的權重。⼀個值得關注的問題是,雖然可訓練的邊權提升了模型的能⼒,但是參數的增加會導致模型更難訓練並可能發⽣過擬合。

為了解決這個問題,本⽂引⼊標籤平滑假設(Label Smoothness Assumption),即在社交⽹絡上相鄰的兩個⽤戶更有可能會有相同的標籤(即他們更有可能同時為暴⼒⽤戶或同時為正常⽤戶)。本⽂使⽤標籤平滑假設對邊權的訓練施加了額外的監督。

具體來說,本⽂引⼊標籤傳播算法(Label Propagation Algorithm ,簡稱 LPA),並設計了丟⼀損失(the leave-one-out loss)作為標籤平滑假設的具體實現,從⽽實現了和 GCN 模型的⾃然結合。

LPA 與丟一損失結合(左)

AdaGCN 的傳播方案,其中特徵向量和標籤同時傳播(右)

本⽂在 Manoel Horta Ribeiro 等⼈收集的數據集上應⽤了 AdaGCN 模型。該數據集包含了 10 萬餘名 Twitter ⽤戶和 200 余萬條社交關係,其中⼤約 5 千名⽤戶被標註了是否為暴⼒⽤戶。

實驗結果表明,AdaGCN 的 AUC 得分為 0.80,F1 得分為 0.47,得分⾼於所有對⽐⽅法,包括傳統的 GCN 模型、圖注意⼒⽹絡 (GAT)、標籤傳播算法(LPA)、⽀持向量機(SVM)等等。此外,AdaGCN 模型的結果具有最低的標準差,這表明 AdaGCN 模型具有很強的穩定性。

在訓練集上 LOSS、AUC 和 FI (從左至右)得分

論文中指出,在線社交平台可以利⽤本⽂提出的⽅法來更好地評估、檢測暴⼒⽤戶,防⽌暴⼒⽤戶傷害他⼈並傳播仇恨⾔論。同時,⾃適應圖卷積神經⽹絡模型,也可以⽤來評估不同類型的暴⼒⾔論造成的社會影響。

有技術,有情懷

網絡暴力的確已經是這個時代的一種新的暴力形式,它可能無形中帶給當事人巨大的傷害,甚至最終釀成嚴重後果。

在本次比賽中,白行健選擇用技術檢測網絡暴力問題,因為身處互聯網時代的他,也親眼看到過身邊的朋友遭遇網絡暴力,而他選擇用技術來幫助受害者。

前段時間,韓國女星崔雪莉的死亡

引發了一場「拒絕網絡暴力」的討論

白行健在論文中解釋道,「2018 年 2 ⽉ 10 ⽇,⼀個名叫 Ted Senior 的 22 歲男孩在林地上吊⾃殺,原因是⼀些⼈在社交媒體上惡意地分享和評判他與⼀名⼥孩的聊天內容。

在我身邊,我的同學好友在學校論壇發表觀點,但是遭受匿名的辱罵和攻擊,這種羞辱讓他感到⾮常痛苦。我深深地被這些可恨的⾏為和可怕的後果所觸動。計算機科學帶來了信息時代,社交⽹絡改變了我們的⽣活,我們期望技術會讓世界更美好。但沒有什麼是盡善盡美的。⽹絡暴⼒是信息技術⽆意中帶來的⼀個問題,我渴望找到⼀種⽅法來發現和控制它們。」

白行健還是學校 Bridge 愛心社成員

課餘時間為小朋友講解計算機知識

白行健還表示:「技術旨在為⼈類帶來便利和幸福,我們希望⽤技術的⽅法緩解網絡暴力問題,給所有⽤戶提供⼀個⼲凈、友好的互聯⽹世界。」

典型的學霸履歷

看過白行健的履歷,用「優中選優」來概括一點也不過分。

他所就讀的北師大實驗中學,創建於 1917 年,是北京首批重點中學。近幾年,其文理科一本率上線率均為 100%。學校師資隊伍中,有博士 3 人,碩士 90 餘人。

而他所在的北師大實驗的國際部,更是被家長稱為「全國最牛國際班」。

有知乎網友評論其「在大陸高中一騎絕塵」

2018 年北師大試驗 UCLA 錄取人數位居全國第一

2018 年,北師大實驗國際部的學生,86% 進入美國 TOP 30 的名校就讀。這裡的學生,不少在初一、初二就開始準備托福,初三、高一準備 SAT。

白行健不僅在這次丘成桐中學科學獎中表現優異,在此前,他一直穿梭於各種比賽之中,並取得拔尖的成績,金牌、第一名等字眼,布滿他的履歷:

白行健 (2017年-2019年部分殊榮)

•2018 年 5 ⽉受邀參加加拿⼤信息學奧林匹克競賽(CCO)決賽及國家隊集訓營,獲得決賽⾦獎第⼀名;

•2018 年 7 ⽉獲得中國信息學奧林匹克競賽決賽(NOI)銀牌;

•2018 年 11 ⽉獲得中國信息學聯賽(NOIP)北京市提⾼組⼀等獎第 3 名;

•2019 年 1 ⽉參加美國信息學奧林匹克競賽(USACO)公開賽獲得滿分,5 ⽉作為唯⼀的外國學⽣受邀參加美國國家隊集訓營(USACO 前25名美國中學⽣參加,選拔國家隊成員);

•2018 年獲得美國⾼中⽣數學建模競賽(HiMCM)Finalist 獎項(⼀等獎 7%);

•2018 年獲得美國數學⼤聯盟杯(Math League)中國賽區第⼀名;

•2018 年獲得美國數學競賽(AMC) Distinction Honor Roll(榮譽獎 1%),AIME獲得 8 分;

•2017、2018 連續兩年獲得北京師範⼤學附屬實驗中學⾦帆獎(top 2%)。

而他這次入圍丘成桐獎總決賽,也是從來自國外 1500 多個團隊中脫穎而出(共 72 支隊伍入圍),從此,他的人生履歷中又新添一條出色的記錄。

2019 年 5 月,白行健(右一)與其他三名同學代表北京

參加全國信息學奧林匹克競賽(CCF NOI)

關於丘成桐中學科學獎

白行健這次所參加的丘成桐科學獎比賽是什麼來歷呢?

Dongrun-Yau Science Awards 東潤丘成桐科學獎(原名「丘成桐中學科學獎」)是由中國著名數學大師丘成桐先生於 2008 年為全球華人中學生設立。每年累計有 1200 余所學校,約 5800 余支隊伍參與此場科學界的盛宴。

本屆丘成桐將涵蓋了數學、物理、化學、生物、

計算機及經濟金融建模六個學科

參賽隊員覆蓋國內外多個地區。每組參賽隊前期要經過至少三輪的論文評審,通過後才有資格進去決賽。進入決賽的同學,需要經過來自國際頂尖高校包括美、英、法等國在內的 20 多位世界一流的教授組成的評審團的評定,並進行英文答辯。

白行健所參加的本屆比賽,共有來自國內外 500 余所中學 1500 余團隊、近 2000 名學生報名參賽,經過初篩、函評、桌評等程序,最終 72 支隊伍入圍。

看來,這個大賽的含金量也着實不小。前段時間,我們曾在 10 月採訪了三位 95 後,剛進入職場發光發熱的他們已經在計算機領域走出自己的一片天地。

而現在 00 後已經加入 AI 大軍,還沒上大學,就已經帶着論文過關斬將,光速奔走在改變世界的道路上。

(*本文為AI科技大本營轉載文章,轉載請聯繫原作者)