高三学生发表AI论文,提出针对网络暴力问题的新模型AdaGCN

  • 2019 年 11 月 27 日
  • 笔记

作者 | 神经小兮 来源 | HyperAI超神经(ID:HyperAI)

【导读】近日,在清华大学举行的丘成桐中学科学奖半决赛落下帷幕,来自海内外的 72 支队伍获得了总决赛的入场券,北京师范大学附属实验中学的高三学生白行健,也在其中。他凭借一篇利用图卷积神经网络检测网络暴力的论文,在比赛中脱颖而出。长江后浪推前浪,瞧,00 后也要出道了。

高三的时候,你在做什么呢?刷《五年高考三年模拟》?还是背英语单词?

一名叫做白行健的北京师范大学附属实验中学高三学生,已经在研究神经网络了,而且带着最新论文,入围丘成桐中学科学奖决赛。

用卷积神经网络,检测网络暴力

白行健目前是北京师范大学附属实验中学(简称北师大实验)国际部高三学生,热爱数学和计算机科学,担任学校计算机社社长和⼈⽂社社长。

他本次参赛的论文标题为《基于自适应性图卷积神经网络的暴力用户检测》,论⽂提出了⼀种新的⾃适应图卷积神经⽹络模型(Adaptive Graph Convolutional Neural Networks,简称AdaGCN),是在传统的 GCN 模型的基础上做了改进和创新。

在新模型中,边权被设置为可训练的变量,这允许模型⾃适应性地学习⽤户之间关系的权重。⼀个值得关注的问题是,虽然可训练的边权提升了模型的能⼒,但是参数的增加会导致模型更难训练并可能发⽣过拟合。

为了解决这个问题,本⽂引⼊标签平滑假设(Label Smoothness Assumption),即在社交⽹络上相邻的两个⽤户更有可能会有相同的标签(即他们更有可能同时为暴⼒⽤户或同时为正常⽤户)。本⽂使⽤标签平滑假设对边权的训练施加了额外的监督。

具体来说,本⽂引⼊标签传播算法(Label Propagation Algorithm ,简称 LPA),并设计了丢⼀损失(the leave-one-out loss)作为标签平滑假设的具体实现,从⽽实现了和 GCN 模型的⾃然结合。

LPA 与丢一损失结合(左)

AdaGCN 的传播方案,其中特征向量和标签同时传播(右)

本⽂在 Manoel Horta Ribeiro 等⼈收集的数据集上应⽤了 AdaGCN 模型。该数据集包含了 10 万余名 Twitter ⽤户和 200 余万条社交关系,其中⼤约 5 千名⽤户被标注了是否为暴⼒⽤户。

实验结果表明,AdaGCN 的 AUC 得分为 0.80,F1 得分为 0.47,得分⾼于所有对⽐⽅法,包括传统的 GCN 模型、图注意⼒⽹络 (GAT)、标签传播算法(LPA)、⽀持向量机(SVM)等等。此外,AdaGCN 模型的结果具有最低的标准差,这表明 AdaGCN 模型具有很强的稳定性。

在训练集上 LOSS、AUC 和 FI (从左至右)得分

论文中指出,在线社交平台可以利⽤本⽂提出的⽅法来更好地评估、检测暴⼒⽤户,防⽌暴⼒⽤户伤害他⼈并传播仇恨⾔论。同时,⾃适应图卷积神经⽹络模型,也可以⽤来评估不同类型的暴⼒⾔论造成的社会影响。

有技术,有情怀

网络暴力的确已经是这个时代的一种新的暴力形式,它可能无形中带给当事人巨大的伤害,甚至最终酿成严重后果。

在本次比赛中,白行健选择用技术检测网络暴力问题,因为身处互联网时代的他,也亲眼看到过身边的朋友遭遇网络暴力,而他选择用技术来帮助受害者。

前段时间,韩国女星崔雪莉的死亡

引发了一场「拒绝网络暴力」的讨论

白行健在论文中解释道,「2018 年 2 ⽉ 10 ⽇,⼀个名叫 Ted Senior 的 22 岁男孩在林地上吊⾃杀,原因是⼀些⼈在社交媒体上恶意地分享和评判他与⼀名⼥孩的聊天内容。

在我身边,我的同学好友在学校论坛发表观点,但是遭受匿名的辱骂和攻击,这种羞辱让他感到⾮常痛苦。我深深地被这些可恨的⾏为和可怕的后果所触动。计算机科学带来了信息时代,社交⽹络改变了我们的⽣活,我们期望技术会让世界更美好。但没有什么是尽善尽美的。⽹络暴⼒是信息技术⽆意中带来的⼀个问题,我渴望找到⼀种⽅法来发现和控制它们。」

白行健还是学校 Bridge 爱心社成员

课余时间为小朋友讲解计算机知识

白行健还表示:「技术旨在为⼈类带来便利和幸福,我们希望⽤技术的⽅法缓解网络暴力问题,给所有⽤户提供⼀个⼲净、友好的互联⽹世界。」

典型的学霸履历

看过白行健的履历,用「优中选优」来概括一点也不过分。

他所就读的北师大实验中学,创建于 1917 年,是北京首批重点中学。近几年,其文理科一本率上线率均为 100%。学校师资队伍中,有博士 3 人,硕士 90 余人。

而他所在的北师大实验的国际部,更是被家长称为「全国最牛国际班」。

有知乎网友评论其「在大陆高中一骑绝尘」

2018 年北师大试验 UCLA 录取人数位居全国第一

2018 年,北师大实验国际部的学生,86% 进入美国 TOP 30 的名校就读。这里的学生,不少在初一、初二就开始准备托福,初三、高一准备 SAT。

白行健不仅在这次丘成桐中学科学奖中表现优异,在此前,他一直穿梭于各种比赛之中,并取得拔尖的成绩,金牌、第一名等字眼,布满他的履历:

白行健 (2017年-2019年部分殊荣)

•2018 年 5 ⽉受邀参加加拿⼤信息学奥林匹克竞赛(CCO)决赛及国家队集训营,获得决赛⾦奖第⼀名;

•2018 年 7 ⽉获得中国信息学奥林匹克竞赛决赛(NOI)银牌;

•2018 年 11 ⽉获得中国信息学联赛(NOIP)北京市提⾼组⼀等奖第 3 名;

•2019 年 1 ⽉参加美国信息学奥林匹克竞赛(USACO)公开赛获得满分,5 ⽉作为唯⼀的外国学⽣受邀参加美国国家队集训营(USACO 前25名美国中学⽣参加,选拔国家队成员);

•2018 年获得美国⾼中⽣数学建模竞赛(HiMCM)Finalist 奖项(⼀等奖 7%);

•2018 年获得美国数学⼤联盟杯(Math League)中国赛区第⼀名;

•2018 年获得美国数学竞赛(AMC) Distinction Honor Roll(荣誉奖 1%),AIME获得 8 分;

•2017、2018 连续两年获得北京师范⼤学附属实验中学⾦帆奖(top 2%)。

而他这次入围丘成桐奖总决赛,也是从来自国外 1500 多个团队中脱颖而出(共 72 支队伍入围),从此,他的人生履历中又新添一条出色的记录。

2019 年 5 月,白行健(右一)与其他三名同学代表北京

参加全国信息学奥林匹克竞赛(CCF NOI)

关于丘成桐中学科学奖

白行健这次所参加的丘成桐科学奖比赛是什么来历呢?

Dongrun-Yau Science Awards 东润丘成桐科学奖(原名「丘成桐中学科学奖」)是由中国著名数学大师丘成桐先生于 2008 年为全球华人中学生设立。每年累计有 1200 余所学校,约 5800 余支队伍参与此场科学界的盛宴。

本届丘成桐将涵盖了数学、物理、化学、生物、

计算机及经济金融建模六个学科

参赛队员覆盖国内外多个地区。每组参赛队前期要经过至少三轮的论文评审,通过后才有资格进去决赛。进入决赛的同学,需要经过来自国际顶尖高校包括美、英、法等国在内的 20 多位世界一流的教授组成的评审团的评定,并进行英文答辩。

白行健所参加的本届比赛,共有来自国内外 500 余所中学 1500 余团队、近 2000 名学生报名参赛,经过初筛、函评、桌评等程序,最终 72 支队伍入围。

看来,这个大赛的含金量也着实不小。前段时间,我们曾在 10 月采访了三位 95 后,刚进入职场发光发热的他们已经在计算机领域走出自己的一片天地。

而现在 00 后已经加入 AI 大军,还没上大学,就已经带着论文过关斩将,光速奔走在改变世界的道路上。

(*本文为AI科技大本营转载文章,转载请联系原作者)