山迪•文森特 大佬聊赛事:99.3 分是个分水岭,多关注 role 给出的特征

坐镇大佬

山迪•文森特:研究生在读,喜欢唱跳 rap 打比赛,希望各位大佬能带带我组队打比赛

WechatIMG3876.jpeg

AI 研习社 ID:@山迪•文森特

( 个人主页链接://www.yanxishe.com/center/myPage/5187443  )

null

“ LOL 排位赛胜负推测 ”赛事链接://god.yanxishe.com/58

AI 研习社:大佬如今在游戏中是什么段位了?

山迪•文森特:白银 2,我从高中就开始玩这个游戏了,但一直都很菜(笑)。

AI 研习社:一般都打什么位置呢?最擅长哪个英雄?

山迪•文森特:上单提莫。

AI 研习社:排除这个比赛因素,你个人认为影响 LOL 排位赛胜负推测的因素主要有哪些?

山迪•文森特:我觉得是每个版本对英雄的改动,我们都知道每个版本都会有强势英雄,这个在排位胜负上会有所体现。

AI 研习社:所以你做这场比赛遇到最大的难题是什么?

山迪•文森特:个人感觉是提强特征。比赛刚开始时,裸跑都能上 99 分,加上有效特征 —— 类似经济差、伤害差一类的统计特征还能上到 99.3,再往上走就需要对整个游戏有所理解了。

AI 研习社:了解,换句话说,99.3 分以后想继续提分的话,你认为有哪些维度可以下手?

山迪•文森特:role 给出特征当中的几个( 英雄 id、两个召唤师技能、出装 item)我没用上,其实可以结合 match 表中的版本号来做(我正在尝试),另外就是寻找一些出现异常数据(比如对局当中存在多个 mid 或者 kills 总计为 0 等)的局,通过手工去提然后打标。

AI 研习社:可以跟我们介绍一下你最新开源的这个 baseline 吗?(链接://god.yanxishe.com/codeplan/detail/136

山迪•文森特:这个 baseline 是我跑裸特征的一个思路,我先对 role 表的每场比赛做了阵营划分,然后对每个阵营的特征进行求和并计算 kda,再把两边阵营数据做 merge ,加上基本的训练数据构建完成。最后,放入 lgb 跑 5 折交叉。

这个比赛我没考虑融合多个模型去训练,因为感觉剔除异常数据的话很容易上分。

AI 研习社:怎么理解“剔除异常数据很容易上分”?

山迪•文森特:role 表中可以找到异常局——例如存在多个 mid 和多个打野,挂机行为( kda 都一样)。这几个特征我没有用在模型训练上,而是直接从训练集剔除,然后在测试集当中标注为异常局,接着提交试错。

后面要上分的话,还是得去做多个模型的 stacking。

AI 研习社:所以能够理解你是在有意挑战自己吗?

山迪•文森特:我只是在尽力做好自己,然后尝试突破极限吧!这个比赛的数据和业务因为与自己平时的爱好契合,就觉得很有意思。群里各位大佬的思路也让我收获很多,我也会继续努力。

AI 研习社:你认为什么才是“打比赛的正确姿势”?

山迪•文森特:多看、多学、多练。

主要多看看大佬们的 baseline 和思路,然后学习新的框架和模型,最后就是多多编码,只有用得多,才能做得好。