2021校招算法面试锦囊|华为、网易游戏

  • 2021 年 2 月 23 日
  • AI

今天和大家分享的是华为和网易游戏两家公司的算法工程师面试经验

虽然很多人觉得算法岗卷中之卷,但如果选择了这条路并且很感兴趣,付出了长时间的努力——恭喜你,幸运女神已经在向你招手了。你需要做的,是最后的冲锋。

应届生的最后一波开团机会——春招已经沐浴着春风向我们走来啦,小伙伴们还不快准备起来!

不打无准备之仗,方能立于不败之地。

华为—中央软件院—分布式架构组

老牌大厂华为,是一家有情怀的公司,福利优厚,注重国际化布局。
而且前不久刚刚打出2021-2022应届生招聘人数扩大到8000人的口号,机会多多。
需要注意的是,前几年华为的面试据说太水被喷了,所以从2020年起,校招难度开始上升。
另一方面,笔者在7月底通过华为3轮技术面和hr面后(提前批),收到了面试通过的短信;但是此后,再无音讯。
问了身边几个同学,居然都有类似情况,看来“海王”的称号并非浪得虚名。面试华为的同学,稍微留心这个情况。如果不放心,可以多和对接的hr沟通。

视频一面

1、自我介绍
本科学校、专业、排名,感觉华为很看重学校背景。
2、介绍论文
3、概括2段实习经历中的主要工作
4、项目中的服务如何部署,交互(RPC or Restful API)?
5、是否使用过多线程、多进程,介绍原理
6、算法题
1个有序数组,nums=[1,1,2,2,3,4,4,5,5,6,7]。将去重后的数字按升序移动到数组前半段,后半段顺序无要求。
移动后:nums=[1,2,3,4,5,6,7,1,2,….];要求空间复杂度为O(1)

视频二面

1、算法题:求二叉树的高度
2、介绍Text2SQL项目,涉及的技术
3、有哪些防止过拟合的方法?dropout为什么能起作用?
4、当前深度学习、NLP有哪些瓶颈,未来会向哪个方向发展?
5、restful接口用什么框架部署呀,有考虑过多并发吗?
6、熟悉什么深度学习框架?
7、有没有了解过pytorch的底层实现?
torch和TF底层都是用C++实现的,算法工程师掌握C++会是一个显著优势和硬核技能。
8、了解华为自研的MindSpore框架吗?
9、介绍一下深度学习的优化算法
主要是BGD、SGD、Mini-GD、Adaleta、Adam、动量,分点介绍概括即可。
10、对二阶优化了解吗?
11、有没有使用过多线程、多进程?
12、紧接着:多进程间如何通信?
13、意犹未尽:Linux进程通信方式了解吗~ 是否熟悉常用指令,比如杀死一个进程?
14、部门介绍
我们部门(中央软院—分布式架构)主要是做底层架构、深度学习框架优化的(200人+);另一个方向是做前沿技术探索(博士为主,少量硕士);几乎不会直接面向具体业务落地,还对我们部门感兴趣吗?
15、考核指标

最后,面试官表示部门非常重视论文和专利,是主要的绩效考核指标。除了项目,这两块应该是和算法工程师最息息相关的指标啦。

主管三面

1、概括介绍项目和比赛
2、为什么选择华为?
3、主管介绍部门研究方向
主要负责自研AI框架Mindspore开发、二阶优化等等。
华为通常没有hr面,技术面试都通过后,就会收到面试完成、等待通知的短信。
总结:由于这个group偏向深度学习框架开发,除了常规知识点,面试官对并发、多进程、二阶优化等内容兴趣浓厚。大家在面试前要好好check面试部门的研究方向,是否和自己的需求匹配

网易游戏

网易在游戏方面还是可圈可点的,积累了一批忠实的拥趸。刚好7月份看到了网易游戏的校招sp通知,就参加了面试。
网易游戏主要base杭州和广州,法岗位的面试体验,用两个词可以完整地概括——细致、全面
网易对基础内容的考察非常详尽,面试官可能会问领域内非常细微的一个知识点,面试前一定要做好基础知识巩固哦。

视频一面

1、自我介绍
2、介绍text2sql项目,有没有分析过badcase?
3、智能客服项目中,闲聊怎么落地,是否会做一些引导型闲聊?
4、有没有做过基于阅读理解的QA
5、介绍一下MRC是怎么做的,怎么抽取最终答案的start、end?
6、除了baseline,有没有query和context间更好的建模方式
7、对于一篇长文档(长度超过512),如何进行建模?
8、详细介绍Transformer-encoder、decoder
包含模块组成、公式推理
9、decoder部分具体输入输出是什么
10、了解wwm(全词掩码)吗,主要是解决什么问题?如何实现wwm?
XLNet三连:
11、XLNet是如何实现文本乱序的?
12、详细XLNet中介绍query流、context流2种流机制
13、XLNet改进了Bert什么问题
14、介绍一下tfidf,和bm25的区别?
15、tfidf对于长文档、短文档分别有什么影响
16、了解局部敏感哈希LSH吗?
17、介绍一下KNN有哪些实现算法
18、熵和交叉熵的公式分别是什么,互信息的呢
可能是问了太多问题,到最后时间不够用了,所以跳过了手撕代码。

视频二面

二面主要围绕低资源、少数据场景下,如何完成一个任务展开。
1、数据增强有哪些策略,如何检测有效
2、给定1w条训练集,如何判断继续增加训练样本,模型在测试集上的表现是否会更好?
3、给定1000w条标注数据,如何判断这1000w条数据对训练是否有效?
从这1000w参与训练 / 不参与模型训练分别谈谈
4、介绍一下Transoformer,为什么能并行
5、介绍一下RNN、LSTM、GRU各自优缺点
6、RNN一般适用什么场景
7、模型过拟合的原因是什么,说说原理?有哪些防止过拟合的策略?
8、介绍一下模型压缩和蒸馏
9、LN、BN有什么区别?NLP中为什么一般用LN?了解Group Normalization吗
10、熟悉哪些机器学习模型
提到了决策树、rf、gbdt、knn、kmeans
kmeans三连:
11、介绍一下kmeans,优缺点
12、了解EM算法吗,kmeans中哪些步骤对应E和M?
13、EM算法的提出是为了解决什么问题?
14、介绍一下决策树。决策树可以用于连续的数据吗
15、熟悉降维算法吗(PCA、LDA)

Hr面

非常常规,询问面试感受、手头offer情况等。
如果同学手头已经有了不错大厂的offer,可以坦诚地告诉hr。
如果还没有任何offer,可以委婉地表示,我正在面试xx和xx公司,其中xx公司已经走完所有流程,在等候结果。
这样会给hr更好的印象哦!
重点来了!
为了帮助大家乘风破浪,斩获心仪的offer,我们将连载一系列的面经锦囊。
进度约一周更新1~2篇,欢迎持续关注哦❤️

深度学习资源下载
在NLP情报局公众号后台回复“三件套”,即可获取深度学习三件套:
《PyTorch深度学习》,《Hands-on Machine Learning》,《Python深度学习》
推 荐 阅 读

欢 迎 关 注 我 们

原创不易,有收获的话请帮忙点击分享点赞在看吧?