本科入行可能吗?做到这3点,斩获BAT offer不是梦
大家好,前两天有一个小伙伴加我微信咨询。他说他不想读研,想要直接本科毕业就参与工作。但是又担心自己由于没有学历优势,无法在校招当中获得机会,于是便来向我请教,能不能指点迷津提供一些具体的实操性措施。与他一番畅谈之后,我自己回过头来想想,这的确是一个好问题,所以写下了此文,和大家一起分享一点个人的想法和心得。
引子
在回答问题之前,我们先来思考一个问题。本科生和硕士的差距究竟有哪些?
这样的差距实在是太多了,我们随便想想就能想出来很多。比如说学历,硕士阶段往往可以去到更好的学校, 拥有一个更好的文凭。比如说基础知识,硕士阶段可以有导师以及师兄们指点,可以在某个领域积累下丰富的知识。再比如说技能,三年时间跟着导师做项目可以积累很多实战经验……
如果我们反过来问,那本科生和硕士相比有什么优势呢?
也许我们想来想去可能也就只能想到年轻了,表面上来看的确如此。但实际上如果我们进一步思考,你会发现硕士阶段积累的能力和优势都和硕士阶段研究方向有关。比如研究嵌入式的往往不了解机器学习,研究图形渲染的往往也不了解神经网络。既然硕士的能力和研究方向高度挂钩,那么如果我们找到了一个工作岗位很多,但是很少有人研究的方向,是不是本科生一样有机会呢?
是的,的确如此,这也是本科生逆袭的核心逻辑。
差异化竞争
在大家眼里,研究生跟着导师做项目,有明确的方向会积累下大量的优势。乍一看这个说法非常正确,毫无破绽,但是如果了解内部行情的话,你会发现这里面是有很多问题的。最大的问题是什么呢?最大的问题还是学术方向和工业方向脱钩的问题。
为什么说CV和NLP内卷得比较厉害?道理很简单,因为计算机视觉和自然语言处理是学术方向和工业方向重合紧密度比较高的两个领域。想要从事这两个领域的博士生和硕士生最多,那么竞争也就最大。
但问题是,工业界的算法方向其实并不只有这两个,还有比如广告、搜索、推荐、风控等等。这些领域当中有很多是和学术界的研究方向脱钩的,比如推荐和广告。我看了很多期刊的论文,大部分论文的作者都是某某公司的算法团队,而不是一个学术机构。这说明了什么?说明了学术内是很少研究这两个领域的, 因为这两个领域本就是面向实际应用的。
像是这些领域就是本科生非常好的突破点,因为和你竞争的硕士们即使是从事算法方向的,也没有这些领域的经验,并且他们当中明确想要做这个领域,并且都这个领域还有所了解的人就更少了。这就是一个非常好的突破口,可以很轻松地积累很大的优势。
怎么做呢?很简单,就是去读一些业内前沿的paper。比如你想要做推荐,那么你就去把业内一些经典的论文读一下。比如GBDT+LR、FM、Wide & Deep、DeepFM、DIN等等。读完之后你写在简历当中,自学了相关领域的知识,阅读过这些论文。在我至今看过的几十封简历当中,没有一个有相关内容的,如果你的简历写上了这些,毫无疑问是一个巨大的加分项。
读一些论文并不需要花很多时间,但是就可以作为一个很大的亮点。并且你写上之后,面试官很有可能就会问这些论文或者是模型当中的问题,你只要能够答得上来,让他觉得你是真的仔细读过了读懂了,通过面试几乎没有悬念。
基础
对于校招生而言,无论什么学历,基础都是非常重要的,也是面试当中占比重非常大的一个部分。
说实话这一块要学的东西还是挺多的,不论是开发还是算法都差不多,现在的要求都不低。如果是算法的话,需要熟悉机器学习、深度学习、TensorFlow或者是Pytorch框架、numpy等一些常用的库和工具,还需要在算法和数据结构上有比较扎实的能力。如果是开发的话,需要深入了解一门语言的特性,了解一些开发常用的框架,以及操作系统、计算机网络等基础知识。
怎么看,我们要学的东西都不少。很多人看到这些就望而却步了,但是如果你明确了你想要从事的方向的话,其实你可以过滤掉很多不相关的内容。
我举个例子,在机器学习模型当中,推荐和算法领域看重的模型基本上都是一些和实际应用场景强相关的模型。比如说LR、贝叶斯、GBDT、XGboost、随机森林等等。对于一些其他领域的模型,比如什么Apriori、FP Growth、高斯混合模型等等都是不关心的。那么对于这些模型而言,我们就可以浅尝辄止,大概了解原理即可。对于和行业高度相关的模型重点学习。
再比如深度学习当中,在推荐和广告领域,几乎不会用到卷积神经网络和循环神经网络,这些基本上都是CV和NLP的专属,在推荐、广告当中基本上用不到。既然用不到,那也可以一样操作,有所了解,浅尝辄止即可。
当我们明确了方向之后,可以节省掉大量不相关的无效内容的学习,而更多地把精力投放在重要的领域上。这样可以大大提升我们的效率。
实战
大家都知道实战经验对于找工作来说非常重要,对于算法岗位而言,我们的实战项目都是需要大量的数据来训练模型的。对于本科的同学而言,一没有渠道获取这些数据,二没有足够的硬件条件(集群、GPU)来训练模型,所以只靠自己的摸索或者是去网上找两个波士顿房价预测这样的数据集是不够的,我们需要一点更加硬核一点的实战内容。
这里我强烈安利天池大数据比赛和kaggle,因为其中能找到很多电商场景下的问题,我们去做这样的比赛来锻炼实战经验是非常非常有效的。一方面可以写在简历当中充当项目经历,另外一方面也可以积累我们对电商行业以及推荐、广告等业务领域的理解。
像是Kaggle当中也有很多类似的问题也非常不错,比如我们在kaggle当中搜索CTR,就可以找到很多和推荐、广告相关的比赛:
我们从数据上也看得出来,搜索、推荐相关的比赛的参与人数比其他的要少很多。这里面的原因就是我刚才提到的,真正的从业者已经不需要刷这些比赛来做加分项了,而没有从业者在学校里面往往是接触不到这两个方向的,有明确地目标来进行练习和提升的就更少了。
所以只要能做到这一点,放在简历当中就是一个巨大的优势和亮点。
总结
其实我们总结一下这篇文章说的核心观点只有一个,就是差异化竞争。我们瞄准了学术界和工业界的脱节的领域发力,一方面直接的竞争者很少,另外一方面,我们可以凭借着明确的方向积累出优势来。在职场当中方向明确,在这个领域内持续的努力以及积累,是一个非常非常巨大的优势,很多情况下要比一个硕士学历有用得多。
今天的文章就到这里,衷心祝愿大家每天都有所收获。如果还喜欢今天的内容的话,请来一个三连支持吧~(点赞、关注、转发)