本科入行可能嗎?做到這3點,斬獲BAT offer不是夢

大家好,前兩天有一個小夥伴加我微信諮詢。他說他不想讀研,想要直接本科畢業就參與工作。但是又擔心自己由於沒有學歷優勢,無法在校招當中獲得機會,於是便來向我請教,能不能指點迷津提供一些具體的實操性措施。與他一番暢談之後,我自己回過頭來想想,這的確是一個好問題,所以寫下了此文,和大家一起分享一點個人的想法和心得。

引子

在回答問題之前,我們先來思考一個問題。本科生和碩士的差距究竟有哪些?

這樣的差距實在是太多了,我們隨便想想就能想出來很多。比如說學歷,碩士階段往往可以去到更好的學校, 擁有一個更好的文憑。比如說基礎知識,碩士階段可以有導師以及師兄們指點,可以在某個領域積累下豐富的知識。再比如說技能,三年時間跟著導師做項目可以積累很多實戰經驗……

如果我們反過來問,那本科生和碩士相比有什麼優勢呢?

也許我們想來想去可能也就只能想到年輕了,表面上來看的確如此。但實際上如果我們進一步思考,你會發現碩士階段積累的能力和優勢都和碩士階段研究方向有關。比如研究嵌入式的往往不了解機器學習,研究圖形渲染的往往也不了解神經網路。既然碩士的能力和研究方向高度掛鉤,那麼如果我們找到了一個工作崗位很多,但是很少有人研究的方向,是不是本科生一樣有機會呢?

是的,的確如此,這也是本科生逆襲的核心邏輯。

差異化競爭

在大家眼裡,研究生跟著導師做項目,有明確的方向會積累下大量的優勢。乍一看這個說法非常正確,毫無破綻,但是如果了解內部行情的話,你會發現這裡面是有很多問題的。最大的問題是什麼呢?最大的問題還是學術方向和工業方向脫鉤的問題。

為什麼說CV和NLP內卷得比較厲害?道理很簡單,因為電腦視覺和自然語言處理是學術方向和工業方向重合緊密度比較高的兩個領域。想要從事這兩個領域的博士生和碩士生最多,那麼競爭也就最大。

但問題是,工業界的演算法方向其實並不只有這兩個,還有比如廣告、搜索、推薦、風控等等。這些領域當中有很多是和學術界的研究方向脫鉤的,比如推薦和廣告。我看了很多期刊的論文,大部分論文的作者都是某某公司的演算法團隊,而不是一個學術機構。這說明了什麼?說明了學術內是很少研究這兩個領域的, 因為這兩個領域本就是面向實際應用的。

像是這些領域就是本科生非常好的突破點,因為和你競爭的碩士們即使是從事演算法方向的,也沒有這些領域的經驗,並且他們當中明確想要做這個領域,並且都這個領域還有所了解的人就更少了。這就是一個非常好的突破口,可以很輕鬆地積累很大的優勢。

怎麼做呢?很簡單,就是去讀一些業內前沿的paper。比如你想要做推薦,那麼你就去把業內一些經典的論文讀一下。比如GBDT+LR、FM、Wide & Deep、DeepFM、DIN等等。讀完之後你寫在簡歷當中,自學了相關領域的知識,閱讀過這些論文。在我至今看過的幾十封簡歷當中,沒有一個有相關內容的,如果你的簡歷寫上了這些,毫無疑問是一個巨大的加分項。

讀一些論文並不需要花很多時間,但是就可以作為一個很大的亮點。並且你寫上之後,面試官很有可能就會問這些論文或者是模型當中的問題,你只要能夠答得上來,讓他覺得你是真的仔細讀過了讀懂了,通過面試幾乎沒有懸念。

基礎

對於校招生而言,無論什麼學歷,基礎都是非常重要的,也是面試當中佔比重非常大的一個部分。

說實話這一塊要學的東西還是挺多的,不論是開發還是演算法都差不多,現在的要求都不低。如果是演算法的話,需要熟悉機器學習、深度學習、TensorFlow或者是Pytorch框架、numpy等一些常用的庫和工具,還需要在演算法和數據結構上有比較紮實的能力。如果是開發的話,需要深入了解一門語言的特性,了解一些開發常用的框架,以及作業系統、電腦網路等基礎知識。

怎麼看,我們要學的東西都不少。很多人看到這些就望而卻步了,但是如果你明確了你想要從事的方向的話,其實你可以過濾掉很多不相關的內容

我舉個例子,在機器學習模型當中,推薦和演算法領域看重的模型基本上都是一些和實際應用場景強相關的模型。比如說LR、貝葉斯、GBDT、XGboost、隨機森林等等。對於一些其他領域的模型,比如什麼Apriori、FP Growth、高斯混合模型等等都是不關心的。那麼對於這些模型而言,我們就可以淺嘗輒止,大概了解原理即可。對於和行業高度相關的模型重點學習。

再比如深度學習當中,在推薦和廣告領域,幾乎不會用到卷積神經網路和循環神經網路,這些基本上都是CV和NLP的專屬,在推薦、廣告當中基本上用不到。既然用不到,那也可以一樣操作,有所了解,淺嘗輒止即可。

當我們明確了方向之後,可以節省掉大量不相關的無效內容的學習,而更多地把精力投放在重要的領域上。這樣可以大大提升我們的效率。

實戰

大家都知道實戰經驗對於找工作來說非常重要,對於演算法崗位而言,我們的實戰項目都是需要大量的數據來訓練模型的。對於本科的同學而言,一沒有渠道獲取這些數據,二沒有足夠的硬體條件(集群、GPU)來訓練模型,所以只靠自己的摸索或者是去網上找兩個波士頓房價預測這樣的數據集是不夠的,我們需要一點更加硬核一點的實戰內容。

這裡我強烈安利天池大數據比賽和kaggle,因為其中能找到很多電商場景下的問題,我們去做這樣的比賽來鍛煉實戰經驗是非常非常有效的。一方面可以寫在簡歷當中充當項目經歷,另外一方面也可以積累我們對電商行業以及推薦、廣告等業務領域的理解

像是Kaggle當中也有很多類似的問題也非常不錯,比如我們在kaggle當中搜索CTR,就可以找到很多和推薦、廣告相關的比賽:

我們從數據上也看得出來,搜索、推薦相關的比賽的參與人數比其他的要少很多。這裡面的原因就是我剛才提到的,真正的從業者已經不需要刷這些比賽來做加分項了,而沒有從業者在學校裡面往往是接觸不到這兩個方向的,有明確地目標來進行練習和提升的就更少了。

所以只要能做到這一點,放在簡歷當中就是一個巨大的優勢和亮點。

總結

其實我們總結一下這篇文章說的核心觀點只有一個,就是差異化競爭。我們瞄準了學術界和工業界的脫節的領域發力,一方面直接的競爭者很少,另外一方面,我們可以憑藉著明確的方向積累出優勢來。在職場當中方向明確,在這個領域內持續的努力以及積累,是一個非常非常巨大的優勢,很多情況下要比一個碩士學歷有用得多

今天的文章就到這裡,衷心祝願大家每天都有所收穫。如果還喜歡今天的內容的話,請來一個三連支援吧~(點贊、關注、轉發