我是如何成為算法工程師的,超詳細的學習路線
算法工程師的,超詳細的學習路線”/>
一、前言
寫文章以來,被問到最多的問題就是「算法的學習路線」。
今天,它來了。
我會帶着大家看看,我們需要學些啥,利用這個假期,我甚至還收集整理了配套視頻和資料,暖男石錘啊,這期文章有用的話,別忘三連哦!
二、學習路線
主要分為 4 個部分:數學基礎、編程能力、算法基礎、實戰。
1、數學基礎
在機器學習算法中,涉及到最為重要的數學基本知識有兩個:線性代數和概率論。
這兩也是大學的必修課了,如果知識早已還給老師,也沒關係,哪裡不會學補哪裡。
線性代數研究的是線性空間的性質,數據通常會被表示為歐式空間中的點,而這些點經過一系列變換後會映射到另一個空間,在新的空間中隱藏在數據中的規律才得以顯現。
所以線性代數作為研究空間的一門科學,是入門機器學習的最要基礎之一。
視頻:推薦 MIT 的老教授 Gilbert Strang 的線性代數上課視頻。
沒學過線代的同學會發現這門課程,講得清晰而且直觀,深入線代的精髓,完全不是那種理論堆砌的講法,而且老教授幽默風趣,很有人格魅力。
英文不好,也不用擔心,字幕是中文的。
下載地址(提取碼:jack ):
鏈接://pan.baidu.com/s/1WktC95HL2GF0PKa311L5SQ
教材:推薦《線性代數及其應用》,作者是 David C. Lay 。
喜歡看書的朋友,這本書一定不能錯過。
這本書詳細地介紹了線性代數在幾何學、計算機圖形學、經濟學、概率論、信號與系統、微分方程等領域的應用,給人以直觀的認識。
下載地址(提取碼:jack ):
鏈接://pan.baidu.com/s/10FtcG4mweUWy810cirGGzg
概率論是研究不確定性的一門科學,生活處處是概率。機器學習算法需要對現實情況建模,自然是少不了將概率論作為工具。
這門課入門並不難,大家可以挑一本評分還可以的書開始學習。
這裡推薦陳希儒的《概率論與數理統計》,講得很詳細,如同聽一個老者回憶自己的概率與統計心得,相信讀者也會有所收穫。
下載地址(提取碼:jack ):
鏈接://pan.baidu.com/s/1P_jIbbW6JUNSlCaCX7CXKA
如果時間充裕,推薦先學好數學基礎。如果時間不夠,那就跳過數學基礎部分,學算法的時候,哪裡不會補哪裡。
2、編程能力
編程語言,需要至少掌握兩門, Python 和 C++。
工作中,Python 主要用於處理數據、算法調研、模型訓練的工作,而 C++ 則是負責工程落地。
算法工程師,需要針對落地場景,對算法的可靠性和實時性等方面進行優化,C++ 工程能力必不可少。
Python 是一門非常友好的編程語言,不但易於入門而且功能強大,在進行機器學習算法開發的過程中會大量使用 Python。
視頻:我上學看的第一個視頻,就是小甲魚 Python 課程,風趣幽默,涉及Python 語法基礎、網絡爬蟲、Pygame 飛機大戰等內容,內容很豐富。
下載地址(提取碼:jack ):
鏈接://pan.baidu.com/s/1-WasSZey8bZuEfp48bTOuw
實戰是最好的老師,學習 Python 的時候,可以找一個自己喜歡的方向,去實戰。
邊實戰,邊學習。比如寫爬蟲、做小遊戲、玩各種有趣的算法等。
這裏面,爬蟲是最簡單的,很容易有成就感,讓你堅持學習下去,下載小說、下載漫畫、下載音樂、下載電影、搶票等等小程序。
這個推薦我的一個 Github star 量 11.4k+、fork 4.5k+的爬蟲項目。
每個實戰,都有對應的文章教程,代碼開源。
項目地址://github.com/Jack-Cherish/python-spider
教材:推薦《流暢的Python》,書看完有些難度,但是哪來當個手冊用,很方便,哪些語法忘記了,翻閱一番,必能有所收穫。
下載地址(提取碼:jack ):
鏈接://pan.baidu.com/s/1-YBEOYY45CYrbM4Zxb21Yw
C++ 是一種面向對象的程序設計語言,無論你是做算法,還是做開發,亦或者是做測開。C++ 都應該掌握,它是一個基礎的編程語言。學會了這門編程語言,再學其它,就會更得心應手。
視頻:這部分推薦慕課網的免費教程,很好的入門視頻,老師講得繪聲繪色、形象生動、通熟易懂。
一共分為 7 章,每章視頻的時間是 2-3 個小時,半個月可以輕鬆刷完,學習順序是:
-
C++遠征之起航篇
-
C++遠征之離港篇
-
C++遠征之封裝篇(上)
-
C++遠征之封裝篇(下)
-
C++遠征之繼承篇
-
C++遠征之多態篇
-
C++遠征之模板篇
視頻觀看地址(提取碼:jack):
鏈接://pan.baidu.com/s/19-DHvrNf1T9UJYv08am77w
教材:推薦被譽為「聖經」的《C++ Primer》,經典巨著,非常棒的書。
下載地址(提取碼:jack):
鏈接://pan.baidu.com/s/1uyW6kg6J0KwA8JYUj7AFFA
編程語言基礎學完了,接下來就是數據結構與算法。
數據結構與算法是程序員的內功,每一個工程師的必修課。
數據結構的學法,我推薦是直接看書,一邊學習一邊刷題,同時進行,這樣學的速度快。
就如同書名一樣,這是一本像小說一樣有趣的算法入門書,非常易懂,強烈推薦。
下載地址(提取碼:jack):
鏈接://pan.baidu.com/s/1jQYbWiHM6Z8VaP62alkBoA
可以與這本書一同學習的,就是《劍指Offer》,裏面講解了 66 道+ 常見數據結構題,解析思路,簡單易懂。
下載地址(提取碼:jack):
鏈接://pan.baidu.com/s/1rNBSsx_-NL2xHH-acWePGA
兩門書一起看,輕鬆入門數據結構與算法。
不過《劍指Offer》講解的代碼都是 C/C++,沒有 Python 版本,想看 Python 版本的,可以看我整理的教程,C++ 和 Python 都有實現和講解,題目已按照類型劃分好。
項目地址://github.com/Jack-Cherish/LeetCode
兩本書都看完,題也刷完了,那就算是入門了。
想進階,進一步學習,直接上 LeetCode。
力扣可以從 HOT 100 或 精選算法 200 題刷起,題目相對於《劍指Offer》要增加一些難度,但每道題目都有對應的解題思路和答案。
堅持刷完 200 道,大多的面試輕鬆搞定,完全夠用。
當然要面試谷歌級別的大佬,Hard 題是不能放過的。
刷題地址://leetcode-cn.com/
Tip:刷一遍題,回頭看還會忘,不要懷疑自己,要反覆刷,反覆練習。
3、算法基礎
恭喜大家,在做了前面這麼多基礎工作之後,終於可以開始入門機器學習算法了。
機器學習:
視頻:推薦吳恩達老師的機器學習視頻,吳恩達是整個領域的巨頭之一,學術地位很高。同時,他出的視頻也對新手非常友好,入門的不二之選。
下載地址(提取碼:jack ):
鏈接://pan.baidu.com/s/1OglLhzB5gWHrK_pkAWF2Sg
教材:還是那句話,光看不練是不行的。《機器學習實戰》,理論結合實戰,適合新手。
下載地址(提取碼:jack):
鏈接://pan.baidu.com/s/1lEz8POdx9V5Xu-RVMlBttA
《機器學習實戰》使用 Python2 實現,有些細節講的不夠細緻,對此我進行了完善,使用 Python3 復現了一遍,並結合 sklearn 以及更多的好玩例子,進行講解。
全網閱讀量 500w+:
對應的 Github 開源代碼 Star 3.3k+,fork 3.1k+。
在線閱讀地址:
我也將這個系列打包成了本地 pdf,喜歡離線看,也可以直接下載。
下載地址(提取碼:jack):
鏈接://pan.baidu.com/s/11OI0NZ_Fv-ZJBpT8pmjlRw
深度學習:
深度學習是現在的算法工程師繞不開的一個子領域,是機器學習的子集。
視頻:還是推薦吳恩達老師的深度學習視頻,也是對新手非常友好。
下載地址(提取碼:jack ):
鏈接://pan.baidu.com/s/1TShDS2_jioxMRhFv2253aQ
教材:說實話,深度學習,我並沒有看過書,都是視頻+ Github 開源項目學習的,不過被譽為深度學習領域聖經的「花書」,可以備一本。
下載地址(提取碼:jack):
鏈接://pan.baidu.com/s/1drDJUf9OqSfxoicsk8J2gg
深度學習框架:
深度學習框架有很多,Tensorflow、Pytorch、Paddle、MXNet、Caffe等。
我在工作過程中,用的最多的是 Pytorch,其次是 Tensorflow。
新手上手,推薦先學 Pytorch,可以直接看 Yunjey Choi 大佬的 Github 教程,簡單入門:
項目地址:
//github.com/yunjey/pytorch-tutorial
Pytorch 深度學習框架學習,也可以看我寫的 Pytorch 深度學習實戰系列教程,有垃圾分類、圖像分割等結合實戰的小項目。
Github 開源代碼 Star 400+,fork 250+。
項目地址:
//github.com/Jack-Cherish/Deep-Learning
我也將這個系列打包成了本地 pdf,喜歡離線看,也可以直接下載。
下載地址(提取碼:jack):
鏈接://pan.baidu.com/s/1PXkcKJa-ZJ0fWeqVduCoZA
4、實戰
實戰實戰,文章反覆提到了這麼多次,僅僅這些還是遠遠不夠的。
因為更多時候,你是跟着視頻 or 文章的思路去實戰,這缺少了獨立思考的過程。
學了這麼多,你並沒有獨立完成過一個項目,數據怎麼處理,怎麼分析問題,用什麼算法解決問題,也沒有獨立思考過。
算法工程師的崗位競爭也比較激烈的,為了在茫茫人海中脫穎而出,我們需要以團隊或個人的形式,獨立完成一些項目,只有這樣,你才能更具競爭力。
對於學生黨,做項目,最簡單直接的方法就是參加競賽。
推薦兩個參加競賽的地方,一個是國外的 Kaggle,另一個是國內的阿里雲天池。
兩個競賽的獎金也都很豐富,根據自己的喜好,參賽即可。
Kaggle://www.kaggle.com/
阿里天池://tianchi.aliyun.com/competition/gameList/activeList
既能打比賽,又能贏獎金,何樂而不為呢?
三、資料打包
本文提到的資料,我都打包了,可以直接全部打包帶走。
下載地址(提取碼:jack):
鏈接://pan.baidu.com/s/12tbVrUF056pY7aCyMpgl1w
PS:有能力支持正版的,資料覺得不錯,可以去購買支持一波正版。
四、絮叨
這篇文章整理的也是我的學習路線。
要說需要學多久,那就看個人的學習動力了。
如果你想去一家不錯的公司,但是目前硬實力不過關,我覺得還是有必要去努力一下的,技術能力的高低決定你能走多遠,平台的高低,決定你能飛多高。
如果可以通過自己的努力,進入自己心儀的公司,一定不要鬆懈怠慢,職場成長和學習新技術一樣,不進則退。
你往往會發現,身邊實力越強的人越努力,最高級的自律就是享受孤獨。
創作不易,本期硬核,各位的三連就是 Jack Cui 創作的最大動力,我們下次見!
文章持續更新,可以微信公眾號搜索【JackCui-AI】第一時間閱讀,本文 GitHub //github.com/Jack-Cherish/PythonPark 已經收錄,有大廠面試完整考點,歡迎Star。