Win10+Python3.6配置Spark創建分佈式爬蟲

2019 年 12 月 13 日
筆記

介紹Spark在Win 10系統中的的安裝、配置以及在分佈式爬蟲中的使用，Python版本為3.6.8。

Spark安裝、配置和使用請參考《Python程序設計開發寶典》「第12章多任務與並行處理：線程、進程、協程、分佈式、GPU加速」（董付國著，清華大學出版社，2017.10），京東：https://item.jd.com/12143483.html

網絡爬蟲入門請參考《Python可以這樣學》「第9章網絡應用開發」（董付國著，清華大學出版社，2017.2），京東缺貨，請選擇亞馬遜、噹噹、天貓搜索「董付國」；《Python程序設計基礎與應用》「第13章網絡爬蟲入門與應用」（董付國著，機械工業出版社，2018.9），京東：https://item.jd.com/12433472.html

================

1、下載安裝jdk，地址：https://www.oracle.com/technetwork/java/javase/downloads/jdk8-downloads-2133151.html