python爬蟲—實現項目(二) 分析Ajax請求抓取數據
- 2019 年 10 月 5 日
- 筆記
這次我們來繼續深入爬蟲數據,有些網頁通過請求的html程式碼不能直接拿到數據,我們所需的數據是通過ajax渲染到頁面上去的,這次我們來看看如何分析ajax
我們這次所使用的網路庫還是上一節的Requests,結果用到mongodb來存儲(需要提前安裝pymongo庫),開啟多執行緒爬。
分析:有很多網頁打開以後,我們得到html源碼並不能得到我們想要的數據,這時網站很有可能是通過ajax來載入的數據。
我們打開調試模式F12,點擊NetWork,我們來分析我所要的數據藏在哪裡

我們可以看到我們所需要的數據是通過ajax載入出來的。
項目一:分析Ajax來抓取今日頭條街拍美圖
程式碼地址:https://gitee.com/dwyui/toutiao_jiepai.git
簡單看一下我們的運行結果:
