Python網路爬蟲抓取動態網頁並將資料存入資料庫MYSQL

嗨學程式設計發表於2019-01-04

原文網址 : https://juejin.im/post/5c2ef3e5518825265c2fc132

Python爬蟲網頁資料庫MySql

簡述

以下的程式碼是使用python實現的網路爬蟲，抓取動態網頁hb.qq.com/baoliao/。此網頁中的最新、精華下面的內容是由JavaScript動態生成的。審查網頁元素與網頁原始碼是不同。

Python網路爬蟲抓取動態網頁並將資料存入資料庫MYSQL

本人對於Python學習建立了一個小小的學習圈子，為各位提供了一個平臺，大家一起來討論學習Python。歡迎各位到來Python學習群：960410445一起討論視訊分享學習。Python是未來的發展方向，正在挑戰我們的分析能力及對世界的認知方式，因此，我們與時俱進，迎接變化，並不斷的成長，掌握Python核心技術，才是掌握真正的價值所在。

Python網路爬蟲抓取動態網頁並將資料存入資料庫MYSQL

以上是網頁原始碼

Python網路爬蟲抓取動態網頁並將資料存入資料庫MYSQL

Python網路爬蟲抓取動態網頁並將資料存入資料庫MYSQL

以上是審查網頁元素

所以此處不能簡單的使用正規表示式來獲取內容。

以下是完整的獲取內容並儲存到資料庫的思路及原始碼。

實現思路：

抓取實際訪問的動態頁面的url – 使用正規表示式獲取需要的內容 – 解析內容 – 儲存內容

以上部分過程文字解釋：

抓取實際訪問的動態頁面的url：

在火狐瀏覽器中，右鍵開啟外掛使用**firebug審查元素** *（沒有這項的，要安裝firebug外掛），找到並開啟**網路（NET）**標籤頁。重新載入網頁，獲得網頁的響應資訊，包括連線地址。每個連線地址都可以在瀏覽器中開啟。本網站的動態網頁訪問地址是：

http://baoliao.hb.qq.com/api/report/NewIndexReportsList/cityid/18/num/20/pageno/1?callback=jQuery183019859437816181613_1440723895018&_=1440723895472

原始碼

注意：使用python的版本是 2.7

Python網路爬蟲抓取動態網頁並將資料存入資料庫MYSQL

相關文章

Go抓取網頁資料並存入MySQL和返回json資料
2019-02-16
Go網頁MySqlJSON
爬蟲抓取網頁資料原理
2021-12-06
爬蟲網頁
爬蟲進階——動態網頁Ajax資料抓取（簡易版）
2024-04-12
爬蟲網頁
如何用Python爬資料？（一）網頁抓取
2018-06-27
Python網頁
python網路爬蟲（7）爬取靜態資料詳解
2019-06-07
Python爬蟲
網路爬蟲如何獲取IP進行資料抓取
2022-05-19
爬蟲
爬蟲技術抓取網站資料方法
2021-09-11
爬蟲網站
如何用python爬蟲分析動態網頁的商品資訊？
2021-09-11
Python爬蟲網頁
IPIDEA大盤點，藉助網路爬蟲抓取資料的作用？
2023-04-27
Idea爬蟲
Python爬蟲新手教程：微醫掛號網醫生資料抓取
2019-07-20
Python爬蟲
Python網路爬蟲資料採集實戰：Requests和Re庫
2020-03-22
Python爬蟲
Python網路爬蟲第三彈《爬取get請求的頁面資料》
2018-09-14
Python爬蟲
Python中使用mechanize庫抓取網頁上的表格資料
2024-03-15
Python網頁
網頁資料抓取之噹噹網
2020-12-21
網頁
Python爬蟲初學二（網路資料採集）
2020-05-03
Python爬蟲
爬蟲抓取網路資料時經常遇到的六種問題
2022-06-11
爬蟲
爬蟲原理與資料抓取
2020-12-17
爬蟲
scrapy爬蟲框架呼叫百度地圖api資料存入資料庫
2021-04-30
爬蟲框架地圖API資料庫
如何利用Python網路爬蟲抓取微信朋友圈的動態（上）
2018-05-09
Python爬蟲
不會Python爬蟲？教你一個通用爬蟲思路輕鬆爬取網頁資料
2019-01-08
Python爬蟲網頁
[Python] 網路爬蟲與資訊提取（1）網路爬蟲之規則
2020-11-06
Python爬蟲
python 爬蟲如何爬取動態生成的網頁內容
2024-10-31
Python爬蟲網頁
python爬蟲抓取哈爾濱天氣資訊（靜態爬蟲）
2020-04-05
Python爬蟲
python爬取股票資料並存到資料庫
2021-03-29
Python資料庫
爬蟲抓取網頁的詳細流程
2023-11-28
爬蟲網頁
網路爬蟲之抓取郵箱
2018-06-18
爬蟲
Python爬蟲新手教程：手機APP資料抓取 pyspider
2019-07-20
Python爬蟲APPIDE
利用Python網路爬蟲抓取網易雲音樂歌詞
2018-05-06
Python爬蟲
Python爬蟲抓取股票資訊
2021-01-03
Python爬蟲
用python抓取智聯招聘資訊並存入excel
2018-05-08
PythonExcel
Python爬蟲入門【3】：美空網資料爬取
2019-07-30
Python爬蟲
網頁抓取如何幫助資料分析？
2022-02-11
網頁
Python爬蟲入門教程 21-100 網易雲課堂課程資料抓取
2019-01-09
Python爬蟲
Puppeteer爬取網頁資料
2019-03-22
網頁
Python爬蟲抓取資料，為什麼要使用代理IP？
2022-12-27
Python爬蟲
Python爬蟲如何去抓取qq音樂的歌手資料？
2021-03-19
Python爬蟲
用Python網路爬蟲獲取Mikan動漫資源
2020-08-26
Python爬蟲
3天學會網頁爬蟲進行資料分析
2022-01-07
網頁爬蟲