Python 爬取網頁資料的兩種方法
Python 爬取網頁資料的兩種方法
網路抓取是從任何網站或任何其他資訊源中提取資料的過程,以你想要檢視的格式儲存在你的系統中;
包含格式很多,例如CSV、Excel等;檔案、XML、JSON等等。Python是最常見的網頁抓取語言之一;對於任何網路抓取活動,Python被認為是確保此過程無任何錯誤進行的最佳方法;
2. 使用pandas 爬取網頁資料
2.1 開啟網頁
開啟一個網頁,將網址複製下來;
2.2 開啟 PyCharm 編譯器
先下載pandas庫,【檔案】=>【設定】=>【專案:xxx】=>【專案直譯器】(【File】=>【Settings…】=>【project:xxx】=>【Python Interpreter】),點選+號,在搜尋框中輸入“pandas”,在下方列表中選中“pandas”,點選安裝,等待提示安裝完成即可;
2.回到Pycharm輸入以下程式碼
import pandas as pd #匯入pandas庫 html = "將要爬取資料的網站網址複製到此 date = pd.read_html(html) #運用pd.read_html讀取網站資料 print(date) #輸出爬取到的資料
3.執行結果如下所示:
3.使用urllib爬取網頁資料並寫入Excel表
3.1 下載 urllib 庫
與上述方法一致,這裡就不贅述了
3.2 程式碼如下
import urllib.request #匯入urllib庫 url = urllib.request.urlopen(") #需要抓取資料的網站 data = url.read() dt1 = open("D:/Code/data/2.xls","wb") #xls表的位置,會自動生成xls表 dt1.write(data) #將資料寫入D:/Code/data/2.xls表中 dt1.close() print(data)
3.3 執行結果如下
開啟目錄下的2.xls表,即可看到爬取的資料;
API測試
來自 “ ITPUB部落格 ” ,連結:http://blog.itpub.net/70026630/viewspace-2935378/,如需轉載,請註明出處,否則將追究法律責任。
相關文章
- 爬蟲——網頁爬取方法和網頁解析方法爬蟲網頁
- Puppeteer爬取網頁資料網頁
- python爬取58同城一頁資料Python
- Python網路爬蟲第三彈《爬取get請求的頁面資料》Python爬蟲
- 關於python爬取網頁Python網頁
- 爬取資料時防止爬蟲被限制的四種方法爬蟲
- Python爬取噹噹網APP資料PythonAPP
- 使用 Python 爬取網站資料Python網站
- python爬取網頁詳細教程Python網頁
- 爬取githubs——登入後的東西(兩種方法)Github
- 「無程式碼」高效的爬取網頁資料神器網頁
- 不會Python爬蟲?教你一個通用爬蟲思路輕鬆爬取網頁資料Python爬蟲網頁
- Python爬取網頁的所有內外鏈Python網頁
- Python遍歷資料夾常用的兩種方法!Python
- Python筆記:網頁資訊爬取簡介(一)Python筆記網頁
- 結合LangChain實現網頁資料爬取LangChain網頁
- 如何使用python進行網頁爬取?Python網頁
- 如何用Python爬資料?(一)網頁抓取Python網頁
- zf_利用feapder中的selenium網頁爬取資料網頁
- Python爬蟲的兩套解析方法和四種爬蟲實現Python爬蟲
- python 爬蟲如何爬取動態生成的網頁內容Python爬蟲網頁
- Python爬蟲入門【3】:美空網資料爬取Python爬蟲
- 用Jupyter—Notebook爬取網頁資料例項14網頁
- 用Jupyter—Notebook爬取網頁資料例項12網頁
- 爬取網頁文章網頁
- 網頁用python爬取後如何解析網頁Python
- 手機版python爬取網頁書籍Python網頁
- python爬蟲爬取網頁中文亂碼問題的解決Python爬蟲網頁
- python兩種獲取剪貼簿內容的方法Python
- Python獲取list中指定元素索引的兩種方法Python索引
- 房產資料爬取、智慧財產權資料爬取、企業工商資料爬取、抖音直播間資料python爬蟲爬取Python爬蟲
- Python爬蟲訓練:爬取酷燃網視訊資料Python爬蟲
- python網路爬蟲(7)爬取靜態資料詳解Python爬蟲
- SQL Server在分頁獲取資料的同時獲取到總記錄數的兩種方法SQLServer
- php獲取網頁內容的三種方法PHP網頁
- Python網路爬蟲之爬取淘寶網頁頁面 MOOC可以執行的程式碼Python爬蟲網頁
- python爬蟲---網頁爬蟲,圖片爬蟲,文章爬蟲,Python爬蟲爬取新聞網站新聞Python爬蟲網頁網站
- Python:爬取疫情每日資料Python