推薦一款模擬瀏覽器自動化操作神器！Mechanize

狂师發表於2024-05-21

原文網址 : https://www.cnblogs.com/jinjiangongzuoshi/p/18203631

大家好，我是狂師！

今天給大家推薦一款用於模擬瀏覽器行為以進行網頁自動化操作Python庫：Mechanize。

1、介紹

Mechanize是Python中的一個庫，它被設計用來自動化網頁瀏覽和資料提取任務。

透過模擬真實瀏覽器的行為，如填寫表單、點選連結、處理Cookie等，Mechanize使得開發者可以用指令碼來自動執行這些通常需要人工操作的任務。這個庫特別適合於那些需要與網站互動，比如自動登入或者爬取需要透過表單提交才能訪問的內容的情況。

2、用途

Mechanize的用途非常廣泛，包括但不限於以下幾點：

自動登入網站：可以編寫指令碼使用Mechanize自動填充登入表單並提交，實現無需人工干預的自動登入過程。
提交表單：對於需要使用者填寫資訊並提交的線上表單，Mechanize能夠模擬這一過程，無論是進行資料收集還是實現自動化測試。
爬取網頁內容：透過模擬點選連結和處理頁面跳轉，Mechanize可以幫助開發者抓取那些靜態HTML無法直接獲取的動態生成的內容。
處理Cookie：在會話中維持狀態是很多網站功能正常工作的前提。Mechanize能夠處理Cookies，確保會話在多個請求之間得以保持。
設定代理：為了適應不同的網路環境和隱私保護需求，Mechanize允許使用者設定代理伺服器來進行網路請求。
重定向處理：自動跟蹤和管理網頁重定向，簡化了對複雜導航結構的網頁內容的抓取工作。

3、安裝、使用

首先確保你已經安裝了Mechanize庫。如果沒有安裝，可以透過pip命令進行安裝，使用命令

pip install mechanize

示例1: 使用Mechanize實現自動登入網站的完整示例程式碼

import mechanize

# 建立瀏覽器物件
browser = mechanize.Browser()

# 開啟登入頁面
login_url = 'http://www.example.com/login'
browser.open(login_url)

# 選擇登入表單（根據網頁結構，可能需要修改索引或名稱）
browser.select_form(nr=0)

# 填寫表單資訊
username = 'your_username'
password = 'your_password'
browser['username'] = username
browser['password'] = password

# 提交表單進行登入
response = browser.submit()

# 檢查登入結果
if response.geturl() == login_url:
    print("登入失敗")
else:
    print("登入成功")

# 進行後續操作，例如訪問其他頁面或者執行其他自動化操作
# ...

請注意，上述程式碼中的login_url、username和password需要根據實際情況進行替換。此外，根據目標網站的結構和表單欄位的名稱，可能還需要調整browser.select_form方法的引數以及表單欄位的鍵名。

這個示例程式碼演示了基本的登入過程，你可以根據具體需求進行擴充套件和修改。

示例2: 演示如何使用Mechanize實現爬取京東首頁內容

使用mechanize庫結合BeautifulSoup庫可以方便地爬取解析網頁內容

import mechanize
from bs4 import BeautifulSoup

# 建立瀏覽器物件
browser = mechanize.Browser()

# 設定請求頭（模擬Chrome瀏覽器）
chrome_headers = {
    'User-agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/58.0.3029.110 Safari/537.3',
    'Accept': 'text/html,application/xhtml+xml,application/xml;q=0.9,image/webp,*/*;q=0.8',
    'Accept-Encoding': 'gzip, deflate',
    'Accept-Language': 'en-US,en;q=0.8',
}
browser.addheaders = list(chrome_headers.items())

# 開啟京東首頁
home_url = 'https://www.jd.com'
browser.open(home_url)

# 獲取頁面內容
html_content = browser.response().read()

# 解析頁面內容（使用BeautifulSoup）
soup = BeautifulSoup(html_content, 'html.parser')

# 提取所需資訊（根據具體需求進行修改）
title = soup.title.string
print("京東首頁標題：", title)

# 進行後續操作，例如訪問其他頁面或者執行其他自動化操作
# ...

請注意，上述程式碼中的home_url需要根據實際情況進行替換。此外，根據目標網頁的結構，可能需要調整頁面內容的提取方式。

在這個例子中，我們設定了User-agent、Accept、Accept-Encoding和Accept-Language等請求頭，以模擬Chrome瀏覽器的行為。透過這種方式，你可以模擬不同的瀏覽器或裝置來訪問網站。

示例3: 獲取網頁上所有連結，並自動依次點選所有連結

import mechanize

# 建立瀏覽器物件
browser = mechanize.Browser()

# 開啟網頁
url = "http://example.com"
browser.open(url)

# 獲取所有連結
links = browser.links()

# 遍歷連結列表，依次點選每個連結
for link in links:
    response = browser.follow_link(link)
    html_content = response.read()
    print(html_content)

在這個例子中，我們首先建立了一個mechanize.Browser()例項。然後，我們開啟了一個網頁並獲取了所有的連結。接下來，我們使用一個迴圈來遍歷連結列表，並使用browser.follow_link()方法來模擬點選每個連結。最後，我們讀取了響應的內容並將其列印出來。

示例4: 操作網頁cookie完整程式碼示例

import mechanize
from http.cookiejar import CookieJar

# 建立一個CookieJar物件
cj = CookieJar()

# 建立一個瀏覽器物件，並設定CookieJar
br = mechanize.Browser()
br.set_cookiejar(cj)

# 開啟網頁
br.open("http://www.example.com")

# 獲取網頁的cookies
cookies = br._ua_handlers["_cookies"].cookiejar

# 列印cookies
for cookie in cookies:
    print(cookie)

4、小結

總的來說，Mechanize為Python開發者提供了強大的工具來自動化各種基於網頁的任務，從簡單的內容抓取到複雜的使用者互動模擬，都可以透過該庫來實現。

Mechanize庫，用於模擬瀏覽器行為
2023-10-27
瀏覽器
golang 模擬瀏覽器登入操作
2018-09-15
Golang瀏覽器
Chrome 瀏覽器修改 UA 模擬其它瀏覽器，包括移動瀏覽器
2021-09-09
Chrome瀏覽器
selenium模組，web自動化，建立瀏覽器
2024-11-23
Web瀏覽器
推薦一款Python介面自動化測試資料提取分析神器！
2024-07-11
Python
低程式碼開發，推薦一款Web 端自動化神器：Automa
2021-11-12
Web
推薦一款在瀏覽器編輯`Blazor`的`IDE`
2023-01-24
瀏覽器BlazorIDE
推薦一款自動化測試神器，不會寫程式碼也能做！
2021-07-13
SpringBoot+Selenium模擬使用者操作瀏覽器
2024-06-20
Spring Boot瀏覽器
Web自動化之瀏覽器啟動
2021-07-20
Web瀏覽器
技術必備：推薦一款介面自動化測試資料校驗神器
2021-06-24
推薦一款最強Python自動化神器！不用寫一行程式碼！
2020-12-18
Python行程
Playwright 模擬微信瀏覽器
2024-05-06
瀏覽器
推薦一款Python資料視覺化神器
2020-05-07
Python視覺化
safari瀏覽器模擬ipone，ipad以及其他瀏覽器版本
2018-04-24
瀏覽器iPad
使用chrome瀏覽器驅動自動開啟瀏覽器
2024-08-02
Chrome瀏覽器
應用推薦：來自 KDE 的 Falkon 開源 Web 瀏覽器
2019-12-31
Web瀏覽器
推薦一款 MySQL 命令列神器
2019-06-18
MySql命令列
模擬瀏覽器與伺服器互動(簡易TomCat框架)
2023-03-01
瀏覽器伺服器Tomcat框架
Python自動化神器：如何用PyAutoGUI模擬滾輪動一次
2024-06-23
PythonGUI
RemoteBrowser：類似Puppeteer的瀏覽器自動化框架
2018-10-15
REM瀏覽器框架
瀏覽器模擬顯示器不同解析度
2018-11-30
瀏覽器
瀏覽器可以自動修改URL？
2020-04-06
瀏覽器
自動化測試系列（2）—— 下載瀏覽器驅動
2018-08-02
瀏覽器
推薦Chrome外掛，讓你高效使用瀏覽器
2018-07-10
Chrome瀏覽器
PC端瀏覽器手機模擬器滑屏dome
2020-12-26
瀏覽器
Puppeteer無頭瀏覽器：開啟自動化之門，掌握瀏覽器世界的無限可能
2023-09-21
瀏覽器
禁用edge、chrome瀏覽器自動更新
2024-03-28
Chrome瀏覽器
強烈推薦 10 款珍藏的 Chrome 瀏覽器外掛
2020-02-15
Chrome瀏覽器
python爬蟲十三：selenium模擬瀏覽器+chrome+windows
2018-05-31
Python爬蟲瀏覽器ChromeWindows
JS模擬瀏覽器全域性搜尋功能實現
2019-09-10
JS瀏覽器
谷歌瀏覽器模擬地理定位和裝置方向
2019-02-20
谷歌瀏覽器
常見的IT自動化運維工具有哪些？推薦一款好用的？
2021-09-14
運維
測試開發：推薦一款阿里最新 Python 自動化開源工具！
2021-07-05
阿里Python開源工具
win10如何將瀏覽器初始化_win10初始化瀏覽器怎麼操作
2020-05-24
Win10瀏覽器
推薦一款 .NET 編寫的嵌入式平臺的開源模擬器--Renode
2022-11-26
部署 Browser-Use WebUI + DeepSeek 實現瀏覽器AI自動化
2025-01-15
WebUI瀏覽器AI
為 PHP 轉 Go 的朋友們推薦一款神器
2020-10-03
PHPGo

推薦一款模擬瀏覽器自動化操作神器！Mechanize

1、介紹

2、用途

3、安裝、使用

4、小結

相關文章