使用 `open-uri.with_proxy` 方法開啟網頁
Ruby 爬蟲程式如下:
```ruby
require 'open-uri'
require 'nokogiri'
# 定義代理資訊
proxy_host = 'jshk.com.cn'
# 定義要爬取的網頁 URL
url = '
# 使用代理資訊開啟網頁
open-uri.with_proxy(proxy_host, proxy_port) do |proxy|
# 使用 Nokogiri 庫解析網頁內容
doc = Nokogiri::HTML(proxy.open(url))
end
```
程式碼解釋:
1. 首先,我們引入了兩個 Ruby 模組,即 `open-uri` 和 `nokogiri`。`open-uri` 模組用於開啟網路資源,`nokogiri` 模組用於解析 HTML 檔案。
2. 然後,我們定義了代理資訊,即代理伺服器的主機名和埠號。
3. 接著,我們定義了要爬取的網頁 URL。
4. 使用 `open-uri.with_proxy` 方法開啟網頁,其中第一個引數是代理伺服器的主機名,第二個引數是代理伺服器的埠號。在 `with_proxy` 方法內部,我們使用 `proxy.open` 方法開啟網頁。
5. 使用 `Nokogiri::HTML` 方法解析開啟的網頁內容。
來自 “ ITPUB部落格 ” ,連結:http://blog.itpub.net/70032566/viewspace-2994966/,如需轉載,請註明出處,否則將追究法律責任。
相關文章
- Pinbox 使用快捷鍵開啟網頁網頁
- win10 如何開啟剛關閉的網頁_win10開啟剛關掉的網頁方法Win10網頁
- win10重啟後會開啟之前沒關的網頁解決方法Win10網頁
- win10 不開啟關機前的網頁怎麼設定 win10開機不自動開啟之前瀏覽的網頁方法Win10網頁
- win10有些網頁打不開怎麼辦 windows10個別網頁無法開啟恢復方法Win10網頁Windows
- Android 網頁開啟App進入對應頁面Android網頁APP
- 用selenium開啟網頁的最小模板網頁
- 解決root使用者不能開啟Chromium網頁瀏覽器網頁瀏覽器
- 開啟儲存的網頁顯示英文和數字的解決方法網頁
- 爬蟲——網頁爬取方法和網頁解析方法爬蟲網頁
- python selenium爬蟲 不開啟網頁 不開啟瀏覽器Python爬蟲網頁瀏覽器
- 谷歌瀏覽器打不開網頁怎麼解決 谷歌瀏覽器電腦上無法開啟網頁解決方法谷歌瀏覽器網頁
- w10更新後只能上網頁怎麼辦_win10升級後只能開啟網頁解決方法網頁Win10
- 當使用者開啟一個網頁時,想一直停留在當前開啟的頁面,如何禁止頁面前進和後退網頁
- 電腦360瀏覽器開啟網頁自動往下滑的解決方法瀏覽器網頁
- 網頁開啟自動跳轉另一個網頁怎麼辦、網頁劫持怎麼解決網頁
- 網頁佈局方法網頁
- 基於Html對父頁面開啟子頁面Dialog()的使用HTML
- 如何透過最佳化網站提高網頁開啟速度網站網頁
- 網頁,網站點選qq圖示,加qq,開啟對方qq的網頁程式碼網頁網站
- 360瀏覽器在電腦中開啟網頁無痕瀏覽的設定方法瀏覽器網頁
- 為什麼IIS網頁每天首次開啟速度很慢?網頁
- safari瀏覽網頁開啟速度很慢如何解決網頁
- qt下使用qwebview開啟網頁不顯示JPEG圖片的解決辦法QTWebView網頁
- 使用微信wx-open-launch-app標籤實現微信網頁開啟AppAPP網頁
- 谷歌瀏覽器開啟網頁顯示404該頁面不存在谷歌瀏覽器網頁
- 開啟網頁顯示資料庫連線出錯網頁資料庫
- WebRTC網頁開啟攝像頭並錄製視訊Web網頁
- Python使用request包請求網頁亂碼解決方法Python網頁
- 按照python程式設計入門到實踐 18章節建立網頁開啟網頁失敗Python程式設計網頁
- win10用qq瀏覽器網頁卡怎麼處理 win10系統qq瀏覽器開啟網頁卡恢復方法Win10瀏覽器網頁
- win10電腦網頁打不開怎麼辦 win10電腦網頁打不開的方法Win10網頁
- PBOOTCMS模板安裝後,網站首頁開啟版式錯亂的解決方法。(為什麼PBOOTCMS的模板首頁錯亂)boot網站
- 刪除google網頁快照方法Go網頁
- 修改網頁內容的方法網頁
- 開啟網頁 自動提示選擇qq實現方式整理網頁
- Espresso for Mac(mac網頁開發工具) v5.6.1啟用版EspressoMac網頁
- win10系統開啟網頁頁面顯示不完整如何解決Win10網頁