使用 `open-uri.with_proxy` 方法開啟網頁
Ruby 爬蟲程式如下:
```ruby
require 'open-uri'
require 'nokogiri'
# 定義代理資訊
proxy_host = 'jshk.com.cn'
# 定義要爬取的網頁 URL
url = '
# 使用代理資訊開啟網頁
open-uri.with_proxy(proxy_host, proxy_port) do |proxy|
# 使用 Nokogiri 庫解析網頁內容
doc = Nokogiri::HTML(proxy.open(url))
end
```
程式碼解釋:
1. 首先,我們引入了兩個 Ruby 模組,即 `open-uri` 和 `nokogiri`。`open-uri` 模組用於開啟網路資源,`nokogiri` 模組用於解析 HTML 文件。
2. 然後,我們定義了代理資訊,即代理伺服器的主機名和埠號。
3. 接著,我們定義了要爬取的網頁 URL。
4. 使用 `open-uri.with_proxy` 方法開啟網頁,其中第一個引數是代理伺服器的主機名,第二個引數是代理伺服器的埠號。在 `with_proxy` 方法內部,我們使用 `proxy.open` 方法開啟網頁。
5. 使用 `Nokogiri::HTML` 方法解析開啟的網頁內容。
來自 “ ITPUB部落格 ” ,連結:http://blog.itpub.net/70032566/viewspace-2994966/,如需轉載,請註明出處,否則將追究法律責任。
相關文章
- Pinbox 使用快捷鍵開啟網頁網頁
- win10 如何開啟剛關閉的網頁_win10開啟剛關掉的網頁方法Win10網頁
- 中毒無法開啟網頁網頁
- AIX下開啟大頁的方法AI
- 將內表下載到網頁,並開啟網頁:網頁
- 網頁開啟速度的心理學網頁
- win10重啟後會開啟之前沒關的網頁解決方法Win10網頁
- win10 不開啟關機前的網頁怎麼設定 win10開機不自動開啟之前瀏覽的網頁方法Win10網頁
- win10有些網頁打不開怎麼辦 windows10個別網頁無法開啟恢復方法Win10網頁Windows
- 人人商城PHP網站開啟網頁空白PHP網站網頁
- uc 瀏覽器不能開啟網頁瀏覽器網頁
- 解決root使用者不能開啟Chromium網頁瀏覽器網頁瀏覽器
- Android 網頁開啟App進入對應頁面Android網頁APP
- tomcat啟動超時以及啟動之後開啟網頁報404錯誤的解決方法Tomcat網頁
- 開啟儲存的網頁顯示英文和數字的解決方法網頁
- win8系統Metro IE無法開啟網頁的解決方法網頁
- 設定以極速模式開啟網頁模式網頁
- 用selenium開啟網頁的最小模板網頁
- 谷歌瀏覽器打不開網頁怎麼解決 谷歌瀏覽器電腦上無法開啟網頁解決方法谷歌瀏覽器網頁
- 爬蟲——網頁爬取方法和網頁解析方法爬蟲網頁
- w10更新後只能上網頁怎麼辦_win10升級後只能開啟網頁解決方法網頁Win10
- 電腦360瀏覽器開啟網頁自動往下滑的解決方法瀏覽器網頁
- Win2000系統無法開啟網頁的解決方法(轉)網頁
- 網頁開啟自動跳轉另一個網頁怎麼辦、網頁劫持怎麼解決網頁
- firefox瀏覽器開啟網頁報錯Firefox瀏覽器網頁
- python selenium爬蟲 不開啟網頁 不開啟瀏覽器Python爬蟲網頁瀏覽器
- 使用微信wx-open-launch-app標籤實現微信網頁開啟AppAPP網頁
- 如何透過最佳化網站提高網頁開啟速度網站網頁
- 介紹兩個測試網頁開啟速度的網站網頁網站
- 網頁,網站點選qq圖示,加qq,開啟對方qq的網頁程式碼網頁網站
- Javascript跳轉頁面和開啟新視窗等方法JavaScript
- 網頁佈局方法網頁
- 為什麼IIS網頁每天首次開啟速度很慢?網頁
- safari瀏覽網頁開啟速度很慢如何解決網頁
- Chrome 禁止從頁面開啟 Data URI 網址了Chrome
- 360瀏覽器在電腦中開啟網頁無痕瀏覽的設定方法瀏覽器網頁
- Win10系統無法開啟網頁顯示“403 forbidden”的解決方法Win10網頁ORB
- 基於Html對父頁面開啟子頁面Dialog()的使用HTML