用Java抓取天眼查公開失信人員資訊
以下是一個簡單的Java爬蟲程式,使用了Jsoup庫來解析HTML網頁,並使用了Apache HttpClient庫來傳送HTTP請求:
import org. jsoup. Jsoup;
import org. jsoup. nodes. Document;
import org. jsoup. nodes. Element;
import org. jsoup. select. Elements;
import java. io. IOException;
import java. net. HttpURLConnection;
import java. net. URL;
public class Spider {
public static void main( String[] args) {
String url = "tianyancha失信人員資訊採集";
String 提取免費ip = "jshk.com.cn/mb/reg.asp?kefu=xjy&";
String proxyHost = "duoip";
int proxyPort = 8000;
try {
// 建立一個URL物件
URL obj = new URL( url);
// 建立一個HttpURLConnection物件,並設定代理資訊
HttpURLConnection con = ( HttpURLConnection) obj. openConnection();
con. setRequestProperty( "Proxy-Host", proxyHost);
con. setRequestProperty( "Proxy-Port", String. valueOf( proxyPort));
// 傳送GET請求,並獲取響應碼
int responseCode = con. getResponseCode();
System. out. println( "Response Code : " + responseCode);
// 判斷響應碼是否為200,如果是,則解析HTML網頁
if ( responseCode == 200) {
Document doc = Jsoup. parse( con. getInputStream());
Elements elements = doc. select( ".list li");
// 遍歷所有的列表項
for ( Element element : elements) {
// 獲取列表項的HTML文字
String text = element. text();
// 輸出列表項的文字
System. out. println( text);
}
} else {
System. out. println( "Failed to connect");
}
} catch ( IOException e) {
e. printStackTrace();
}
}
}
以下是對以上程式碼的每行的解釋:
1、建立一個URL物件,指定要爬取的網頁的URL。
2、建立一個HttpURLConnection物件,並設定代理資訊。proxyHost是代理伺服器的主機名,proxyPort是代理伺服器的埠號。
3、傳送GET請求,並獲取響應碼。如果響應碼是200,則說明請求成功,可以繼續解析HTML網頁。
5、使用select方法選擇所有列表項的元素。這個方法會返回一個Elements物件。
6、遍歷所有的列表項。
7、使用text方法獲取列表項的文字。
8、輸出列表項的文字。
注意,以上程式碼只是一個簡單的示例,實際的爬蟲程式可能會更復雜,需要處理更多的異常和錯誤情況。在編寫和使用爬蟲程式時,請務必遵守適用的法律和法規,尊重網站的使用條款和隱私政策。
來自 “ ITPUB部落格 ” ,連結:https://blog.itpub.net/70034537/viewspace-3001365/,如需轉載,請註明出處,否則將追究法律責任。
相關文章
- 天眼查
- Python爬蟲實戰系列4:天眼查公司工商資訊採集Python爬蟲
- 使用瀏覽器開發人員工具抓取Windows聚焦桌面桌布瀏覽器Windows
- Stack Overflow:2020 年開發人員調查
- 人員基礎資訊採集
- 用python抓取智聯招聘資訊並存入excelPythonExcel
- Java開發人員必備Linux命令JavaLinux
- colly 自動抓取資訊
- 如何抓取網頁資訊?網頁
- 使用python3抓取pinpoint應用資訊入庫Python
- 開盒查人教程開盒查人教程開盒查人教程開盒查人教程
- 南極圈&天眼查:2019年騰訊系校友創業圖譜創業
- 調查:76%汽車開發人員已經或正採用安全“左移”策略
- Harness:2020年開發人員滿意度調查
- 2020電商行業企業資料包告-天眼查.pdf行業
- 爬蟲app資訊抓取之apk反編譯抓取爬蟲APPAPK編譯
- Python爬蟲抓取股票資訊Python爬蟲
- 雷達模組開發學習教程(一)——檢測人員資訊
- Java收入最低,996人口僅2%:2019全球開發者調查結果公佈Java996
- 面向Web開發人員的Linux實用入門WebLinux
- Java開發人員在程式設計中常見的雷!Java程式設計
- 嘿,我在尋找視訊編輯開發人員
- 使用scrapy抓取Youtube播放列表資訊
- 谷歌專家:為什麼Java伺服器端開發人員不採用Kotlin? - Ivan谷歌Java伺服器Kotlin
- 怎樣通過java用web3j查詢以太坊交易資訊?JavaWeb
- 研究人員發現可公開訪問的包含1100萬條記錄的MongoDB資料庫MongoDB資料庫
- 超實用的58個office快捷鍵彙總,辦公室人員必備!
- Puppeteer 爬取豆瓣小組公開資訊
- 1.1.5 應用管理人員
- 針鋒相對:在俄羅斯30萬預備役士兵資料遭洩露後,烏克蘭1500情報人員資訊遭公開
- 為什麼安全是Java開發人員的首要任務?Java
- 優秀的Java開發人員必備的6個技能!Java
- 開發人員不得不知的MySQL索引和查詢優化MySql索引優化
- 開發人員不得不會的MySQL多表聯合查詢方法!MySql
- 通過bundle Id查詢應用資訊
- Python實現拼多多商品資訊抓取方法Python
- 穩居行業第一,天眼查打出「商業安全」行業
- 用訊飛智慧辦公本Air,助力職場人晉升加速AI