用Java抓取天眼查公開失信人員資訊
以下是一個簡單的Java爬蟲程式,使用了Jsoup庫來解析HTML網頁,並使用了Apache HttpClient庫來傳送HTTP請求:
import org. jsoup. Jsoup;
import org. jsoup. nodes. Document;
import org. jsoup. nodes. Element;
import org. jsoup. select. Elements;
import java. io. IOException;
import java. net. HttpURLConnection;
import java. net. URL;
public class Spider {
public static void main( String[] args) {
String url = "tianyancha失信人員資訊採集";
String 提取免費ip = "jshk.com.cn/mb/reg.asp?kefu=xjy&";
String proxyHost = "duoip";
int proxyPort = 8000;
try {
// 建立一個URL物件
URL obj = new URL( url);
// 建立一個HttpURLConnection物件,並設定代理資訊
HttpURLConnection con = ( HttpURLConnection) obj. openConnection();
con. setRequestProperty( "Proxy-Host", proxyHost);
con. setRequestProperty( "Proxy-Port", String. valueOf( proxyPort));
// 傳送GET請求,並獲取響應碼
int responseCode = con. getResponseCode();
System. out. println( "Response Code : " + responseCode);
// 判斷響應碼是否為200,如果是,則解析HTML網頁
if ( responseCode == 200) {
Document doc = Jsoup. parse( con. getInputStream());
Elements elements = doc. select( ".list li");
// 遍歷所有的列表項
for ( Element element : elements) {
// 獲取列表項的HTML文字
String text = element. text();
// 輸出列表項的文字
System. out. println( text);
}
} else {
System. out. println( "Failed to connect");
}
} catch ( IOException e) {
e. printStackTrace();
}
}
}
以下是對以上程式碼的每行的解釋:
1、建立一個URL物件,指定要爬取的網頁的URL。
2、建立一個HttpURLConnection物件,並設定代理資訊。proxyHost是代理伺服器的主機名,proxyPort是代理伺服器的埠號。
3、傳送GET請求,並獲取響應碼。如果響應碼是200,則說明請求成功,可以繼續解析HTML網頁。
5、使用select方法選擇所有列表項的元素。這個方法會返回一個Elements物件。
6、遍歷所有的列表項。
7、使用text方法獲取列表項的文字。
8、輸出列表項的文字。
注意,以上程式碼只是一個簡單的示例,實際的爬蟲程式可能會更復雜,需要處理更多的異常和錯誤情況。在編寫和使用爬蟲程式時,請務必遵守適用的法律和法規,尊重網站的使用條款和隱私政策。
來自 “ ITPUB部落格 ” ,連結:https://blog.itpub.net/70034537/viewspace-3001365/,如需轉載,請註明出處,否則將追究法律責任。
相關文章
- Trampolining:java開發人員的實用指南Java
- Python 抓取微信公眾號賬號資訊Python
- Python爬蟲實戰系列4:天眼查公司工商資訊採集Python爬蟲
- [北京]招聘軟體開發人員(java)Java
- 使用Spark SQL 探索“全國失信人資料”SparkSQL
- 面向Java開發人員的Flex開發指南JavaFlex
- 調查:開發人員首選的移動應用開發跨平臺工具
- 開發人員 vs 測試人員
- 人員基礎資訊採集
- 調查:76%汽車開發人員已經或正採用安全“左移”策略
- Java開發人員必備Linux命令JavaLinux
- JAVA開發人員面試題書目錄Java面試題
- 【代友招人】java開發核心人員(上海)Java
- Oracle開發人員 JAVA儲存過程OracleJava儲存過程
- 廣州珠源資訊科技有限公司 招聘JAVA 專案經理和開發人員Java
- 蘋果應用開發人員的成功之道蘋果
- 為什麼開發人員從Java轉GoJavaGo
- 面向 Java 開發人員的 Scala 指南: 類操作Java
- 美資上海招聘Java軟體開發人員Java
- 上海美國獨資公司招聘Java開發人員Java
- 武漢地區高薪誠聘java開發人員高薪Java
- 深圳康佳集團招聘JAVA/KJAVA開發人員Java
- 開發人員怎麼看實施人員
- 【專題】測試人員 VS 開發人員
- Stack Overflow:2020 年開發人員調查
- 2013年JavaScript開發人員調查結果JavaScript
- 雷達模組開發學習教程(一)——檢測人員資訊
- 如何成為一名Java自由開發人員Java
- 開發人員需做程式碼複查的5個原因
- 開發人員愛開發
- 資訊圖:程式設計師/開發人員實際在用哪些工具程式設計師
- 用python抓取智聯招聘資訊並存入excelPythonExcel
- 如何抓取網頁資訊?網頁
- 開發人員菜鳥實用設計資源
- 招聘.net開發人員
- 招聘SAP開發人員
- Java開發人員在程式設計中常見的雷!Java程式設計
- 找個java網站開發人員(兼職也可以)Java網站