網路爬蟲示例

weiqiangGG發表於2018-10-30

原文網址 : https://blog.csdn.net/weiqiangGG/article/details/83539911


import java.io.BufferedReader;
import java.io.IOException;
import java.io.InputStreamReader;
import java.io.UnsupportedEncodingException;
import java.net.MalformedURLException;
import java.net.URL;
import java.util.ArrayList;
import java.util.List;
import java.util.regex.Matcher;
import java.util.regex.Pattern;

public class WebSpider1 {
	public static String getContent(String urlStr, String s) {
		StringBuilder sb = new StringBuilder();
			try {
				URL url = new URL(urlStr);
				BufferedReader bf = new BufferedReader(new InputStreamReader(url.openStream(), s));
				String temp = "";
				while((temp=bf.readLine())!=null) {
					sb.append(temp);
				}
			} catch (MalformedURLException e) {
				e.printStackTrace();
			} catch (UnsupportedEncodingException e) {
				e.printStackTrace();
			} catch (IOException e) {
				e.printStackTrace();
			}
		return sb.toString();
		
	}
	public static List<String> getStr(String des, String regexStr){
		Pattern p = Pattern.compile(regexStr);
		Matcher m = p.matcher(des);
		List<String> list = new ArrayList<String>();
		while(m.find()) {
			list.add(m.group(1));
		}
		return list;
	}
	public static void main(String[] args) {
		String des = getContent("http://www.163.com", "gbk");
		List<String> str = getStr(des,"href=\"([\\w\\s./:]*?)\"");
		for(String temp : str) {
			System.out.println(temp);
		}
		
	}
}

網路爬蟲
2018-12-07
爬蟲
網路爬蟲——爬蟲實戰（一）
2022-01-29
爬蟲
網路爬蟲精要
2019-04-27
爬蟲
python網路爬蟲_Python爬蟲：30個小時搞定Python網路爬蟲視訊教程
2020-10-21
Python爬蟲
python網路爬蟲應用_python網路爬蟲應用實戰
2020-12-29
Python爬蟲
網路爬蟲的原理
2018-12-02
爬蟲
python DHT網路爬蟲
2019-02-14
Python爬蟲
網路爬蟲專案
2022-01-29
爬蟲
[Python] 網路爬蟲與資訊提取（1）網路爬蟲之規則
2020-11-06
Python爬蟲
什麼是Python網路爬蟲?常見的網路爬蟲有哪些?
2020-11-27
Python爬蟲
python網路爬蟲（14）使用Scrapy搭建爬蟲框架
2019-07-27
Python爬蟲框架
python網路爬蟲（9）構建基礎爬蟲思路
2019-06-09
Python爬蟲
網路爬蟲（python專案）
2018-12-04
爬蟲Python
什麼是網路爬蟲
2018-12-02
爬蟲
網路爬蟲大型教程(二)
2018-05-14
爬蟲
專案－－python網路爬蟲
2020-08-15
Python爬蟲
網路爬蟲流程總結
2023-03-09
爬蟲
網路爬蟲如何運作？
2022-02-08
爬蟲
python網路爬蟲合法嗎
2021-09-11
Python爬蟲
網路爬蟲的反扒策略
2021-09-11
爬蟲
什麼是網路爬蟲？
2022-12-09
爬蟲
網路爬蟲是什麼？
2022-05-25
爬蟲
Python網路爬蟲實戰
2022-03-18
Python爬蟲
[網路爬蟲] 網路爬蟲實踐：大麥網演唱會預約搶票【待續】
2024-05-04
爬蟲
爬蟲（9） - Scrapy框架(1) | Scrapy 非同步網路爬蟲框架
2022-07-05
爬蟲框架非同步
精通Scrapy網路爬蟲【一】第一個爬蟲專案
2021-06-19
爬蟲
python3網路爬蟲開發實戰_Python 3開發網路爬蟲(一)
2020-12-07
Python爬蟲
Golang 網路爬蟲框架gocolly/colly
2019-01-15
Golang爬蟲框架
網路爬蟲開發常用框架
2019-02-27
爬蟲框架
Java網路爬蟲實操（10）
2018-06-10
Java爬蟲
網路爬蟲之抓取郵箱
2018-06-18
爬蟲
Java網路爬蟲實操（8）
2018-03-15
Java爬蟲
python網路爬蟲筆記（一）
2020-10-25
Python爬蟲筆記
[網路爬蟲] Jsoup : HTML 解析工具
2024-10-06
爬蟲JSHTML
Java網路爬蟲實操（7）
2018-03-05
Java爬蟲
Java網路爬蟲實操（9）
2018-03-17
Java爬蟲
如何防止網路爬蟲被限制？
2022-05-17
爬蟲
C#網路爬蟲開發
2023-02-12
C#爬蟲

網路爬蟲示例

相關文章