java抓取網頁的郵件地址
package pack.java.url;
import java.io.BufferedReader;
import java.io.IOException;
import java.io.InputStreamReader;
import java.net.MalformedURLException;
import java.net.URL;
import java.util.regex.Matcher;
import java.util.regex.Pattern;
public class GetEmailDemo {
/**
* 測試方法;
* @param args
*/
public static void main(String[] args) {
// TODO Auto-generated method stub
GetEmailDemo emailDemo = new GetEmailDemo();
String error = emailDemo.getWebContent("http://www.tianya.cn/publicforum/content/no04/1/1456104.shtml");
System.out.println(error);
System.out.println("郵件地址查詢完成...");
}
/**
* 獲得網頁中的原始碼; 逐行解析;
* @param path
* @return
*/
private String getWebContent(String path){
BufferedReader bufferedReader = null;
StringBuffer sb = new StringBuffer();
if(path!=null && !"".equals(path)){
try {
URL url = new URL(path);
bufferedReader = new BufferedReader(new InputStreamReader(url.openStream()));
String line = null;
System.out.println("開始分析郵件地址...");
while ((line = bufferedReader.readLine())!=null) {
//分析是否有email地址;
parse(line);
}
} catch (MalformedURLException e) {
// TODO Auto-generated catch block
e.printStackTrace();
sb.append(e.toString());
} catch (IOException e) {
// TODO Auto-generated catch block
e.printStackTrace();
sb.append(e.toString());
}finally{
try {
bufferedReader.close();
} catch (IOException e) {
// TODO Auto-generated catch block
e.printStackTrace();
sb.append(e.toString());
}
}
}
return sb.toString();
}
/**
* 分析資料;
* @param line
*/
private void parse(String line){
if(line!=null && line.length()>0){
//郵箱正規表示式;
String regexExpression = "[\\w[.-]]+@[\\w[.-]]+\\.[\\w]+";
Pattern pattern = Pattern.compile(regexExpression);
Matcher matcher = pattern.matcher(line);
while (matcher.find()) {
System.out.println(matcher.group());
}
}
}
}
相關文章
- IP地址在網頁抓取中的作用網頁
- IP地址在網頁抓取中有何作用網頁
- 蘋果Mac上的郵件如何刪除不需要的電子郵件地址?蘋果Mac
- 使用代理抓取網頁的原因網頁
- 郵箱/郵件地址的正規表示式及分析(JavaScript,email,regex)JavaScriptAI
- 在蘋果電腦的Mac郵件上阻止和取消阻止電子郵件地址的方法蘋果Mac
- java郵件傳送Java
- Java實現網易企業163郵箱傳送郵件Java
- 網路爬蟲之抓取郵箱爬蟲
- 郵件地址提取軟體:eMail Address Extractor for MacAIMac
- 騰牛網抓取(單頁)
- 如何抓取網頁資訊?網頁
- NodeJS使用PhantomJs抓取網頁NodeJS網頁
- Java Mail 郵件傳送(二):簡單封裝的郵件傳送JavaAI封裝
- 網頁資料抓取之噹噹網網頁
- 電子郵件地址註冊過程詳解
- 爬蟲抓取網頁的詳細流程爬蟲網頁
- 網頁抓取的重要性介紹網頁
- 已知郵件中圖片的 CID 地址,咋獲取圖片的真實網路地址?比如 src 是"/cgi-bin/"開頭的地址?
- 使用chromedriver抓取網頁截圖Chrome網頁
- 批量抓取網頁pdf檔案網頁
- 用phpmailer實現網頁表單提交傳送郵件功能PHPAI網頁
- 網頁地址傳參網頁
- Java實現郵件推送功能Java
- 網頁抓取與IPIDEA代理IP的關係網頁Idea
- 網頁抓取常見的問題有哪些?網頁
- 網頁抓取五種常用的HTTP標頭網頁HTTP
- Java web 專案,在網頁url地址訪問名JavaWeb網頁
- 爬蟲抓取網頁資料原理爬蟲網頁
- 企業需要專業電子郵件地址的4大原因
- Laravel 自定義 Markdown 電子郵件頁首和頁尾Laravel
- 抓取網頁的含義和URL基本構成網頁
- 基於Chrome的Easy Scraper外掛抓取網頁Chrome網頁
- php網站首頁動態地址修改,如何將PHP網站首頁的動態地址改為靜態地址PHP網站
- 郵件營銷用純文字郵件還是html郵件HTML
- CACTER郵件安全共建網路安全315:保護郵件系統,從處理emotet病毒郵件開始!
- win10系統中自帶郵件如何設定接收網易郵箱郵件Win10
- 使用 Beautiful Soup 在 Python 中抓取網頁Python網頁
- 網頁抓取如何幫助資料分析?網頁