java抓取網頁的郵件地址
package pack.java.url;
import java.io.BufferedReader;
import java.io.IOException;
import java.io.InputStreamReader;
import java.net.MalformedURLException;
import java.net.URL;
import java.util.regex.Matcher;
import java.util.regex.Pattern;
public class GetEmailDemo {
/**
* 測試方法;
* @param args
*/
public static void main(String[] args) {
// TODO Auto-generated method stub
GetEmailDemo emailDemo = new GetEmailDemo();
String error = emailDemo.getWebContent("http://www.tianya.cn/publicforum/content/no04/1/1456104.shtml");
System.out.println(error);
System.out.println("郵件地址查詢完成...");
}
/**
* 獲得網頁中的原始碼; 逐行解析;
* @param path
* @return
*/
private String getWebContent(String path){
BufferedReader bufferedReader = null;
StringBuffer sb = new StringBuffer();
if(path!=null && !"".equals(path)){
try {
URL url = new URL(path);
bufferedReader = new BufferedReader(new InputStreamReader(url.openStream()));
String line = null;
System.out.println("開始分析郵件地址...");
while ((line = bufferedReader.readLine())!=null) {
//分析是否有email地址;
parse(line);
}
} catch (MalformedURLException e) {
// TODO Auto-generated catch block
e.printStackTrace();
sb.append(e.toString());
} catch (IOException e) {
// TODO Auto-generated catch block
e.printStackTrace();
sb.append(e.toString());
}finally{
try {
bufferedReader.close();
} catch (IOException e) {
// TODO Auto-generated catch block
e.printStackTrace();
sb.append(e.toString());
}
}
}
return sb.toString();
}
/**
* 分析資料;
* @param line
*/
private void parse(String line){
if(line!=null && line.length()>0){
//郵箱正規表示式;
String regexExpression = "[\\w[.-]]+@[\\w[.-]]+\\.[\\w]+";
Pattern pattern = Pattern.compile(regexExpression);
Matcher matcher = pattern.matcher(line);
while (matcher.find()) {
System.out.println(matcher.group());
}
}
}
}
相關文章
- 如何在網頁上隱藏你的Email郵件地址網頁AI
- IP地址在網頁抓取中的作用網頁
- IP地址在網頁抓取中有何作用網頁
- java抓取網頁的亂碼問題(通用)Java網頁
- Java抓取網頁資料(原網頁+Javascript返回資料)網頁JavaScript
- 在網頁中新增傳送郵件的按鈕網頁
- 爬網入門:JAVA抓取網站網頁內容Java網站網頁
- 蘋果Mac上的郵件如何刪除不需要的電子郵件地址?蘋果Mac
- linux mail利用外部郵箱地址發郵件LinuxAI
- Java郵件(JavaMail)JavaAI
- ThunderBird對只有回覆地址的郵件過濾
- 爬取網頁後的抓取資料_3種抓取網頁資料方法網頁
- 如何抓取網頁資訊?網頁
- python抓取網頁Python網頁
- Perl 6 網頁抓取網頁
- 使用代理抓取網頁的原因網頁
- 抓取網頁中的原始碼.網頁原始碼
- 在蘋果電腦的Mac郵件上阻止和取消阻止電子郵件地址的方法蘋果Mac
- Java 實現郵件的接收Java
- java郵件傳送Java
- java傳送郵件Java
- 網路爬蟲之抓取郵箱爬蟲
- Java實現QQ郵件傳送郵件工具類Java
- wget 網頁爬蟲,網頁抓取工具wget網頁爬蟲
- Java 爬蟲(獲取指定頁面中所有的郵箱地址)Java爬蟲
- scrapy抓取ajax請求的網頁網頁
- 騰牛網抓取(單頁)
- 郵箱/郵件地址的正規表示式及分析(JavaScript,email,regex)JavaScriptAI
- 網頁資料抓取之噹噹網網頁
- Java Mail 郵件傳送(二):簡單封裝的郵件傳送JavaAI封裝
- 如何在頁面中插入郵箱地址
- java抓取HTML頁面的資料(淘寶頁面),JavaHTML
- 網頁抓取的重要性介紹網頁
- 爬蟲抓取網頁的詳細流程爬蟲網頁
- 批量抓取網頁pdf檔案網頁
- 從網頁上抓取資料網頁
- 用scrapy進行網頁抓取網頁
- 電子郵件地址註冊過程詳解