java抓取網頁的亂碼問題(通用)
java抓取網頁的亂碼問題(通用)2010-12-22 13:34//解決抓取頁面的亂碼問題 import java.io.BufferedReader; import java.io.BufferedWriter; import java.io.File; import java.io.FileOutputStream; import java.io.IOException; import java.io.InputStreamReader; import java.io.OutputStreamWriter; import java.net.URL; import java.net.URLConnection; public class DownPage { public static void main(String args[]) throws IOException{ //抓取的頁面地址 String urlStr = "http://www.baidu.com"; URL url = new URL(urlStr); URLConnection connection = url.openConnection(); //獲得該網頁的編碼 String ss = connection.getContentType(); System.out.println(ss); //查InputStreamReader的構造方法,gb2312為該頁面的編碼 BufferedReader br = new BufferedReader(new InputStreamReader(url.openStream(),"gb2312")); File file = new File("d:/a.html"); BufferedWriter bw = new BufferedWriter(new OutputStreamWriter(new FileOutputStream(file))); if(br != null){ String s = null; while((s = br.readLine())!=null){ //String sss = new String(s.getBytes("gb2312"),"windows-31J"); System.out.println(s); bw.write(s); bw.flush(); } bw.close(); br.close(); } } }
相關文章
- python3抓取網頁解碼問題!Python網頁
- 網頁抓取常見的問題有哪些?網頁
- Java 中文 亂碼問題Java
- 抓取網頁中的原始碼.網頁原始碼
- java抓取網頁的郵件地址Java網頁
- JSP頁面裡中文的亂碼問題JS
- Java 解決中文亂碼問題Java
- Java,MySQL中文亂碼問題求教JavaMySql
- java處理中文亂碼問題Java
- python爬蟲爬取網頁中文亂碼問題的解決Python爬蟲網頁
- 頁面傳值地址爛亂碼問題
- jsp頁面中中文亂碼問題JS
- java中亂碼問題解決方法Java
- Java GBK 中文亂碼問題分析Java
- Java Web開發中文亂碼問題JavaWeb
- java Socket接收資料亂碼問題Java
- Java抓取網頁資料(原網頁+Javascript返回資料)網頁JavaScript
- java中解決request中文亂碼問題Java
- php中抓取網頁內容的程式碼PHP網頁
- tomcat-windows環境頁面亂碼問題TomcatWindows
- flex亂碼問題Flex
- mysql亂碼問題MySql
- JBOSS下的JSP頁面字符集亂碼問題JS
- javaweb 中的亂碼問題JavaWeb
- Java抓任意網頁標題亂碼jsoup解決方案一例Java網頁JS
- 爬網入門:JAVA抓取網站網頁內容Java網站網頁
- Java IO輸入輸出及亂碼問題Java
- Java讀取文字檔案中文亂碼問題Java
- EasyUI 中文亂碼問題UI
- MSSQL中文亂碼問題SQL
- java建立web動態網頁遇到的問題JavaWeb網頁
- 爬取網頁後的抓取資料_3種抓取網頁資料方法網頁
- 如何抓取網頁資訊?網頁
- python抓取網頁Python網頁
- Perl 6 網頁抓取網頁
- 使用代理抓取網頁的原因網頁
- 公司網站首頁突然亂碼網站
- mysql亂碼的問題如何解決MySql