C#抓取網頁HTML內容

雲霏霏發表於2014-07-14

　　網上很多內容採集工具，今天就自己試著寫一個，發現C#可以輕鬆的抓去網頁的內容，進而通過正則來分離出自己感興趣的資料。下面是抓去網頁內容的程式碼：

using System;
using System.Collections.Generic;
using System.Linq;
using System.Web;
using System.Net;
using System.Text;
using System.IO;
using System.Text.RegularExpressions;

namespace Web
{
   /// <summary>  
   /// 公共方法類  
   /// </summary>  
   public class WebHandler
   {
      /// <summary>  
      /// 獲取網頁的HTML碼  
      /// </summary>  
      /// <param name="url">連結地址</param>  
      /// <param name="encoding">編碼型別</param>  
      /// <returns></returns>  
      public static string GetHtmlStr(string url, string encoding)
      {
         string htmlStr = "";
         try
         {
            if (!String.IsNullOrEmpty(url))
            {
               WebRequest request = WebRequest.Create(url);            //例項化WebRequest物件  
               WebResponse response = request.GetResponse();           //建立WebResponse物件  
               Stream datastream = response.GetResponseStream();       //建立流物件  
               Encoding ec = Encoding.Default;
               if (encoding == "UTF8")
               {
                  ec = Encoding.UTF8;
               }
               else if (encoding == "Default")
               {
                  ec = Encoding.Default;
               }
               StreamReader reader = new StreamReader(datastream, ec);
               htmlStr = reader.ReadToEnd();                  //讀取網頁內容  
               reader.Close();
               datastream.Close();
               response.Close();
            }
         }
         catch { }
         return htmlStr;
      }
   }  
   
}

這個方法可以獲取網頁的HTML內容，有了HTML我們就可以通過正則來抓去自己想要的內容了。。。

提取動態html網頁內容
2018-09-06
HTML網頁
C#簡單的web網頁html抓取並提取指定a標籤連結
2019-05-11
C#Web網頁HTML
toapi：抓取任意網頁內容並提供 HTTP API獲取資料
2024-05-07
API網頁HTTP
爬蟲，可用於增加訪問量和抓取網站全頁內容
2018-09-08
爬蟲網站
三國演義內容抓取（詩詞名句網）
2024-08-07
網站主網頁修改，如何更新網站主頁內容
2024-12-06
網站網頁
修改網頁內容的方法
2024-10-07
網頁
C# 解析網頁HTML用HtmlAgilityPack外掛
2019-07-24
C#網頁HTML
HTML API + CSS 控制頁面列印內容和樣式
2023-02-22
HTMLAPICSS
在 C# 和 JavaScript 之間選擇進行網頁抓取
2024-09-22
C#JavaScript網頁
如何使用ScrapySharp下載網頁內容
2023-12-25
網頁
WordPress快速增加百度收錄,加快網站內容抓取
2019-04-02
網站
Swift抓取某網站律師內容並做排名篩選
2024-01-19
Swift網站
NodeJS使用PhantomJs抓取網頁
2019-02-16
NodeJS網頁
騰牛網抓取（單頁）
2024-08-07
如何抓取網頁資訊？
2022-06-02
網頁
Django搭建CMDB系統完整[5](base.html內容頁面)
2018-08-23
DjangoHTML
網頁資料抓取之噹噹網
2020-12-21
網頁
python爬蟲：使用BeautifulSoup修改網頁內容
2020-04-05
Python爬蟲網頁
Java爬蟲系列二：使用HttpClient抓取頁面HTML
2019-05-23
Java爬蟲HTTPclientHTML
批量抓取網頁pdf檔案
2019-02-16
網頁
使用chromedriver抓取網頁截圖
2024-11-07
Chrome網頁
使用代理抓取網頁的原因
2021-09-11
網頁
國內五大主流網站內容抓取工具/採集軟體大盤點
2018-12-12
網站
HTML5內容包含哪些
2019-09-12
HTML
php獲取網頁內容的三種方法
2018-10-17
PHP網頁
Python 爬蟲網頁內容提取工具xpath(二)
2018-12-08
Python爬蟲網頁
Python 爬蟲網頁內容提取工具xpath(一)
2018-12-06
Python爬蟲網頁
使用了`wreq`庫來下載網頁內容
2023-11-01
網頁
JavaScript 獲取網頁尾本程式碼內容
2020-02-20
JavaScript網頁
網頁可讀內容抽取 API 資料介面
2024-08-31
網頁API
靜態網站如何修改，輕鬆更新網頁內容
2024-11-30
網站網頁
HTML 網頁建立
2018-05-26
HTML網頁
Python爬蟲，抓取淘寶商品評論內容!
2018-06-24
Python爬蟲
爬蟲抓取網頁資料原理
2021-12-06
爬蟲網頁
網頁設計內容網頁中關於圖片預覽的設計
2019-01-14
網頁
網頁內容只是寫給訪客看的嗎？
2020-04-23
網頁
怎麼更改網頁上的內容並儲存
2024-10-07
網頁
java 爬取網頁內容。標題、圖片等
2021-09-24
Java網頁

C#抓取網頁HTML內容

相關文章