c#簡單實現提取網頁內容
下面的程式碼是從一個網路爬蟲程式中提取出來的,覺得有用,記錄下來。
程式碼
using System;
using System.Collections;
using System.Collections.Generic;
using System.Reflection;
using System.IO;
using System.Net;
using System.Text;
namespace MyCsStudy
{
class Program
{
///
/// 簡單網路爬蟲程式
///
///
/// 編碼 可以為空
///
public static string Fetch(string url, string charset)
{
Encoding encoding;
HttpWebRequest request;
HttpWebResponse response = null;
Stream resStream = null;
StreamReader sr = null;
string result = string.Empty;
try
{
request = (HttpWebRequest)HttpWebRequest.Create(url);
response = (HttpWebResponse)request.GetResponse();
resStream = response.GetResponseStream();
if (!string.IsNullOrEmpty(charset))
{
encoding = Encoding.GetEncoding(charset);
}
else if (!string.IsNullOrEmpty(response.CharacterSet))
{
encoding = Encoding.GetEncoding(response.CharacterSet);
}
else
{
encoding = Encoding.Default;
}
sr = new StreamReader(resStream, encoding);
result = sr.ReadToEnd();
}
//catch (Exception ex)
//{
// throw ex;
//}
finally
{
if (sr != null)
{
sr.Close();
}
if (resStream != null)
{
resStream.Close();
}
if (response != null)
{
response.Close();
}
}
return result;
}
static void Main(string[] args)
{
string webSite=@"http://www.google.cn"; //這裡url必須帶上協議
string strHTML = Fetch(webSite,null);
Console.Write(strHTML);
Console.ReadLine();
}
}
}
來自 “ ITPUB部落格 ” ,連結:http://blog.itpub.net/12639172/viewspace-621002/,如需轉載,請註明出處,否則將追究法律責任。
相關文章
- 提取動態html網頁內容HTML網頁
- C#抓取網頁HTML內容C#網頁HTML
- CURL抓取網頁內容並用正則提取。網頁
- Python 爬蟲網頁內容提取工具xpath(一)Python爬蟲網頁
- Python 爬蟲網頁內容提取工具xpath(二)Python爬蟲網頁
- 網頁正文及內容圖片提取演算法網頁演算法
- 文章內容提取庫 goose 簡介Go
- C#簡單的web網頁html抓取並提取指定a標籤連結C#Web網頁HTML
- 點選載入更多網頁內容效果簡單介紹網頁
- django 網站實現簡單分頁Django網站
- 文章內容分頁功能實現
- 實現java讀取網頁內容並下載網頁中出現的圖片Java網頁
- 短影片文案提取的簡單實現
- C# 簡單反射實現winform左側樹形導航,右側切換內容C#反射ORM
- 用natapp簡單實現內網穿透APP內網穿透
- PbootCMS呼叫公司簡介等單頁內容的方法boot
- html網頁內容如何實現上標和下標效果HTML網頁
- PbootCMS模板如何在首頁上呼叫公司簡介等單頁內容boot
- Python爬蟲十六式 - 第四式: 使用Xpath提取網頁內容Python爬蟲網頁
- 如何使用angularjs實現抓取頁面內容AngularJS
- 如何外網訪問內網svn 網雲穿內網穿透教你簡單實現內網穿透
- 修改網頁內容的方法網頁
- UIWebView簡單的獲取HTML內容和修改頁面資訊UIWebViewHTML
- C#實現網頁截圖功能C#網頁
- 簡單網頁網頁
- 提取rpm檔案內容
- Python提取文字指定內容Python
- web簡單頁面佈局fixed 頭部固定 內容滾動Web
- 在 PBootCMS 中,呼叫公司簡介等單頁內容可以透過 {pboot:content} 模板標籤來實現boot
- 如何快速簡單的實現 Excel資料按列提取Excel
- 巧用網頁顯示硬碟內容網頁硬碟
- CSS實現的網頁柵格佈局簡單介紹CSS網頁
- js實現父頁面獲取iframe子頁面內容程式碼JS
- 簡單的Css控制bootstrap內容頁面的img寬度自適應CSSboot
- 簡單頁面開發神器——畫容
- 內網簡單bypass內網
- 淺談小程式內嵌網頁及內嵌網頁跳轉分享實現網頁
- JS_簡單實現頁面輸入JS