C#簡單的web網頁html抓取並提取指定a標籤連結

龐順龍發表於2019-05-11

C#簡單的web網頁html抓取並提取指定a標籤連結

string url = "http://xxxxx/";
for (int i = 1; i <= 1; i++)
{
    WebClient we = new WebClient(); 
    string myDataBuffer = we.DownloadString(url + i); 
    Regex RegExFindHref = new Regex(@"<a\s*href=\s*[""']?(?<href>[^""']*)[""']?[^>]*>a標籤內容,如下載地址等</a>", RegexOptions.Multiline | RegexOptions.IgnorePatternWhitespace);
    for (Match m = RegExFindHref.Match(myDataBuffer); m.Success; m = m.NextMatch())
    {
        using (System.IO.StreamWriter file = new System.IO.StreamWriter(@"E:\UrlTest2.txt", true))
        {
            file.WriteLine(m.Groups[1].ToString().Replace("&amp;", "&"));
        }
    }
}


龐順龍最後編輯於:4年前

內容均為作者獨立觀點,不代表八零IT人立場,如涉及侵權,請及時告知。

相關文章