CURL抓取網頁內容並用正則提取。
<?php
header("Content-Type:text/html;charset=UTF-8");
/*
* CURL網頁抓取
* */
class Curl{
var $setopt;
var $data;
function __construct($url){
$this->setopt =array(
CURLOPT_URL => "$url",
CURLOPT_RETURNTRANSFER => true,
CURLOPT_FOLLOWLOCATION => true,
);
}
function exec(){
$ch = curl_init();
curl_setopt_array($ch,$this->setopt);
$this->data = curl_exec($ch);
curl_close($ch);
return $this->data;
}
};
/*
* 抓取回來的網頁進行正則查詢
* id是按ID查詢內容
* tagName是標籤查詢
* className按類名查詢*/
class Preg{
function id($data,$id){
preg_match('/<(.*)\s*id=.*('.$id.').*>\s*(.*)\s*<\/(.*)>/',$data,$str);
return $str[0];
}
function tagName($data,$tag){
preg_match('/<'.$tag.'.*>\s*(.*)\s*<\/'.$tag.'>/',$data,$str);
return $str[1];
}
function className($data,$class){
preg_match('/<(.*)\s*class=.*('.$class.').*>\s*(.*)\s*<\/(.*)>/',$data,$str);
return $str[0];
}
}
$c = new Curl('http://www.baidu.com');
$data = $c->exec();
$data = @iconv("gb2312", "utf-8",$data);
$preg = new Preg();
echo $preg->tagName($data,'div');
轉自: http://blog.csdn.net/qq435792305/article/details/8502027
相關文章
- 網頁提取資料常用正則網頁
- 用正則提取域名網址
- 提取動態html網頁內容HTML網頁
- toapi:抓取任意網頁內容並提供 HTTP API獲取資料API網頁HTTP
- Python 爬蟲網頁內容提取工具xpath(二)Python爬蟲網頁
- Python 爬蟲網頁內容提取工具xpath(一)Python爬蟲網頁
- C#簡單的web網頁html抓取並提取指定a標籤連結C#Web網頁HTML
- Swift抓取某網站律師內容並做排名篩選Swift網站
- ASP使用正則提取內容裡所有圖片路徑SRC的實現程式碼
- 怎麼更改網頁上的內容並儲存網頁
- 爬蟲,可用於增加訪問量和抓取網站全頁內容爬蟲網站
- Python爬蟲十六式 - 第四式: 使用Xpath提取網頁內容Python爬蟲網頁
- 三國演義內容抓取(詩詞名句網)
- 核對不同資料夾所含內容的差異並提取缺失內容:Python程式碼Python
- 網站主網頁修改,如何更新網站主頁內容網站網頁
- 修改網頁內容的方法網頁
- Python提取文字指定內容Python
- 用python3教你任意Html主內容提取PythonHTML
- Jmeter系列(27)- 詳解正則提取器JMeter
- PHP 正則提取字串中的美元PHP字串
- 透過Requests模組獲取網頁內容並使用BeautifulSoup進行解析網頁
- Go抓取網頁資料並存入MySQL和返回json資料Go網頁MySqlJSON
- 如何使用ScrapySharp下載網頁內容網頁
- 正則提取十六進位制顏色值
- python 網頁文字提取Python網頁
- 文章內容提取庫 goose 簡介Go
- WordPress快速增加百度收錄,加快網站內容抓取網站
- NodeJS使用PhantomJs抓取網頁NodeJS網頁
- 騰牛網抓取(單頁)
- 如何抓取網頁資訊?網頁
- excel怎麼篩選重複的內容 excel找出重複項並提取Excel
- Python-網頁轉義字元及正則全文匹配Python網頁字元
- 網頁資料抓取之噹噹網網頁
- python爬蟲:使用BeautifulSoup修改網頁內容Python爬蟲網頁
- 如何用Python批量提取PDF文字內容?Python
- 如何使用htmlq提取html檔案內容HTML
- 批量抓取網頁pdf檔案網頁
- 使用chromedriver抓取網頁截圖Chrome網頁
- 使用代理抓取網頁的原因網頁