CURL抓取網頁內容並用正則提取。
<?php
header("Content-Type:text/html;charset=UTF-8");
/*
* CURL網頁抓取
* */
class Curl{
var $setopt;
var $data;
function __construct($url){
$this->setopt =array(
CURLOPT_URL => "$url",
CURLOPT_RETURNTRANSFER => true,
CURLOPT_FOLLOWLOCATION => true,
);
}
function exec(){
$ch = curl_init();
curl_setopt_array($ch,$this->setopt);
$this->data = curl_exec($ch);
curl_close($ch);
return $this->data;
}
};
/*
* 抓取回來的網頁進行正則查詢
* id是按ID查詢內容
* tagName是標籤查詢
* className按類名查詢*/
class Preg{
function id($data,$id){
preg_match('/<(.*)\s*id=.*('.$id.').*>\s*(.*)\s*<\/(.*)>/',$data,$str);
return $str[0];
}
function tagName($data,$tag){
preg_match('/<'.$tag.'.*>\s*(.*)\s*<\/'.$tag.'>/',$data,$str);
return $str[1];
}
function className($data,$class){
preg_match('/<(.*)\s*class=.*('.$class.').*>\s*(.*)\s*<\/(.*)>/',$data,$str);
return $str[0];
}
}
$c = new Curl('http://www.baidu.com');
$data = $c->exec();
$data = @iconv("gb2312", "utf-8",$data);
$preg = new Preg();
echo $preg->tagName($data,'div');
轉自: http://blog.csdn.net/qq435792305/article/details/8502027
相關文章
- 凶猛的網頁內容抓取規則配置工具網頁
- 網頁提取資料常用正則網頁
- C#抓取網頁HTML內容C#網頁HTML
- 提取動態html網頁內容HTML網頁
- toapi:抓取任意網頁內容並提供 HTTP API獲取資料API網頁HTTP
- php中抓取網頁內容的程式碼PHP網頁
- 爬網入門:JAVA抓取網站網頁內容Java網站網頁
- 使用PHP的正則抓取頁面中的網址PHP
- c#簡單實現提取網頁內容C#網頁
- Python 爬蟲網頁內容提取工具xpath(一)Python爬蟲網頁
- Python 爬蟲網頁內容提取工具xpath(二)Python爬蟲網頁
- 網頁正文及內容圖片提取演算法網頁演算法
- 用thinkphp寫的一個例子:抓取網站的內容並且儲存到本地PHP網站
- Swift抓取某網站律師內容並做排名篩選Swift網站
- C#簡單的web網頁html抓取並提取指定a標籤連結C#Web網頁HTML
- PHP模擬登陸抓取頁面內容PHP
- java抓取有驗證的頁面內容Java
- ASP使用正則提取內容裡所有圖片路徑SRC的實現程式碼
- 如何使用angularjs實現抓取頁面內容AngularJS
- 怎麼更改網頁上的內容並儲存網頁
- 爬蟲,可用於增加訪問量和抓取網站全頁內容爬蟲網站
- 用scrapy進行網頁抓取網頁
- js提取正則中的字串JS字串
- Python爬蟲十六式 - 第四式: 使用Xpath提取網頁內容Python爬蟲網頁
- 實現java讀取網頁內容並下載網頁中出現的圖片Java網頁
- 修改網頁內容的方法網頁
- 核對不同資料夾所含內容的差異並提取缺失內容:Python程式碼Python
- 利用正規表示式刪除提取字串中文字內容字串
- 三國演義內容抓取(詩詞名句網)
- python抓取網頁中圖片並儲存到本地Python網頁
- 提取rpm檔案內容
- Python提取文字指定內容Python
- 用python3教你任意Html主內容提取PythonHTML
- 巧用網頁顯示硬碟內容網頁硬碟
- 透過Requests模組獲取網頁內容並使用BeautifulSoup進行解析網頁
- Jmeter系列(27)- 詳解正則提取器JMeter
- PHP 正則提取字串中的美元PHP字串
- 三種 Python 網路內容抓取工具與爬蟲Python爬蟲