php獲取網頁內容的三種方法
3種利用php獲得網頁原始碼抓取網頁內容的方法,我們可以根據實際需要選用。
1、使用file_get_contents獲得網頁原始碼
這個方法最常用,只需要兩行程式碼即可,非常簡單方便。
參考程式碼:
<?php
$fh= file_get_contents('http://www.webkaka.com/');
echo $fh;
?>
2、使用fopen獲得網頁原始碼
這個方法用的人也不少,不過程式碼有點多。
參考程式碼:
<?php
$fh = fopen('http://www.webkaka.com/', 'r');
if($fh){
while(!feof($fh)) {
echo fgets($fh);
}
}
?>
3、使用curl獲得網頁原始碼
使用curl獲得網頁原始碼的做法,往往是需要更高要求的人使用,例如當你需要在抓取網頁內容的同時,得到網頁header資訊,還有ENCODING編碼的使用,USERAGENT的使用等等。
參考程式碼一:
<?php
// 建立一個新cURL資源
$ch = curl_init();
// 設定URL和相應的選項
curl_setopt($ch, CURLOPT_URL, "http://www.webkaka.com/");
curl_setopt($ch, CURLOPT_HEADER, false);
// 抓取URL並把它傳遞給瀏覽器
$data = curl_exec($ch);
echo $data;
//關閉cURL資源,並且釋放系統資源
curl_close($ch);
?>
參考程式碼二:
<?php
$szUrl = "http://www.webkaka.com/";
$UserAgent = 'Mozilla/4.0 (compatible; MSIE 7.0; Windows NT 6.0; SLCC1; .NET CLR 2.0.50727; .NET CLR 3.0.04506; .NET CLR 3.5.21022; .NET CLR 1.0.3705; .NET CLR 1.1.4322)';
$curl = curl_init();
curl_setopt($curl, CURLOPT_URL, $szUrl);
curl_setopt($curl, CURLOPT_HEADER, 0); //0表示不輸出Header,1表示輸出
curl_setopt($curl, CURLOPT_RETURNTRANSFER, 1);
curl_setopt($curl, CURLOPT_SSL_VERIFYPEER, false);
curl_setopt($curl, CURLOPT_SSL_VERIFYHOST, false);
curl_setopt($curl, CURLOPT_ENCODING, '');
curl_setopt($curl, CURLOPT_USERAGENT, $UserAgent);
curl_setopt($curl, CURLOPT_FOLLOWLOCATION, 1);
$data = curl_exec($curl);
echo $data;
//echo curl_errno($curl); //返回0時表示程式執行成功
exit();
?>
相關文章
- PHP獲取HTTP body內容的方法PHPHTTP
- python兩種獲取剪貼簿內容的方法Python
- JavaScript 獲取網頁尾本程式碼內容JavaScript網頁
- php獲取xml檔案內容PHPXML
- 修改網頁內容的方法網頁
- 127 PHP獲取網頁標題的3種實現方法程式碼例項PHP網頁
- PHP獲取目錄中的全部內容RecursiveDirectoryIteratorPHP
- 使用selenium和phantomJS瀏覽器獲取網頁內容的小演示JS瀏覽器網頁
- 帝國cms內容頁圖片自動獲取alt和title的方法
- Spring Boot 讀取配置內容的三種方式Spring Boot
- toapi:抓取任意網頁內容並提供 HTTP API獲取資料API網頁HTTP
- python讀取文字檔案內容的方法主要分為哪三種?Python
- 網頁內容複製貼上(三種方案 相容多種瀏覽器)網頁瀏覽器
- PHP 讀取 WORD 內容PHP
- PHP讀取WORD內容PHP
- PHP中獲取當前頁面的各種URL格式PHP
- 獲取爬蟲動態IP的三種方法爬蟲
- 透過Requests模組獲取網頁內容並使用BeautifulSoup進行解析網頁
- PHP --反射 --獲取類的方法PHP反射
- python四種方式解析網頁獲取頁面中的連結Python網頁
- 三種方法實現:獲取 url 中的引數
- Python 爬取網頁資料的兩種方法Python網頁
- VB 獲取剪貼簿的內容
- java 爬取網頁內容。 標題、圖片等Java網頁
- Python 爬取網頁中JavaScript動態新增的內容(一)Python網頁JavaScript
- Python 爬取網頁中JavaScript動態新增的內容(二)Python網頁JavaScript
- python 爬蟲如何爬取動態生成的網頁內容Python爬蟲網頁
- uniapp獲取通知欄內容 監聽通知欄內容APP
- jQuery - 獲取內容和屬性jQuery
- python tkinter如何獲取label內容?Python
- C++--Win32--列表編輯--獲取列表內容--獲取列表行數--修改列表內容C++Win32
- php一句話獲取獲取檔案目錄的方法PHP
- Javascript獲取原型的四種方法JavaScript原型
- 獲取 Class 物件的 3 種方法物件
- PHP 獲取檔案 副檔名 的常用方法小結【五種方式】PHP
- 網站主網頁修改,如何更新網站主頁內容網站網頁
- Flutter冷知識 | 獲取dart的print內容FlutterDart
- JavaScript 獲取td單元格內容JavaScript