php獲取網頁內容的三種方法

知末隨未發表於2018-10-17

3種利用php獲得網頁原始碼抓取網頁內容的方法，我們可以根據實際需要選用。
1、使用file_get_contents獲得網頁原始碼
這個方法最常用，只需要兩行程式碼即可，非常簡單方便。
參考程式碼：
<?php
$fh= file_get_contents('http://www.webkaka.com/');
echo $fh;
?>
 
2、使用fopen獲得網頁原始碼
這個方法用的人也不少，不過程式碼有點多。
參考程式碼：
<?php
$fh = fopen('http://www.webkaka.com/', 'r');
if($fh){
    while(!feof($fh)) {
        echo fgets($fh);
    }
}
?>
 
3、使用curl獲得網頁原始碼
 
使用curl獲得網頁原始碼的做法，往往是需要更高要求的人使用，例如當你需要在抓取網頁內容的同時，得到網頁header資訊，還有ENCODING編碼的使用，USERAGENT的使用等等。
參考程式碼一：
<?php
// 建立一個新cURL資源
$ch = curl_init();
// 設定URL和相應的選項
curl_setopt($ch, CURLOPT_URL, "http://www.webkaka.com/");
curl_setopt($ch, CURLOPT_HEADER, false);
// 抓取URL並把它傳遞給瀏覽器
$data = curl_exec($ch);
echo $data;
//關閉cURL資源，並且釋放系統資源
curl_close($ch);
?>
 
參考程式碼二：
<?php
$szUrl = "http://www.webkaka.com/";
$UserAgent = 'Mozilla/4.0 (compatible; MSIE 7.0; Windows NT 6.0; SLCC1; .NET CLR 2.0.50727; .NET CLR 3.0.04506; .NET CLR 3.5.21022; .NET CLR 1.0.3705; .NET CLR 1.1.4322)';
$curl = curl_init();
curl_setopt($curl, CURLOPT_URL, $szUrl);
curl_setopt($curl, CURLOPT_HEADER, 0);  //0表示不輸出Header，1表示輸出
curl_setopt($curl, CURLOPT_RETURNTRANSFER, 1);
curl_setopt($curl, CURLOPT_SSL_VERIFYPEER, false);
curl_setopt($curl, CURLOPT_SSL_VERIFYHOST, false);
curl_setopt($curl, CURLOPT_ENCODING, '');
curl_setopt($curl, CURLOPT_USERAGENT, $UserAgent);
curl_setopt($curl, CURLOPT_FOLLOWLOCATION, 1);
$data = curl_exec($curl); 
echo $data;
//echo curl_errno($curl); //返回0時表示程式執行成功 
exit();
?>

PHP獲取HTTP body內容的方法
2019-01-15
PHPHTTP
python兩種獲取剪貼簿內容的方法
2020-11-11
Python
JavaScript 獲取網頁尾本程式碼內容
2020-02-20
JavaScript網頁
php獲取xml檔案內容
2021-09-09
PHPXML
修改網頁內容的方法
2024-10-07
網頁
127 PHP獲取網頁標題的3種實現方法程式碼例項
2018-09-12
PHP網頁
PHP獲取目錄中的全部內容RecursiveDirectoryIterator
2024-07-09
PHP
使用selenium和phantomJS瀏覽器獲取網頁內容的小演示
2019-01-14
JS瀏覽器網頁
帝國cms內容頁圖片自動獲取alt和title的方法
2020-06-10
Spring Boot 讀取配置內容的三種方式
2020-11-06
Spring Boot
toapi：抓取任意網頁內容並提供 HTTP API獲取資料
2024-05-07
API網頁HTTP
python讀取文字檔案內容的方法主要分為哪三種？
2022-05-23
Python
網頁內容複製貼上(三種方案相容多種瀏覽器)
2019-03-04
網頁瀏覽器
PHP 讀取 WORD 內容
2021-08-26
PHP
PHP讀取WORD內容
2021-08-26
PHP
PHP中獲取當前頁面的各種URL格式
2019-02-16
PHP
獲取爬蟲動態IP的三種方法
2022-06-06
爬蟲
透過Requests模組獲取網頁內容並使用BeautifulSoup進行解析
2024-03-26
網頁
PHP --反射 --獲取類的方法
2019-03-05
PHP反射
python四種方式解析網頁獲取頁面中的連結
2020-12-31
Python網頁
三種方法實現：獲取 url 中的引數
2018-08-28
Python 爬取網頁資料的兩種方法
2023-02-15
Python網頁
VB 獲取剪貼簿的內容
2020-10-15
java 爬取網頁內容。標題、圖片等
2021-09-24
Java網頁
Python 爬取網頁中JavaScript動態新增的內容（一）
2018-09-28
Python網頁JavaScript
Python 爬取網頁中JavaScript動態新增的內容（二）
2018-09-28
Python網頁JavaScript
python 爬蟲如何爬取動態生成的網頁內容
2024-10-31
Python爬蟲網頁
uniapp獲取通知欄內容監聽通知欄內容
2021-05-06
APP
jQuery - 獲取內容和屬性
2023-12-18
jQuery
python tkinter如何獲取label內容？
2021-09-11
Python
C++--Win32--列表編輯--獲取列表內容--獲取列表行數--修改列表內容
2020-10-12
C++Win32
php一句話獲取獲取檔案目錄的方法
2019-05-11
PHP
Javascript獲取原型的四種方法
2019-01-21
JavaScript原型
獲取 Class 物件的 3 種方法
2024-03-23
物件
PHP 獲取檔案副檔名的常用方法小結【五種方式】
2019-04-15
PHP
網站主網頁修改，如何更新網站主頁內容
2024-12-06
網站網頁
Flutter冷知識 | 獲取dart的print內容
2020-07-10
FlutterDart
JavaScript 獲取td單元格內容
2018-11-23
JavaScript

php獲取網頁內容的三種方法

相關文章