php建立curl請求的基本步驟:
1.初始化。
2.設定選項,設定URL。
3.執行curl得到結果。
4.釋放curl控制程式碼。
例如
<?php //初始化 $ch = curl_init(); //設定選項 設定url curl_setopt($ch,CURLOPT_URL,'http://www.baidu.com'); //將curl_exec() 獲取的資訊以檔案流的形式返回 而不是輸出 curl_setopt($ch,CURLOPT_RETURNTRANSFER,1); //啟用是會將標頭檔案的資訊作為資料量輸出 curl_setopt($ch,CURLOPT_HEADER,1); //執行並獲取HTML 內容 $output = curl_exec($ch); //釋放curl控制程式碼 curl_close($ch); echo $output; ?>
執行結果就是開啟了使用 curl 獲取了 百度的首頁html 然後 輸出
第二步是最終要的也就是curl_setopt() 這個函式,所有對curl的設定都在這裡,通過它可以指定url請求的各個細節。
PHP中CURL方法curl_setopt()函式的一些引數 .
bool curl_setopt (int ch, string option, mixed value)
curl_setopt()函式將為一個CURL會話設定選項。option引數是你想要的設定,value是這個選項給定的值。
下列選項的值將被作為長整形使用(在option引數中指定):
• CURLOPT_INFILESIZE : 當你上傳一個檔案到遠端站點,這個選項告訴PHP你上傳檔案的大小。
• CURLOPT_VERBOSE : 如果你想CURL報告每一件意外的事情,設定這個選項為一個非零值。
• CURLOPT_HEADER : 如果你想把一個頭包含在輸出中,設定這個選項為一個非零值。
• CURLOPT_NOPROGRESS: 如果你不會PHP為CURL傳輸顯示一個程式條,設定這個選項為一個非零值。注意:PHP自動設定這個選項為非零值,你應該僅僅為了除錯的目的來改變這個選項。
• CURLOPT_NOBODY : 如果你不想在輸出中包含body部分,設定這個選項為一個非零值。
• CURLOPT_FAILONERROR : 如果你想讓PHP在發生錯誤(HTTP程式碼返回大於等於300)時,不顯示,設定這個選項為一人非零值。預設行為是返回一個正常頁,忽略程式碼。
• CURLOPT_UPLOAD: 如果你想讓PHP為上傳做準備,設定這個選項為一個非零值。
• CURLOPT_POST : 如果你想PHP去做一個正規的HTTP POST,設定這個選項為一個非零值。這個POST是普通的 application/x-www-from-urlencoded 型別,多數被HTML表單使用。
• CURLOPT_FTPLISTONLY : 設定這個選項為非零值,PHP將列出FTP的目錄名列表。
• CURLOPT_FTPAPPEND : 設定這個選項為一個非零值,PHP將應用遠端檔案代替覆蓋它。
• CURLOPT_NETRC : 設定這個選項為一個非零值,PHP將在你的 ~./netrc 檔案中查詢你要建立連線的遠端站點的使用者名稱及密碼。
• CURLOPT_FOLLOWLOCATION : 設定這個選項為一個非零值(象 “Location: “)的頭,伺服器會把它當做HTTP頭的一部分傳送(注意這是遞迴的,PHP將傳送形如 “Location: “的頭)。
• CURLOPT_PUT : 設定這個選項為一個非零值去用HTTP上傳一個檔案。要上傳這個檔案必須設定CURLOPT_INFILE和CURLOPT_INFILESIZE選項.
• CURLOPT_MUTE : 設定這個選項為一個非零值,PHP對於CURL函式將完全沉默。
• CURLOPT_TIMEOUT : 設定一個長整形數,作為最大延續多少秒。
• CURLOPT_LOW_SPEED_LIMIT: 設定一個長整形數,控制傳送多少位元組。
• CURLOPT_LOW_SPEED_TIME : 設定一個長整形數,控制多少秒傳送CURLOPT_LOW_SPEED_LIMIT規定的位元組數。
• CURLOPT_RESUME_FROM : 傳遞一個包含位元組偏移地址的長整形引數,(你想轉移到的開始表單)。
• CURLOPT_SSLVERSION: 傳遞一個包含SSL版本的長引數。預設PHP將被它自己努力的確定,在更多的安全中你必須手工設定。
• CURLOPT_TIMECONDITION : 傳遞一個長引數,指定怎麼處理CURLOPT_TIMEVALUE引數。你可以設定這個引數為TIMECOND_IFMODSINCE 或 TIMECOND_ISUNMODSINCE。這僅用於HTTP。
• CURLOPT_TIMEVALUE : 傳遞一個從1970-1-1開始到現在的秒數。這個時間將被CURLOPT_TIMEVALUE選項作為指定值使用,或被預設TIMECOND_IFMODSINCE使用。
下列選項的值將被作為字串:
• CURLOPT_URL: 這是你想用PHP取回的URL地址。你也可以在用curl_init()函式初始化時設定這個選項。
• CURLOPT_USERPWD : 傳遞一個形如[username]:[password]風格的字串,作用PHP去連線。
• CURLOPT_PROXYUSERPWD : 傳遞一個形如[username]:[password] 格式的字串去連線HTTP代理。
• CURLOPT_RANGE : 傳遞一個你想指定的範圍。它應該是”X-Y”格式,X或Y是被除外的。HTTP傳送同樣支援幾個間隔,用逗句來分隔(X-Y,N-M)。
• CURLOPT_POSTFIELDS : 傳遞一個作為HTTP “POST”操作的所有資料的字串。
• CURLOPT_REFERER: 在HTTP請求中包含一個”referer”頭的字串。
• CURLOPT_USERAGENT : 在HTTP請求中包含一個”user-agent”頭的字串。
• CURLOPT_FTPPORT: 傳遞一個包含被ftp “POST”指令使用的IP地址。這個POST指令告訴遠端伺服器去連線我們指定的IP地址。這個字串可以是一個IP地址,一個主機名,一個網路介面名(在UNIX下),或是‘-'(使用系統預設IP地址)。
• CURLOPT_COOKIE : 傳遞一個包含HTTP cookie的頭連線。
• CURLOPT_SSLCERT : 傳遞一個包含PEM格式證照的字串。
• CURLOPT_SSLCERTPASSWD : 傳遞一個包含使用CURLOPT_SSLCERT證照必需的密碼。
• CURLOPT_COOKIEFILE : 傳遞一個包含cookie資料的檔案的名字的字串。這個cookie檔案可以是Netscape格式,或是堆存在檔案中的HTTP風格的頭。
• CURLOPT_CUSTOMREQUEST : 當進行HTTP請求時,傳遞一個字元被GET或HEAD使用。為進行DELETE或其它操作是有益的,更Pass a string to be used instead of GET or HEAD when doing an HTTP request. This is useful for doing or another, more obscure, HTTP request. 注意: 在確認你的伺服器支援命令先不要去這樣做。下列的選項要求一個檔案描述(通過使用fopen()函式獲得):
• CURLOPT_FILE: 這個檔案將是你放置傳送的輸出檔案,預設是STDOUT.
• CURLOPT_INFILE : 這個檔案是你傳送過來的輸入檔案。
• CURLOPT_WRITEHEADER : 這個檔案寫有你輸出的頭部分。
• CURLOPT_STDERR : 這個檔案寫有錯誤而不是stderr。用來獲取需要登入的頁面的例子,當前做法是每次或許都登入一次,有需要的人再做改進了.
檢查curl的錯誤和獲取還回資訊
新增一段檢查錯誤的語句
$output = curl_exec($ch); /* 在判斷是否是 錯誤時用 === 全等於判斷。因為有時候可能得到是一個一個空值 */ if($output === FALSE){ echo 'curl Error:'.curl_error($ch); }
也可以使用curl_getinfo()函式返回curl執行後這一請求相關的資訊,這些資訊對除錯很有作用。
程式碼:
curl_exec($ch); $info = curl_getinfo($ch); echo '獲取'.$info['url'].'耗時'.$info['total_time'].'秒';
返回的陣列元素列表:
[url] => http://www.baidu.com/ //資源網路地址
[content_type] => text/html // 內容編碼
[http_code] => 200 //http 狀態碼
[header_size] => 750 //header 大小
[request_size] => 52 //請求大小
[filetime] => -1 //檔案建立時間
[ssl_verify_result] => 0 //ssl 驗證結果
[redirect_count] => 0 //跳轉次數
[total_time] => 0.053938 //耗時
[namelookup_time] => 0.030599 //dns 查詢時間
[connect_time] => 0.039183 //連線時間
[pretransfer_time] => 0.039279 //準備傳輸耗時
[size_upload] => 0 //上傳資料大小
[size_download] => 14613 //下載資料大小
[speed_download] => 270922 //下載數度
[speed_upload] => 0 //下載數度
[download_content_length] => 14613 //下載內容長度
[upload_content_length] => 0 //上傳資料長度
[starttransfer_time] => 0.044657 //開始傳輸耗時
[redirect_time] => 0 //重定向耗時
[redirect_url] => //重定向地址
[primary_ip] => 220.181.111.188 //目標端ip
[certinfo] => Array() //認證資訊
[primary_port] => 80 //埠
[local_ip] => 192.168.199.115 //本地ip
[local_port] => 50450 //本地埠
案例1抓取圖片:
<?php @header('Content-type:image/png'); //初始化 $ch = curl_init(); //設定選項 curl_setopt($ch,CURLOPT_URL,'http://www.php.cn/tpl/Index/Static/css/img/common/logo.png'); curl_setopt($ch,CURLOPT_RETURNTRANSFER,1); curl_setopt($ch,CURLOPT_HEADER,0); $output = curl_exec($ch); $info = curl_getinfo($ch); curl_close($ch); file_put_contents('./a.png',$output); $size = filesize('./a.png'); if($size != $info['size_download']){ echo "下載資料不完整"; }else{ echo "下載資料完整"; } ?>
檢視當前目錄下是否有a.png圖片
案例2偽造資訊頭:
每個http請求都包含資訊頭,它是伺服器和客戶端的身份證明和交流方式。現在通過curl 模擬手機登陸3g.qq.com
首先在PC端訪問3g.qq.com,會制動轉跳到3gqq.com,這就是騰訊識別到我們的資訊頭來自PC端瀏覽器。
想要實現手機訪問效果就要用curl 模擬手機UA訪問它
<?php
@header('Content-type;text/html;charset=utf-8');
$ch=curl_init();
curl_setopt($ch,CURLOPT_URL,'http://3g.qq.com');
curl_setopt($ch,CURLOPT_RETURNTRANSFER,1);
$sh=[
'HTTP_VIA:HTTP/1.1 SNXA-PX-WAP-GW21 (infoX-WISG,Huawei Technologies)',
'HTTP_ACCEPT:application/vnd.wap.wmlscriptc,text/vnd.wap.wml,application.vnd.wap.xhtml+xml,application/xhtml+xml,text/html,multipart/mixed,*/*',
'HTTP_ACCEPT_CHARSET:ISO-8859-1,US-ASCII,UTF-8;Q=0.8,ISO-8859-15;Q=0.8,ISO-10646-UCS-2;Q=0.6,UTF-16;Q=0.6'
];
curl_setopt($ch,CURLOPT_HTTPHEADER,$sh);
$output=curl_exec($ch);
curl_close($sh);
//第二次跳轉
$ch = curl_init();
curl_setopt($ch,CURLOPT_URL,'http://info.3g.qq.com/g/s?aid=index&g_f=1283&i_f=1335&&&i_f=1335&_qweti=q_1480587101703');
curl_setopt($ch,CURLOPT_RETURNTRANSFER,1);
curl_setopt($ch,CURLOPT_HTTPHEADER,$sh);
$output=curl_exec($ch);
curl_close($ch);
echo $output
?>
執行結果:
案例3使用curl傳送post資料:
GET方式傳送資料只需要在url後面新增引數就可以了。POST方式傳送需要通過HTTP請求體傳送。
1.建立一個接收端 用來接收 POST 資料。
<?php
print_r($_POST);
?>
2.寫一個通過curl傳送POST資料的頁面
<?php $url='http://admin.com/getPost.php'; $data=[ 'id'=>'1', 'name'=>'heheda', 'age'=>'26' ]; $ch=curl_init(); curl_setopt($ch,CURLOPT_URL,$url); curl_setopt($ch,CURLOPT_RETURNTRANSFER,1); //設定為post curl_setopt($ch,CURLOPT_POST,1); //設定post 傳遞的資料 curl_setopt($ch,CURLOPT_POSTFIELDS,$data); $output = curl_exec($ch); curl_close($ch); print_r($output); ?>
執行結果:
案例4使用curl上傳檔案:
上傳檔案和 POST提交資料差不多。
1.建立一個接收端用來接收檔案
<?php
print_r($_FILES);
?>
2.curl 上傳指令碼
<?php //設定上傳路徑 $url = 'http://admin.com/upload.php'; $ch = curl_init(); //判斷php版本 if (class_exists('CURLFile')) { //>= 5.5.0 $data = [ "foo" => "bar", "upload" => new CURLFile('./1.png', 'image/png', 'testpic') ]; } else { $data = [ "foo" => "bar", "upload" => "@/mnt/hgfs/F/web/newomcat/admin/l.png" ]; } curl_setopt($ch, CURLOPT_URL, $url); curl_setopt($ch, CURLOPT_RETURNTRANSFER, 1); curl_setopt($ch, CURLOPT_POST, 1); curl_setopt($ch, CURLOPT_POSTFIELDS, $data); $output = curl_exec($ch); //檢查錯誤 if ($output === false) { echo curl_error($ch); } curl_close($ch); echo $output; ?>
執行結果:
案例5使用curl批處理:
curl有一個高階特性--批處理控制程式碼(handle)。這個特性可以同時或者非同步的開啟多個curl連線。
<?php
//建立兩個curl
$ch1 = curl_init();
$ch2 = curl_init();
//指定url和引數
curl_setopt($ch1,CURLOPT_URL,'http://www.baidu.com');
curl_setopt($ch1,CURLOPT_RETURNTRANSFER,1);
curl_setopt($ch2,CURLOPT_URL,'http://news.baidu.com/');
curl_setopt($ch2,CURLOPT_RETURNTRANSFER,1);
//建立curl批處理控制程式碼
$mh=curl_multi_init();
//加上前面兩個資源控制程式碼
curl_multi_add_handle($mh,$ch1);
curl_multi_add_handle($mh,$ch2);
//預定義一個狀態變數
$active=null;
//執行批處理
do{
$mrc=curl_multi_exec($mh,$active);
usleep(10000);
}while($active>0);
$res[1]=curl_multi_getcontent($ch1);
$res[2]=curl_multi_getcontent($ch2);
//關閉各個病句
curl_multi_remove_handle($mh,$ch1);
curl_multi_remove_handle($mh,$ch2);
curl_multi_close($mh);
print_r($res);
?>
結果就是同時讀取到了百度首頁和百度新聞首頁!