file_get_contents與curl效率及穩定性問題

xuebingnan發表於2010-09-03

做過好多抓取別家網站內容的產品，習慣了使用方便快捷的file_get_contents函式，但是總是會遇到獲取失敗的問題，儘管按照手冊中的例子設定了超時，可多數時候不會奏效：

$config['context'] = stream_context_create(array(‘http’ => array(‘method’ => “GET”,
   ’timeout’ => 5//這個超時時間不穩定，經常不奏效
   )
  ));

這時候，看一下伺服器的連線池，會發現一堆類似的錯誤，讓你頭疼萬分：

file_get_contents(http://***): failed to open stream…

不得已，安裝了curl庫，寫了一個函式替換：

function curl_file_get_contents($durl){
   $ch = curl_init();
   curl_setopt($ch, CURLOPT_URL, $durl);
   curl_setopt($ch, CURLOPT_TIMEOUT, 5);
   curl_setopt($ch, CURLOPT_USERAGENT, _USERAGENT_);
   curl_setopt($ch, CURLOPT_REFERER,_REFERER_);
   curl_setopt($ch, CURLOPT_RETURNTRANSFER, 1);
   $r = curl_exec($ch);
   curl_close($ch);
   return $r;
 }

如此，除了真正的網路問題外，沒再出現任何問題。

這是別人做過的關於curl和file_get_contents的測試：

file_get_contents抓取google.com需用秒數：

2.31319094
2.30374217
2.21512604
3.30553889
2.30124092

curl使用的時間：

0.68719101
0.64675593
0.64326
0.81983113
0.63956594

差距很大吧？呵呵，從我使用的經驗來說，這兩個工具不只是速度有差異，穩定性也相差很大。建議對網路資料抓取穩定性要求比較高的朋友使用上面的curl_file_get_contents函式，不但穩定速度快，還能假冒瀏覽器欺騙目標地址哦！

測評file_get_contents與curl 效率及穩定性
2014-04-16
開發效率與系統穩定性雜談
2011-12-20
file_get_contents與curl的比較
2011-10-10
PHP file_get_contents 與 curl 效能比較
2019-06-21
PHP
curl, fsockopen ,file_get_contents
2013-05-09
穩定性
2024-11-12
內部排序分類及穩定性
2017-08-26
排序
淺談系統的不確定性與穩定性
2024-07-18
研發效能與穩定性保障
2024-05-06
iOS App 穩定性指標及監測
2017-07-26
iOSAPP指標
排序穩定性
2012-05-02
排序
【穩定性】穩定性建設之依賴設計
2024-03-21
架構-穩定性建設邏輯問題實戰總結
2020-09-08
架構
Kafka 的穩定性
2022-06-13
Kafka
GaussDB(for Redis)穩定性與擴容表現
2022-02-28
Redis
【穩定性】從專案風險管理角度探討系統穩定性
2024-03-22
App穩定性測試
2020-08-15
APP
SAP QM 穩定性研究功能研習系列1 - 穩定性研究總流程
2021-06-30
BGP專線如何提高網路安全與穩定性?
2023-03-29
kafka-穩定性-事務
2020-11-14
Kafka
Kubernetes 穩定性保障手冊 -- 日誌專題
2021-03-02
curl不能支援https問題
2018-09-11
HTTP
Node.js 指南（ABI穩定性）
2019-02-16
Node.js
app穩定性測試-iOS篇
2023-04-06
APPiOS
高通Vuforia優化目標檢測與跟蹤穩定性
2017-09-18
優化
區塊鏈的確定性問題
2018-10-10
區塊鏈
思考：如何保證服務穩定性？
2020-06-23
智慧支付穩定性測試實戰
2018-12-14
伺服器穩定性測試方法
2022-09-20
伺服器
伺服器如何測試穩定性
2022-02-25
伺服器
神經網路穩定性分析
2017-09-17
神經網路
ORALCE的執行計劃穩定性
2011-03-18
curl的速度為什麼比file_get_contents快以及具體原因
2018-11-07
Oracle rownum 分頁引起的效率問題及優化思路
2014-12-19
Oracle優化
影響資料庫效能與穩定性的幾個重要引數
2017-04-17
資料庫
如何維持網站穩定性的方式？
2020-06-17
網站
FastHook——遠超YAHFA的優異穩定性
2019-03-22
ASTHook
下單穩定性治理｜得物技術
2023-04-27

file_get_contents與curl效率及穩定性問題

相關文章