今天老大讓我抓取某個網頁的資料,最開始我就想到了querylist,但是不管怎麼獲取資料都沒有成功,最後在網上了解到queryList無法爬取table
想了很久,最後想到了一個辦法
先用file_get_contents獲取當前介面的html程式碼,然後用自己寫的去html程式碼空的函式,trimall
function trimall($str){
$qian=array(" "," ","\t","\n","\r");
return str_replace($qian, '', $str);
}
如果需要處理亂碼,用iconv函式
最後用strip_tags去除所有Html程式碼
根據需求匹配自己需要的資料
主要解決的問題是:php抓取介面顯示的內容
本作品採用《CC 協議》,轉載必須註明作者和本文連結