PHP 資料採集的一種思路

右耳聆聽心的聲音發表於2019-01-04

今天老大讓我抓取某個網頁的資料,最開始我就想到了querylist,但是不管怎麼獲取資料都沒有成功,最後在網上了解到queryList無法爬取table


想了很久,最後想到了一個辦法
先用file_get_contents獲取當前介面的html程式碼,然後用自己寫的去html程式碼空的函式,trimall

function trimall($str){
    $qian=array(" "," ","\t","\n","\r");
    return str_replace($qian, '', $str);  
}

如果需要處理亂碼,用iconv函式

最後用strip_tags去除所有Html程式碼

根據需求匹配自己需要的資料

主要解決的問題是:php抓取介面顯示的內容

本作品採用《CC 協議》,轉載必須註明作者和本文連結

相關文章