[外掛擴充套件]OT採集外掛[2014-10-7 更新]

發表於2019-05-11

特別提示:如果採集不到內容的,檢查正則!這裡給大家提供一個正則測試工具:http://www.jb51.net/tools/zhengze.html

如果測試確實是正則沒問題,還是空白,把Runtime/刪除掉,再採集!歡迎提BUG!

==============================================
=================[2014-10-7 更新]==================

==============================================
這次更新主要增加入庫選擇分類,可以直接把內容入庫到相應的分類下!
注意:需要在Admin\Controller\AddonsController.class.php的第322行新增如下倆行程式碼!
$cate = M('Category')->where(array('status' => 1))->field('id,title,pid,model,allow_publish')->order('pid,sort')->select();
 $this->assign('cate',$cate);
∧∧∧∧∧∧∧∧∧∧∧∧∧∧∧∧∧∧∧∧∧∧∧∧∧∧∧∧∧∧∧∧∧∧∧∧∧∧∧∧∧∧∧∧∧∧∧∧∧∧∧∧∧∧∧∧∧∧∧∧∧
如果不新增如上程式碼,入庫按鈕沒有下拉選單!






[2014-10-7 下載]

OTcaiji.rar(14.48KB, 下載次數: 764)


============================================
同步更新地址:http://www.liuyingwei.cn/index.php?s=/Home/Article/detail/id/5.html

=============================================


OTcaiji.rar(13KB, 下載次數: 204)

/*************************************************/
    本次更新:
        1、修改執行模式為每次執行一個網址,的一個頁面後做記錄停止執行,下次任務從這次任務點開始執行!避免任務過多搞死瀏覽器
        2、修改file_get_contents模式為curl模式,防止某些環境不支援file_get_contents而採集不到資料
        3、增加自動判斷採集得到地址是否包含主域名,不存在自動新增,防止採集不到完整地址
        4、採集配置中增加來源地址,來源網址
/**************************************************/

OTcaiji.rar(13.94KB, 下載次數: 81)

/*************************************************/
    本次更新:
        1、修正來源網站名稱和網址錯誤問題
        2、修正刪除資料BUG
/**************************************************/

最新版本下[2014-9-9 更新]
OTcaiji.zip(15.06KB, 下載次數: 281)


PS:其實這個採集是有計劃任務的,就是可以自動執行採集,不用人為去採集的。不知道你們用了沒有?
回覆
好東西~
評論
怎麼安裝呀, 哪裡有詳細 說明 。 
評論
試用一下
評論



提前預覽一下模板線上編輯外掛~~~~~~~~哈哈!!

測試版本出來了,下載地址:http://www.topthink.com/topic/3483.html
評論
記得用js把外圍上面的去除掉,又用不到搜尋。。
評論
目標網址配置格式:
第一個@後面是採集地址@來源網站名稱@來源網址{@第一頁修正標識}PS:修正標識可沒有,根據情況自己決定
評論
我在使用時,出現下面錯誤,Fatal error:  Allowed memory size of 134217728 bytes exhausted (tried to allocate 16384 bytes) in C:\xampp\htdocs\onethink\ThinkPHP\Library\Think\Think.class.php on line 331,是怎麼回事?
評論
列表規則,標題規則,終端規則 這三個規則的作用是啥?可以不填麼? 為啥我採集不到資訊  關鍵詞我填的是 “網路|創業|溝通|投資”目標地址我填寫的是 “http://www.36kr.com/”  後面三個沒填  如果必須填寫 給我一個例子吧  
評論


目標網址配置格式:
第一個@後面是採集地址PS:{$page}分頁@來源網站名稱@來源網址{@第一頁修正標識(即:如果分頁的第一頁不是數字‘1’而是‘index’那麼這裡就需要配置@index,如果是正常‘1’那就不需配置)}PS:修正標識可沒有,根據情況自己決定
對應起來是這樣:
1@http://php100.com/html/it/mobile/{$page}.html@PHP100@http://www.php100.com/@index
第一個@前面的數字為要採集網站的標號。如果有第二條,第三條就是:
2@http://xxx.com/html/it/mobile/{$page}.html@xxx@http://www.xxx.com/@index
3@http://sss.com/html/it/mobile/{$page}.html@ssss@http://www.ssss.com/
同理下面的幾個規則也是這樣的寫法,上面有幾個網址下面就寫幾個正則:第一個@前面的數字要與上面的網址一一對應

@閃閃的石頭
評論
怎麼點採集時空白
評論

相關文章