特別提示:如果採集不到內容的,檢查正則!這裡給大家提供一個正則測試工具:http://www.jb51.net/tools/zhengze.html
如果測試確實是正則沒問題,還是空白,把Runtime/刪除掉,再採集!歡迎提BUG!
==============================================
=================[2014-10-7 更新]==================
==============================================
這次更新主要增加入庫選擇分類,可以直接把內容入庫到相應的分類下!
注意:需要在Admin\Controller\AddonsController.class.php的第322行新增如下倆行程式碼!
$cate = M('Category')->where(array('status' => 1))->field('id,title,pid,model,allow_publish')->order('pid,sort')->select(); $this->assign('cate',$cate);∧∧∧∧∧∧∧∧∧∧∧∧∧∧∧∧∧∧∧∧∧∧∧∧∧∧∧∧∧∧∧∧∧∧∧∧∧∧∧∧∧∧∧∧∧∧∧∧∧∧∧∧∧∧∧∧∧∧∧∧∧
如果不新增如上程式碼,入庫按鈕沒有下拉選單!
[2014-10-7 下載]:
OTcaiji.rar(14.48KB, 下載次數: 763)
============================================
同步更新地址:http://www.liuyingwei.cn/index.php?s=/Home/Article/detail/id/5.html
=============================================
OTcaiji.rar(13KB, 下載次數: 204)
/*************************************************/
本次更新:
1、修改執行模式為每次執行一個網址,的一個頁面後做記錄停止執行,下次任務從這次任務點開始執行!避免任務過多搞死瀏覽器
2、修改file_get_contents模式為curl模式,防止某些環境不支援file_get_contents而採集不到資料
3、增加自動判斷採集得到地址是否包含主域名,不存在自動新增,防止採集不到完整地址
4、採集配置中增加來源地址,來源網址
/**************************************************/
OTcaiji.rar(13.94KB, 下載次數: 81)
/*************************************************/
本次更新:
1、修正來源網站名稱和網址錯誤問題
2、修正刪除資料BUG
/**************************************************/
(最新版本下[2014-9-9 更新]:)
OTcaiji.zip(15.06KB, 下載次數: 280)
PS:其實這個採集是有計劃任務的,就是可以自動執行採集,不用人為去採集的。不知道你們用了沒有?
回覆
好東西~
評論
怎麼安裝呀, 哪裡有詳細 說明 。
評論
試用一下
評論
提前預覽一下模板線上編輯外掛~~~~~~~~哈哈!!
測試版本出來了,下載地址:http://www.topthink.com/topic/3483.html
評論
記得用js把外圍上面的去除掉,又用不到搜尋。。
評論
目標網址配置格式:
第一個@後面是採集地址@來源網站名稱@來源網址{@第一頁修正標識}PS:修正標識可沒有,根據情況自己決定
評論
我在使用時,出現下面錯誤,Fatal error: Allowed memory size of 134217728 bytes exhausted (tried to allocate 16384 bytes) in C:\xampp\htdocs\onethink\ThinkPHP\Library\Think\Think.class.php on line 331,是怎麼回事?
評論
列表規則,標題規則,終端規則 這三個規則的作用是啥?可以不填麼? 為啥我採集不到資訊 關鍵詞我填的是 “網路|創業|溝通|投資”目標地址我填寫的是 “http://www.36kr.com/” 後面三個沒填 如果必須填寫 給我一個例子吧
評論
目標網址配置格式:
第一個@後面是採集地址PS:{$page}分頁@來源網站名稱@來源網址{@第一頁修正標識(即:如果分頁的第一頁不是數字‘1’而是‘index’那麼這裡就需要配置@index,如果是正常‘1’那就不需配置)}PS:修正標識可沒有,根據情況自己決定對應起來是這樣:
1@http://php100.com/html/it/mobile/{$page}.html@PHP100@http://www.php100.com/@index
第一個@前面的數字為要採集網站的標號。如果有第二條,第三條就是:同理下面的幾個規則也是這樣的寫法,上面有幾個網址下面就寫幾個正則:第一個@前面的數字要與上面的網址一一對應
2@http://xxx.com/html/it/mobile/{$page}.html@xxx@http://www.xxx.com/@index
3@http://sss.com/html/it/mobile/{$page}.html@ssss@http://www.ssss.com/
@閃閃的石頭
評論
怎麼點採集時空白