我自己開發的工具,列印出百度貼吧某使用者發表過的所有帖子
程式碼如下:
<html> <meta charset="UTF-8"/> <style> a { color: green; font-family: arial; font-weight: bold } </style> <body> <div id="container"></div> </body> <script src="jquery1.7.1.js"> /* Jerry 2017-02-06 14:58PM update should use C:\MyApp\Chrome\Application\chrome.exe --user-data-dir="C:/yaas" --disable-web-security and then FIRST LOG ON BAIDU successfully!!!! */ </script> <script> /* Jerry 2017-02-05 5:54PM 這個警告的意思是說:請求的資源可能會被(擴充套件/或其他什麼機制)遮蔽掉。 之所以會出現這個警告,是因為去獲取該資源的請求其實並(還)沒有真的發生,所以 Header 裡顯示的是偽資訊,直到伺服器真的有響應返回,這裡的 Header 資訊才會被更新為真實的。不過這一切也可能不會發生,因為該請求可能會被遮蔽。比如說 AdBlock 什麼的,當然了不全是瀏覽器擴充套件,具體情況具體分析了。 對了,別忘了用 chrome://net-internals 來幫助你查詢被遮蔽的請求以及可能的原因。 */ var PREFIX = " var START = " //var START = " var POST = {}; var TOTAL = 0; var SORTED = []; function getTotalCount(collection){ var count = 0; for( bar in collection){ if( !collection.hasOwnProperty(bar)) continue; var postList = collection[bar]; count += postList.length; } return count; } function shouldEnd(previousCount) { TOTAL = getTotalCount(POST); console.log("pre: " + previousCount + " total: " + TOTAL); return ( previousCount == TOTAL ); } function main() { var html = getPostByAJAX(START); handleLiChildren(html); var page = 2; while(1){ var prevCount = getTotalCount(POST); var task = START + "?&pn=" + page; var html = getPostByAJAX(task); handleLiChildren(html); page++; /* if( page >=2 ) break;*/ if( shouldEnd(prevCount) ) break; } sort(); generate(); } function handleLiChildren(resultString){ var htmlDom = $(resultString); var liChildren = $("li", htmlDom); $.each( liChildren, function(i, value) { // if( value.className.indexOf("nav_item") != -1 ) if( value.className) return true; if( value.innerText == "我回復的" || value.innerText == "我的精品") return true; var detail = parseDetail(value); insertPost(detail); }); } /* <ul> <li> <cite>2016</cite> <a href="/f?kw=%E5%A4%A7%E9%82%91" >尿素氮</a> </li> <li> <cite>2015</cite> <a href="/f?kw=%E5%A4%A7%E9%82%91" >尿素氮2</a> </li> </ul> */ function getpostSource(post) { var source = "<li><cite>"; source += post.date + "/<cite>"; source += '<a href="' + post.url + '">' + post.postTitle + "</a></li>"; return source; } function getBarPostsSource(barName, posts) { var source = '<h1>' + barName + ': ' + posts.length + '個</h1>'; source += "<ul>"; for( var i = 0; i < posts.length; i++){ var post = posts[i]; source += getpostSource(post); } source += "</ul>"; return source; } function sortNumber(a,b){ return b.size - a.size; } function sort() { for( barName in POST) { if( !POST.hasOwnProperty(barName)) continue; var post = { name: barName, size: POST[barName].length }; SORTED.push(post); } SORTED.sort(sortNumber); } function generate(){ var div = document.getElementById("container"); var source = "總共帖子: " + TOTAL + "個"; for( var i = 0; i < SORTED.length; i++){ var posts = POST[SORTED[i].name]; source += getBarPostsSource(SORTED[i].name, posts); } div.innerHTML = source; } $(function(){ main(); }); function getPostByAJAX(requestURL){ var html = $.ajax({ url: requestURL, xhrFields: { // The 'xhrFields' property sets additional fields on the XMLHttpRequest. // This can be used to set the 'withCredentials' property. // Set the value to 'true' if you'd like to pass cookies to the server. // If this is enabled, your server must respond with the header // 'Access-Control-Allow-Credentials: true'. withCredentials: true }, async: false}).responseText; debugger; return html; } /* function getPostByAJAX(requestURL){ var settings = { type: "GET", crossOrigin: true, url:requestURL, error: function(XHR,textStatus,errorThrown) { alert ("XHR="+XHR+"\ntextStatus="+textStatus+"\nerrorThrown=" + errorThrown); }, success: function(data,textStatus) { debugger; }, headers: { "Access-Control-Allow-Origin":" "Access-Control-Allow-Headers":"X-Requested-With" } }; $.ajax(settings); } */ /* function getPostByAJAX(requestURL){ var html = $.ajax({ url: requestURL, dataType:"jsonp", xhrFields: { // The 'xhrFields' property sets additional fields on the XMLHttpRequest. // This can be used to set the 'withCredentials' property. // Set the value to 'true' if you'd like to pass cookies to the server. // If this is enabled, your server must respond with the header // 'Access-Control-Allow-Credentials: true'. withCredentials: true }, async: false}).responseText; return html; } */ function insertPost(postDetail){ if( !POST[postDetail.barName]){ POST[postDetail.barName] = []; } POST[postDetail.barName].push(postDetail); } function parseDetail(liNode) { var cite = $("cite", liNode); var date = cite[0].innerHTML; // value1 var tds = $("td", liNode); var a1 = $("a", tds[0]); var barName = a1[0].innerHTML; // value2 var a2 = $("a", tds[1]); var postTitle = a2[0].innerHTML; // value3 var url = PREFIX + a2.attr("href"); return { date: date, barName: barName, postTitle: postTitle, url: url } } function getTestData(){ return '<!DOCTYPE html><html><body><div class="wrap1"><div class="wrap2"><div ' + ' id="main_wrapper" class="main_wrapper"><div id="main_back_img"><div ' + ' id="main_back_bottom"><div id="container" class="ibody clearfix"><div><div ' + ' id="content"><div class="simple_block_container"><ul><li><cite>2-16</cite>' + '<div class="wrap_container"><table><tr><td class="nowrap">在<a style="" ' + ' href="/f?kw=%E5%A4%A7%E9%82%91" target="_blank">ANDROID吧</a> 發貼</td><td class="wrap">' + '<a href="/p/4356641476?pid=84106363194&cid=0#841063631" class="thread_title" target="_blank">硬碟</a></td>' + '</tr></table></div><div class="clear"></div></li>' + '<li></li><li></li></ul></div></div></div></div></div></div></div></div></body></html>'; } </script> </html>
來自 “ ITPUB部落格 ” ,連結:http://blog.itpub.net/24475491/viewspace-2674145/,如需轉載,請註明出處,否則將追究法律責任。
相關文章
- 怎麼刪除某個使用者的所有帖子?
- 百度貼吧怎麼儲存看過的影片?百度貼吧儲存影片的方法
- 「用愛發電」的百度貼吧遊戲吧主遊戲
- 百度貼吧怎麼儲存看過的視訊?百度貼吧儲存視訊的方法
- 解釋--貼吧微博帖子IP地址及發帖人資訊如何查到!
- 開發者吐槽貼吧:吸走了你的使用者,還想再賣你一次?
- 如何用node開發自己的cli工具
- Oracle統計某個使用者下所有表的各自行數Oracle
- 開發自己的工具庫(一):專案搭建
- 這是我自己的發明
- 如何發表自己的觀點
- 請恢復我的帖子
- 燃燒吧!我的併發之魂–synchronizedsynchronized
- 燃燒吧!我的併發之魂--synchronizedsynchronized
- 列印出ckpt裡的所有變數和值變數
- 說說我們的用的Scrum敏捷開發工具Scrum敏捷
- 那年追過的開發者測試工具
- 5個不容錯過的高效開發工具
- XSHELL如何連線自己的百度雲虛擬機器--(自己的經驗貼)虛擬機
- 酷!一鍵構建我自己的PHP框架的開發環境PHP框架開發環境
- 自己開發的一個SAP CRM訂單統計工具
- 2020:我給自己列的書單
- 小程式開發,那些我們跳過的坑
- 用go設計開發一個自己的輕量級登入庫/框架吧Go框架
- SpringBoot開發自己的@Enable功能Spring Boot
- 2019年不可錯過的開發工具 Top 20
- 怎麼查到匿名帖子發帖使用者的IP真實具體地址!
- 用 Plumbum 開發 Python 命令列工具Python命令列
- 開發者工具:我是如何從0到1來進行APP開發的?APP
- 為什麼明明是發自己的部落格,阿里卻刪除我發部的開源作品?阿里
- 如何自己開發一個腳手架工具
- 如何查詢某個資料表中除某個欄位的所有資訊???
- 這四款好用的前端開發工具,不要錯過!前端
- 開發一個簡單的工具,匯出github倉庫所有issue列表Github
- 開發自己的前端工具庫(二):函數語言程式設計前端函數程式設計
- 在自己的 app 中使用 Sarfari 開發工具除錯 Web 頁面APP除錯Web
- Box —— 我的開發助手
- 百度貼吧賬號小號高等級高吧齡價美物廉