為什麼標題後面我加了一個可能性,因為這個我計劃過,還沒去真的實施,寫用技術掙錢系列文章,還是按照以前的規矩,我實際做過和沒做過的要分開說,以免誤導。
稍加回顧下,我寫的一系列用爬蟲技術掙錢的文章,思路都是走的結構化資料這條路,整合結構化的資料後,做成網站或工具,獲得流量掙廣告費用或增值服務。走這條思路原因一是因為這條思路我想得比較通透,二是很省事(時),做起來後不需要每天花大把時間運營維護,他就能每月固定帶來收入(獲得收入的內在邏輯在這篇《掙錢系列-寫獨立技術部落格掙被動收入》,不再闡述),這可能是技術人較為理想的一種做被動收入的方法。
之前在《把猿人學商標註冊下來了》說過國內總的有效商標總數幾千萬件,每季度都會新增申請100多萬件商標。這表示商標資料量足夠多,這是結構化資料的基礎。每天查詢商標資訊的搜尋流量也非常大。
如果能把商標資料從商標網站上結構化下來,做成一個商標查詢網站,同時把幾千萬個商標做成一個個長尾網頁,並且按各種條件查詢維度再新增數十萬,乃至百萬張tag類網頁(這樣做的內在邏輯在這篇《掙錢系列-獨立部落格如何運營流量》以及文章裡的相關閱讀,這裡不再闡述)。每天做出幾萬跟商標相關的流量,這個可能性還是非常大的。
但是類似商標查詢網站市面上其實也挺多的了,又怎麼能夠從中獲得你那一份流量?
市面上類似的商標查詢網站我之前分析過,大同小異,都提供一個商標搜尋功能(可以按條件篩選商標)。
他們都或多或少有缺陷,比如:
有的商標查詢網站,當你點選查詢時,必須先填寫你的手機號碼
有的點查詢時,必須要先註冊
新的商標資訊更新不及時(這個很多都存在這個問題)
網站結構不好(沒有各條件維度組合的tag頁面)
第3和第4項我認為是一個機會點,尤其是第4個,如果要做搜尋流量,這是很重要。
什麼叫沒有各條件維度組合的tag頁面
因為搜尋流量的大頭是長尾搜尋構成,我們在搜尋時,除了會搜尋”商標查詢”,”商標註冊”這些大詞,更多的會搜尋”xxx公司的商標”,”xxx人的商標”等等,把這類搜尋詞都做成一張張網頁,那也是數以百萬計的頁面,而且也是滿足使用者真實搜尋意圖的。
如果只是想掙一些被動收入,這個網站其實不需要做很大流量,按照我們之前做泛流量掙百度網盟收入來看,因為商標相關的廣告單價很高(普通廣告單價的2-3倍),一個2-3W IP流量商標網站的百度網盟月收入在1.2W-2W左右。而且商標相關的商業價值較大,提供增值服務或向商標中介倒流獲得的收入可能會更大。
這個技術難度不大,網站頁面不需要很花哨,從之前的經驗來看,使用網站模板就可以搞定。要花點功夫的是抓取並結構化千萬計的商標資料,並且保持更新。
文章省略了這類網站掙流量的內在邏輯,你可以從我之前的文章中獲悉。
另外給爬蟲再正名一下,不是寫爬蟲抓資料就是違法,不是的。違法的是你在業務端上做了違法的事情,比如濫用資料,比如把公民資訊資料提供給催收公司,提供給各種電話營銷公司;比如把有版權保護的資料抓下來,用於自己的商業行為。
另外也跟郭嘉的整治方向有關,我們近期看到的都跟P兩P有關,P兩P背後的公民資訊濫用很嚴重,大家經常調侃,我們都是在網上”裸奔”,對公民資訊的保護是個大環境。為什麼最近又看到一個提供信用徵信的公司也在被查處呢?有的寫文章又想把它歸罪為爬蟲之禍,認為是爬蟲亂抓資料,這是不對的。是因為使用這類公民徵信服務的大頭都是P兩P公司。
爬蟲不都是用來抓灰色邊沿地帶資料的。實際上以通過爬蟲技術結構化資料提供服務這種形式做起來好些正規的大型網際網路公司。典型的比如“去哪兒網”,抓取結構化各航空公司機票資料,讓使用者很方便的比較/查詢各時間段合適的機票。比如電商比價網站,方便使用者知道每個網站相同商品的價格差異。這些都是正規的,很利於使用者的事情。
OK,聊完了,對爬蟲有興趣的,或對結構化資料有興趣的,歡迎加我私人微信,我最近打算建一個交流群(還未建),一起交流。請備註”交流”,謝謝。
我的公眾號:猿人學 Python 上會分享更多心得體會,敬請關注。
***版權申明:若沒有特殊說明,文章皆是猿人學 yuanrenxue.com 原創,沒有猿人學授權,請勿以任何形式轉載。***