入口網站分析統計策略?
本入口網站是一個電信級使用者規模的門戶,初期日PV在500萬,以後至少擴充套件在千萬以上。
當前一級門戶正在實現。
硬體規模:
12臺刀片PC(單臺:2CPU/32GB)
2臺HP 資料庫伺服器(單臺:14CPU/28GB)
1臺F5主機
其他
當前有一個需求點是:分析統計網站運營資料,統計範圍包括當前正在搭建的一級門戶,以及已經單獨部署的幾十個二級門戶(省級規模)。
因為最終有較強資料分析功能,包括各種對比,當前擬考慮策略:
分三個部分:
1)資料採集
2)資料倉儲
3)資料顯示
現在的壓力在資料採集(主要是WEB日誌),前期日處理日誌在1G,最終日處理量在30G左右,
現在考慮的方案有兩種,
1)採用Hapdoop+Chukwa這種分散式檔案策略,然後解析資料到資料倉儲中(Oracle資料庫)。
本人傾向於這種方式,但專案時間難以保證。
2)採用piwik(php+mysql執行環境,script插碼),從piwik的資料庫中採集資料。
這種感覺是一種折中,讓piwik採集原始資料。但對piwik的處理能力心中沒底。
其它的策略包括商業化整合,以及Google Analytics這些整合方式因為商業原因排除了。
有請各位大師給些建議呀。謝謝。
當前一級門戶正在實現。
硬體規模:
12臺刀片PC(單臺:2CPU/32GB)
2臺HP 資料庫伺服器(單臺:14CPU/28GB)
1臺F5主機
其他
當前有一個需求點是:分析統計網站運營資料,統計範圍包括當前正在搭建的一級門戶,以及已經單獨部署的幾十個二級門戶(省級規模)。
因為最終有較強資料分析功能,包括各種對比,當前擬考慮策略:
分三個部分:
1)資料採集
2)資料倉儲
3)資料顯示
現在的壓力在資料採集(主要是WEB日誌),前期日處理日誌在1G,最終日處理量在30G左右,
現在考慮的方案有兩種,
1)採用Hapdoop+Chukwa這種分散式檔案策略,然後解析資料到資料倉儲中(Oracle資料庫)。
本人傾向於這種方式,但專案時間難以保證。
2)採用piwik(php+mysql執行環境,script插碼),從piwik的資料庫中採集資料。
這種感覺是一種折中,讓piwik採集原始資料。但對piwik的處理能力心中沒底。
其它的策略包括商業化整合,以及Google Analytics這些整合方式因為商業原因排除了。
有請各位大師給些建議呀。謝謝。
相關文章
- 設計一個入口網站網站
- 入口網站 模板網站
- CMS大型入口網站網站
- 入口網站-張垣生活網網站
- 網站分析:找到並改進那些糟糕的入口頁面網站
- 2013年全國四大入口網站廣告業務分析網站
- 動漫入口網站-愛漫視網站
- 網站資料統計分析相關入門網站
- 網站日誌統計案例分析與實現網站
- 關於入口網站(portlet)的問題網站
- 網站分析高階細分六脈神劍之入口頁細分網站
- 網站流量統計網站
- 網站轉化率統計分析及優化方案網站優化
- 10個分析競爭對手網站的SEO策略網站
- 使用PolarDB和ECS搭建入口網站網站
- 網站統計程式碼網站
- 美國網際網路入口網站雅虎已經20歲了網站
- 幾大搜尋引擎的網站登入入口網站
- 統計網站PV和UV網站
- 鳳凰網裁員風波:老牌入口網站為何日落西山網站
- 推薦設計模式和架構設計的入口網站:http://www.patternscentral.com/設計模式架構網站HTTP
- webpack解惑:多入口檔案打包策略Web
- 基於ThinkPHP、AmazeUI高仿雲適配入口網站PHPUI網站
- 老牌入口網站的優勢:有人氣才能發展網站
- 使用百度統計分析你的網站訪問資料網站
- Z-Library映象網站入口,網頁版正式迴歸了網站網頁
- zliabary最新入口,zliabary國內官網映象站網址(持續更新)
- Web網站通知系統設計Web網站
- 使用PolarDB和ECS搭建入口網站(阿里雲)網站阿里
- 唯品會撤下網站導航欄內的“汽車”入口網站
- 層次化防禦保證企業入口網站安全網站
- Hadoop學習筆記—20.網站日誌分析專案案例(三)統計分析Hadoop筆記網站
- 鳳凰網宣佈大規模裁員 老牌入口網站紛紛轉型網站
- 【財經類網際網路入口網站】招聘高階Python工程師網站Python工程師
- 關於網站訪問量統計網站
- 爬蟲P2P網站某產品交易資料統計分析爬蟲網站
- 綠盟雲WAF | 政府入口網站的專業安全防護利器網站
- 新技術下的政府入口網站群建設建議網站