摘要: 網站分析工具是做網站分析的必備武器。從網站分析的歷史被揭開的那一天起,網站分析就同工具無法分開。工具利用水平的高低,很大程度上決定了網站分析水平的高低。但有一個天大的誤區,那就是認為越好的工具越能幫助做出更好的網站分析。我用過可能是世界上最先進的工具,但我知…
網站分析工具是做網站分析的必備武器。從網站分析的歷史被揭開的那一天起,網站分析就同工具無法分開。工具利用水平的高低,很大程度上決定了網站分析水平的高低。
但有一個天大的誤區,那就是認為越好的工具越能幫助做出更好的網站分析。我用過可能是世界上最先進的工具,但我知道工具的先進和網站分析的先進完全是兩回事。我深知如果你不按照下面的十個原則利用你的工具的話,任何一個工具都可能讓你的分析破費周章。這就如同AK47是有力的殺敵武器,但槍口完全有可能對著你自己。
原則一:不要採用超出你的能力的工具
就目前我看到的情況來說,網站分析工具的功能強大程度和其複雜程度成正比。功能強大的背後,意味著更為靈活的定製化能力,而定製化只能由人完成的。好的定製化取決於三點:
1.你對自己業務的清晰掌握;
2.你對這個工具的清晰掌握;
3.你對你的業務與網站表現之間關係的清晰掌握。
這三點,咳……,對於我們大多數朋友來說都是極高的要求。對我也一樣,我不敢說我對業務有清晰的掌握,行業和公司內部的情況需要很多時間去了解和體會。這需要悟性。另一方面,對業務清晰瞭解的人,未必能深入瞭解工具。Business和Tech就如同兩種不同的語言,要用左右大腦分別思考。我的朋友Lizzy Fan的老闆Yi Shi (CEO of AVAZU)是這樣的一個人,所以他極為成功,但這樣的人太少了,總之我很難碰到。這之後你還要對你的業務與網站表現之間的關係有深入的理解,這同樣不易。
我看到中國有很多企業採用了Omniture的旗艦分析工具SiteCatalyst,但實際上並沒有發揮超於Google Analytics的能力,甚至還不如GA的能力。如果你只是使用簡單的功能,那麼確實GA在使用者體驗上可能更佳,甚至CNZZ或者百度統計已經足夠。如果你做了定製化功能,你就必須要了解SiteCatalyst的流量流和業務流之間的邏輯,以及有這兩種流所引發的traffic、event、prop和evar。這些,真不是那麼容易。
我的建議是,如果你要使用更強大的工具,確保你比這個工具更強大。如果你自認為能力尚不足夠,那麼確保有強大的實施團隊和顧問團隊,保證你可以根據你的需求柔性的調整,否者,還是與你熟知的工具打交道。當然,你可以向 Michael Li 和我求助,但我們不能一直捆在你的業務上,因此更強大的工具,意味著你更應該保持謹慎。
記住,是你使用工具,而不是工具使用你。
原則二:免費工具沒用好,付費工具會更困難
商用的付費的WA工具總是讓我們內心湧起一陣悸動,這些“高不可攀”的工具,能有多麼強大啊!於是,我們可能認為,免費工具“不好使”是工具的功能畢竟有限,我們用“付費工具”肯定會完全不同!
這個想法我基本不贊同。就像下面這個圖——“我生不了孩子,是你們的錯!”,但這是笑話,錯不在工具,我的母親討厭我為錯誤“找客觀原因”開脫。
免費工具沒有用好,付費工具不僅不會幫到你,反而你會更加煩惱。
類似於Google Analytics或是百度統計這樣的免費工具彙集了網站分析所需的一些最核心功能,並且體現了網站分析的很多核心思想。這些工具是偉大的。
你認為的工具“不好使”,可能真的只是因為你沒有最大化的挖掘網站分析的潛力。
這方面,我的同事Travy是專家,她理解最大化“榨取”GA之類免費工具的意義。
“因為那個時候我們的公司不捨得花更多的錢,所以我們想盡一切辦法利用GA”,Travy說。
這種利用讓我大開眼界。坦率說,在此之前,我並不知道GA能夠有如此變通的使用方法。這些方法都僅僅只是基於GA的一個方法,即_trackPageview()方法,我們預設的使用是不加引數的,可是如果你把各種引數——包括頁面的Title,包括麵包屑,包括頁面URL中擷取後翻譯的資訊加入進去,GA就增加了許多我們從前根本不認為它能夠實現的功能。利用麵包屑,GA甚至可以有一點點路徑功能了!
同樣,對於_gaq.push([‘_trackTrans’])這個命令也可以挖掘的很深,你可以把更多商品的分類資訊、價格以及按照你的要求總結的資訊通過動態變數的方式傳遞給GA。GA對於商品的監測也能變得更強大。
我開始承認對於免費工具的能力,我認識的還不夠。
當然,免費工具的能力是有限的,即使你再榨取,它總有碰到天花板的時候。但我的觀點很明確,榨取這個工具能力的過程,是對網站監測實施深入理解和實踐的過程。如果你願意花時間在免費工具的壓榨上,那麼當你開始使用付費工具的時候,你會發現一切並不那麼困難。但是,如果你在使用免費工具的時候不斷埋怨,那麼我可以想象你在付費工具使用時會有更多的埋怨。
因為我們再第一個原則中已經說了:你使用了超出你能力的工具。
從免費工具開始,壓榨它,成就自己。:)
原則三:不要試圖用WA工具準確監測交易
另一個誤區在於人們總是相信付費的工具比免費工具更加準確。呃……,我基本不認為是這樣。由於監測機制本身的原理,工具的準確和你理解的準確是不同的。
值得注意的是,常見付費工具和免費工具在流量監測的實現方法上幾乎一樣,所以二者之間不存在誰更準確的問題。而在監測交易資料上,畢竟不同於電子商務網站內部的ERP系統,網站分析工具是通過捕捉頁面上的交易資訊實現交易資料獲取的,因此常常只是訂單確認,或者支付確認的資料,但並不是最終成交的資料(COD交易的成功與否,以及使用者退貨撤單等情況是很難被網站分析工具監測的)。
能夠準確監測交易的工具是你公司的ERP系統(或進銷存系統),但WA工具很困難。
關於WA工具準確性問題,其實還有更多的內容,讀讀這篇文章——網站分析——我們的資料準確嗎?你就明白為什麼我們不需要追求準確了。:)
引申閱讀:如何“讓”WA工具也能準確監測流量渠道的交易資料
WA工具的監測方式讓它準確監測交易資料時很困難的,儘管Google Analytics和Omniture都能夠通過設定實現撤單和逆向物流等收入的抵扣,但太麻煩,操作可行性不高。
但WA工具卻可以幾乎準確地“監測到”流量渠道的交易資料。
注意,我打了好幾個引號,因為這並不是通過WA工具直接實現的。我們需要採用變通的方法讓GA記錄的流量渠道和這些渠道對應的交易資料準確對應起來。
方法有兩種,兩種方法都有一個前提,即你自己要有一個媒介銷售管理系統(或類似的系統),能夠利用給流量加標記的方法,捕捉到流量帶來的銷售。舉個例子,如果這個系統的標記格式是?from=,那麼我在我的部落格上為走秀網投放的廣告的鏈出URL就應該是 www.xiu.com/?from=*** ,這個系統就能夠識別CWA的流量帶來的銷售。這樣的系統比比皆是,在電商網站普遍存在。
如果你有這個系統,那麼恭喜你,你能夠實現讓流量渠道和對應銷量準確匹配的目的。
一種方法是用GA的:讓GA的 UTM link tag 能夠識別你的系統設定的標記格式。如果看過《流量的祕密》,那麼你就知道,utm_campaign, utm_medium等5個標記媒介屬性的名稱都是可以自定義的。你完全可以用from表示utm_campaign,那麼上面的例子中,?from=CWA既能夠被GA識別一個被稱為CWA的campaign帶來的流量,又能被你的媒介銷售管理系統識別為從CWA來的流量,並把這些流量能夠帶來的銷售都記錄下來。
具體做法非常簡單,只需要在實施GA程式碼的時候使用:。。。。
另外一種相對笨一點,就是讓你自己的系統能夠識別WA工具的流量來源標記,比如,本來你的系統是識別?from=的,現在你讓你的技術動動手,改成識別?utm_content=,也完全可行,修改也非常簡單。
這樣做之後,你就發現你能得到一個非常準確的報表,如下:
Beautiful! 現在你可以準確地知道每個流量來源的轉化率能有多少了!如果你有流量的獲取費用資料,那麼準確的ROI也就獲得了!
原則四:再智慧,也要重視手工
網站分析工具的趨勢是更加智慧化,例如各家都推出自己的很先進的熱圖功能。或者給出一些經過二次處理的建議資料。
我對智慧化愛恨交加。
沒有智慧化,很多工作是無法想象的;但智慧化有時會掩蓋真相,且讓人懶於思考。
例如熱圖,熱圖特別無法智慧化的原因是,頁面上有很多同樣URL的連結入口,或者頁面上的連結經常被更新(例如我們的電子商務網站)。這時候我處理的方式是對頁面上所有重複URL連結入口和動態變化的連結,加上標識引數。然後手工統計。需要強大的執行力,不簡單,但很準確。
你可能會說這會影響到SEO,但已經被我的同事Jay搞定,不是問題了。:)
重視手工的另一個原因是,不管多麼精細的監測實施,都不可能盡善盡美。例如,我在廣州做這個分享的時候,有一位朋友提問——如何才能很好的評估SEO的長尾效果?這個工作直接讀取Google Analytics的報表是很難完成的,你只能想辦法把所有的長尾organic keyword全部匯出,然後利用自己的經驗和智慧結合資料分析它們的規律。
如果你問我,我網站分析中使用的最多的工具是什麼,我的答案不是Google Analytics,也不是Omniture的一眾工具,而是Excel。很多時候,我其實不是特別關心Google Analytics和付費工具的異同,很多時候我都是在Excel中實現分析的,WA工具只不過是我分析所需的原材料而已。這也是為什麼,商用網站分析工具必須保留並提供Raw Data(例如Omniture SiteCatalyst提供Data Warehouse功能)。
引申閱讀:如何一次性匯出2萬條Google Analytics的資料?
利用Google Analytics普通的資料匯出,你只能最多匯出500條資料。
但是對於老版本的Google Analytics,你可以通過一個簡單的方法匯出任意數量的資料。
1. 點選上圖中Export標籤。
2. 右鍵點選CSV,然後拷貝它的連結地址。
3. 開啟一個新的瀏覽器視窗,把剛才拷貝的連結地址輸入進位址列,但不要急於啟用這個URL。
4. 在位址列的URL後面再加上&limit=15000。你就可以匯出15000條資料。你可以在等號後換任何一個數字。
這個方法對新版本的Google Analytics無效,新方法我還沒找到。
原則五:WA工具無法滿足你的所有刨根問底
一般意義上,WA工具是指Google Analytics、Omniture的SiteCatalyst這樣的網站使用者點選流工具(clickstream tool),這類工具能夠告訴你what(現象),但一般很難告訴你what後面的why(原因)。
比如說,你通過Google Analytics的Top Content報告看到某一個頁面的bounce rate很高,你就知道了一個很重要的現象——訪問者通過這個頁面進入你的網站時,第一印象不佳,沒有進入其他頁面就離開了你的網站。
但是什麼原因造成這個現象呢?
如果是我,我會做下面的事情:
1. 檢視頁面是否是無連結page,或者是少連結的end page。
2. 如果不是,檢視這個頁面的流量來源都是哪裡,如果主要是搜尋引擎,那麼恭喜你,你的問題比較容易解決;如果不是搜尋引擎,而是直接流量為主,那麼很遺憾,你的問題很難通過WA工具刨根問底了。
為什麼呢?
原因在於,直接流量是一種讓人喜愛有加卻又“極為蛋疼”的流量。直接流量只告訴你一個資訊——Google Analytics不知道這些流量來自於哪裡!既然不知道他們從何而來,我就很難知道他們為什麼對我的這個頁面第一印象不佳。
對於WA工具,我們必須正確對待。它的最大優點,在於能夠幫助我們通過資料發現那些我們沒有察覺的現象(問題),也能夠幫我們證明我們的改進是否能夠帶來更好的資料表現。但現象背後的原因,很多時候通過WA工具是做不到的,我們必須要引入其他的分析工具和方法。
這些分析工具包括:AB測試工具、調研工具、Pannel、眼動儀等等;方法則包羅永珍——調研、可用性測試、德爾菲、使用者追蹤等等。
談到這裡,我想把WA工具的範圍做一個延伸,我們常用的GA、SiteCatalyst、CNZZ或者百度統計,只不過是網站分析的點選流分析工具,網站分析工具應該有更大的包容範圍。
原則六:選用一個工具之前,首先必須瞭解它的原理
有一些實際上是老生常談了,但仍然有初入門徑的朋友會問起,為什麼我GA的資料跟日誌的不一樣。
講一個真實的故事,我們的網站有一天感到伺服器的壓力很大,公司想知道是不是因為使用者突然暴漲所致,或是有其他惡意的原因。
這是一個極為容易解決的問題。從GA上,我們能夠輕易的看到“真實的人”,而不是機器訪問的流量;而日誌檔案(log file),則能夠捕獲大部分機器人(蜘蛛爬蟲)遍歷網站的流量。因此,如果GA的資料暴漲,那麼這是好事,伺服器壓力大,應該新增伺服器了。可是,如果GA沒有暴漲,而log file的資料暴漲,那麼可能是某些惡意的網站資料採集軟體在作惡,公司該要注意的是網路安全領域的問題。
所以,日誌檔案的分析工具(例如逆火軟體,老版本的WebTrends,或是Piwik),跟頁面標記監測分析工具(例如Google Analytics和Omniture SiteCatalyst)在監測原理上有根本性的差異。你可以讀這兩篇文章瞭解它們之間的差異:伺服器日誌法網站分析的原理及優缺點,頁面標記法網站分析及資料捕獲原理。
所以,不同原理的工具,收集資料的範圍是不同的。
即使同為頁面標記監測分析工具,它們的原理也是不同的,這同樣造成資料差異。例如,GA的監測資料利用的是cookie,典型的GA的cookie是utma,utmb,utmc,utmz什麼的(它們是什麼意思,請看網站分析度量、意義以及不為人所知的(2))。而Omniture SiteCatalyst則是使用cookie和虛擬cookie的共同作用監測資料。SiteCatalyst的cookie比GA的cookie簡單,只用來記錄訪問者的唯一識別編號,而這個編號對應的資料,則全部存放在資料庫的虛擬cookie中。虛擬cookie實際上是資料庫中的一張大表,記錄了這個cookie編號使用者訪問網站的全部行為。
由於利用了虛擬cookie,因此,在使用者的客戶端不支援cookie的情況下,SiteCatalyst還是可以利用IP地址或client agent記錄一個visitor,但GA在沒有cookie支援時,就什麼也不能做了。
因此,我們可以按照監測原理為常見網站分析工具分類,如下圖所示:
由於監測原理的不同,工具的作用也就有很大不同。
想要做SEO,瞭解機器人扒取資料的原理,用日誌工具;想要看滑鼠軌跡和停留,用滑鼠捕捉工具,例如ClickTale;要看人的行為,還是用頁面標記工具。
引申閱讀:不同工具,對於網站分析基礎度量的定義也是不同的監測原理的不同會影響不同工具收集資料的範圍,同樣,不同工具在定義基礎度量的時候,也有差異。典型的差異是我在介紹bounce rate時候所提到的Google Analytics和Omniture SiteCatalyst(SC)之間的差異。對於GA,bounce rate是預置的基礎度量,定義是single page view的訪問;而在SC中,bounce rate則不是預置度量,你可以自定義它,一般用single page visit/visit定義。single page view和single page可有天壤之別,前者定義的bounce rate不把reload頁面的情況計為bounce,因為頁面reload,1個page view就變成2個,所以不再是bounce。而single page的定義則包含了reload的情況,因為無論你在一個頁面上reload多少次,這個頁面還是這個頁面,仍然你只訪問了一個頁面,所以仍然是single page。所以SC的bounce rate一般比GA要略小。
同樣,對於visit的定義有各種不同;對於時間(time)的定義則更多不同了,這裡不一一列舉。雖然不同的定義得出的結果並不一定有很大差異,但瞭解一下無害處。
當然,我也認為,如果你不瞭解這些,也並不妨礙你做分析。但監測原理的不同,則是必須要了解的。
原則七:不要利用不同工具做一件事
我總覺得,用Google Analytics和Omniture SiteCatalyst監測網站每天visit的多少有些無聊。並不是說這兩個工具更準確的問題,而是你永遠說不清楚到底誰的資料更準確。
理論上,如果兩個工具監測的大小不一致,那麼它們至少在趨勢上是一致的。也就是說,如果GA記錄的昨天的visit比前天的大,那麼SC的visit也應該是昨天大於前天。可是,天殺的,鬼知道為什麼有時候它們連趨勢都是不一樣的。
你可以對GA多一分信任,但我說不好,畢竟有時候Google的服務被鬼使神差的阻斷,讓它看上去好像是自身營養不良不能提供靠譜的服務。你也可以多信任一點Omniture SiteCatalyst,但我也說不好,畢竟伺服器也遠在重洋之外(但聽說年內香港就會有伺服器,到時也許會有不同)。
所以,遺憾的講,這裡存在一個誰也說不清楚的盲區,當你的老闆詢問你為什麼GA的資料和SC的資料不一樣的時候,你永遠也不能找到一個圓滿的解釋,除了騙他說你花錢買的SC更加可靠之外。
所以,為了監測某個相同的度量,如果你認準了一個,那麼就一直認準它,如果你結識了新歡,就不要再想舊愛,也別玩兒藕斷絲連腳踩兩隻船。並且,我的忠告是,不要再浪費時間想象為什麼它們之間究竟發生了什麼而造成了差異。
是的,重在分析,而不是資料本身。
這也是為什麼Avinash總說,同時使用兩種或以上的工具是不理想的。
原則八:利用多個工具的長處
但你是不是應該永遠不同時用多種工具呢?
我不知道大師們怎麼說,但是我當然不是。我不僅用多種工具,而且樂在其中。
我不會去用Google Analytics和Omniture SiteCatalyst比較visit,但我的確會用SC彌補GA沒有路徑監測的缺憾。(關於這一點,請看我之前的文章:Google Analytics的能與不能)
而且,當你花了錢用了ClickTale之後,你也會知道,GA的In-Page Analysis不是不好,但功能確實還不夠強大。
百度統計?恩,這是顆國產的新星,不管怎樣,百度、騰訊和阿里都是極為重視產品的,所以這個產品也不會太差,尤其是在你想要統計和分析鳳巢投放的效果的時候。
你應該用多種工具,因為沒有任何工具能八面玲瓏,面面俱到。
引申閱讀:在一個網站上使用多個工具時的注意事項
在一個網站上使用多個工具並不會帶來什麼麻煩,大多數情況下我們的網站訪問者不會察覺出任何異樣。
但在一個網站上使用多個工具時可能會對網站效能帶來負面的影響,尤其是當某個工具的JavaScript執行發生問題響應緩慢時。所以,加入的程式碼一定要放到頁面的最底端。
選擇你認為真正有意義的工具,當你需要進行的分析結束後,你完全應該刪除這些工具的監測程式碼。並不是所有的網站分析工具都如同基礎分析工具GA或SiteCatalyst一樣是從頭到尾都需要的,事情總是有始有終。在這一點上,始亂就應該終棄。
原則九:善用複製和過濾——給你更多嘗試和細分的機會
如果你用過GA,你不會對它的account和profile陌生。account由不同的GA記錄號區分,例如UA-123456和UA-123457就會被放入不同account中。而一個account下可以容下很多個profile,每個profile對應一個報告。
例如,我想在我的這個網站 www.chinawebanalytics.cn 上做一些實驗,但我又不想影響正常的資料監測。我可以用兩個方法。
第一個方法是一個笨辦法,即在頁面上再新建一個GATC(Google Analytics Tracking Code),也就是我們在GA上生成的監測程式碼。這個程式碼一定跟最初的程式碼有不同的記錄號,即UA-XXXXXXX不同。我不是很喜歡這個方法,因為GA本身提供了更好的方法。
第二個方法是在你原來的account中再複製一個profile,即把你已有的報告再複製一個一模一樣的。這個新的報告,可以供你肆意玩樂啦。
如果你不瞭解如何進行這種操作,請看谷歌官方的幫助講解:http://services.google.com/analytics/breeze/en/accounts_profiles/index.html
其實,很多工具存在類似Google的這種報告複製的機制。例如Omniture SiteCatalyst擁有report suite的定義,你可以定義多個report suite為你的一個網站服務,當然,收費也就會更貴一些。
一旦複製了一個一模一樣的報告,你就可以對這個報告進行過濾操作。過濾實際上是一個不恰當的說法,應該說,是對這個報告的監測方式進行新的配置。
例如,我可以利用這個新的profile(report),加上一個地域的過濾,用於只監測從北京訪問網站的客戶。也可以加上一個過濾,只監測從搜尋引擎匯入的,且只以某一個頁面為landing page的流量。
複製和過濾給你更多的嘗試機會,和更靈活的細分功能,使用任何一個工具,你都需要了解這個工具的複製和過濾功能,它能讓你的工作事半功倍。詳細瞭解GA的過濾,請看這篇文章:五個實用的Google Analytics過濾設定
原則十:讓需求指引你,而不是讓工具指引你
最後一個原則,是我內心的呼聲。
我不是一個Geek,所以,坦率講,當新的網站分析工具出現的時候,我並不是焦急地盼望著更早一日試用。所以,在朋友問到GA V5的時候,我的感覺是:“哦,還不錯,使用者體驗上有改進。”事實上,我認為除了multi-channel funnel和自定義高階群組也可以使用報告過濾功能外,V5的版本改進並不能稱得上是革命性的。
我是一個懶人,所以總是信奉“enough is enough”。我是有了需求之後,再去選擇工具,但我不是有了工具之後,才去理解它能夠滿足哪些需求。所以我很少在第一時間認真研究工具本身,除了在百度統計剛剛出來的時候,好奇研究了它。
不要為工具所累,是我認為使用工具的最重要原則。
如果你認為網站分析工具很複雜,那就大錯特錯了。網站分析工具,咳,說實話,都大同小異,那些模樣越是fancy,功能越是讓你眼花繚亂的報表,實際上使用的機會越少。我認為工具複雜性的提升並不在於本身學習成本的提升,學習不過是麻煩的最開始。真正的麻煩在於,工具複雜性提升意味著工具背後實施難度的增加,而我親身的體驗告訴我,在中國的電商環境中,想要找到一個特別可靠的團隊去實施複雜的WA工具是非常困難的——除非你的團隊既有好的前端IT,又有懂前端IT且瞭解網站分析工具的達人,還有對網站分析需求掌握到位的人。這不是那麼容易的事情。
當然,我們不需要被嚇唬住。我還是覺得(與Liang同學的觀點有差異)一步步來是可能的,使用GA是一次免費的實習,你不僅僅是瞭解了網站分析工具和概念,更關鍵的,你通過運用這個工具瞭解了你的分析需求是什麼,這才是非常關鍵的。當你知道這一點之後,你能夠提出有價值的切合現實的商業問題,並且以這些問題為基礎,選擇真正能夠解答這些問題的工具,這個時候你就不是盲目的。否則,工具的邏輯是工具的,讓它牽著你的鼻子走,你很難找到北。
我的實踐告訴我,這是相對小風險的一條路,或許對你也適用。