揭祕蘋果應用商店評級:真是使用者說了算的移動應用“命脈”嗎?

遊資網發表於2020-09-09
【劃重點】

1蘋果應用開發者利用行為心理學來了解使用者的情緒、感覺和行為,在合適時間讓使用者對應用打出高分。

2應用評級稱為“移動應用世界的命脈”。研究顯示,從2星跳到3星可以使下載量增加306%,而從3星升至4星則能使下載量增加92%。

3蘋果在2017年9月推出的“應用內提示”功能讓使用者評分的參與度飆升,平均每個應用程式獲得的評分從2017年的1.9萬次上升到2019年的逾10萬次。

4開發人員已經找到多種方法,在不違反蘋果規則的情況下玩轉這個評級系統。

58個引入應用內提示的流行應用平均得分在6個月內從3星上升到4.7星,而使用者評分參與度則則飆升了62倍。

6評級虛高會扼殺創新,因為開發者可以開發出一個普通應用,但仍然能夠獲得4.5星的評級。

去年蘋果應用商店交易額超過5000億美元,數百萬家公司使用各種移動應用程式來接觸蘋果近10億使用者,蘋果應用商店中的評級系統堪稱移動應用界的“命脈”。

自iOS 11以來,“應用內提示”的興起有效激發了使用者參與度,平均每個應用程式的評分從2017年的1.9萬次上升到2019年的逾10萬次。然而,這種開發者得到更多安裝、蘋果得到更多佣金的滾雪球效應促使開發商利用行為心理學瞭解使用者情緒、感覺和行為,花費更多精力推高評分,但所謂的“客觀公正”卻不得而知。

以下為文章正文:



揭祕蘋果應用商店評級:真是使用者說了算的移動應用“命脈”嗎?



對一個iPhone應用程式打分或許只需要一秒鐘的時間,最多也就兩秒鐘。通常應用程式會彈出一個提示框:“喜歡Skype 嗎?”然後使用者可以點選1到5顆星的評價來進行打分。數以百萬計的使用者回覆了這些請求,很少認真考慮過他們在短時間內做出的選擇。

然而,整個行業在幕後花費無數時間和程式碼來為這個時刻作準備。看似隨機出現的提示框往往經過精心安排和設計,只在使用者最有可能作出5星評價的時候才會出現在螢幕上。

遊戲應用程式會在使用者獲得高分後要求打分;銀行應用程式會在發薪日進行詢問;甚至於賭博應用程式也會在使用者抓到完美的21點時才開始彈出提示。毫無疑問,只有當使用者所支援的團隊獲勝時,體育應用程式才會亮出評分。

10年來,蘋果一直在打壓“下載機器人”等評級做法。開發iOS應用程式的企業利用這些機器人騙取五星評分,並操縱自家應用在蘋果應用商店中的排名。雖然這些方法起到了一定效果,但實際上都是試圖欺騙評級系統的生硬粗暴手段,顯然違反了蘋果應用商店的規則。更復雜的技術始終處於規則允許的範圍之內,但會利用行為心理學來了解使用者的情緒、感覺和行為:它們不再侵入系統;而是正在侵入使用者大腦。

Fakespot是一家分析網路評論真實性的服務公司。執行長薩伍德•哈利法(Saoud Khalifah)表示:“所使用的這些方法總是悄無聲息。”“當你愉悅的時候,當你開始分泌大量多巴胺的時候,它們就會瞄準你……它們可以使用機器學習來確定使用者何時更傾向於留下正面評價。”

此外,開發者也知道什麼時候不應該問這個問題:如果使用者正在閱讀有關死亡或毀滅的負面內容,新聞應用程式就不會徵求評論;那些反覆忘記密碼頻繁進行試錯的使用者肯定也不會是提問物件。這種操作有助於防止出現更多低分,從而提高應用程式的整體平均分。

提供移動領域諮詢服務的Robots and Pencils公司執行長邁克爾•西科斯基(Michael Sikorsky)表示,“我們稱之為潛在價值感知……如果你認為已經把某人推到了應用程式的黑暗角落,那就不適合讓他進行評分。”

諮詢公司Mobiquity戰略與分析副總裁布賴恩•萊文(Brian Levine)表示,這種策略對公眾來說不得而知,但對開發商來說已經是公開的祕密,其使得很多應用的評級虛高。這種現象在蘋果應用商店中非常普遍,以至於“在大型企業中,很難找到不這麼做的企業”。

揭祕蘋果應用商店評級:真是使用者說了算的移動應用“命脈”嗎?
蘋果一直在打壓“下載機器人”等做法,但“應用內提示”功能在某種程度上誇大了應用的評級

他補充道,即使是那些不願這麼做的人也開始意識到,這也是進入蘋果精心策劃應用市場的成本。“現在的情況是,蘋果應用商店的評級對消費者來說變得毫無意義。”

評級虛高的影響深遠。數百萬家公司使用各種移動應用程式來接觸蘋果的近10億使用者。去年蘋果應用商店的交易額逾5000億美元,甚至超出大多數國家的GDP。

移動資料和分析服務提供商App Annie的資料顯示,全球使用者每天清醒時平均有27%的時間花在使用移動裝置上。最近蘋果因對應用程式收入抽成30%而備受批評,《堡壘之夜》開發商Epic Games就此對蘋果提起訴訟。但這隻涉及蘋果應用商店中16%的收費應用,相比之下評級虛高會影響到所有應用。

應用程式之間的競爭非常激烈,因此獲得高分至關重要。應用評價管理公司Apptentive將應用評級稱為“移動應用世界的命脈”。該公司的研究顯示,從2星跳到3星可以使下載量增加306%,而從3星升至4星則能使下載量增加92%。為企業應用商店排名優化服務的Gummicube表示,五分之四的使用者不信任評級低於4星的應用。

揭祕蘋果應用商店評級:真是使用者說了算的移動應用“命脈”嗎?
應用評級是“移動應用世界的命脈”

Fakespot的哈利法表示:“每個人都被激勵著打出更高分。”“開發者會得到更多安裝量,蘋果也能得到更多佣金——這是滾雪球效應,又會推動應用得到越來越多的高分。”

“問題在於,”他補充道,“真相被掩蓋了。”

“應用內提示”的興起

引發這種評級虛高的是蘋果在2017年9月進行了一次看似無害的更新。蘋果此舉是為了提高消費者參與度,讓使用者不再需要主動登陸應用商店對應用程式進行評級,因為那個系統通常只會讓心懷不滿的使用者打出低分。

隨著iOS 11的釋出,蘋果允許開發者提供“應用內提示”功能。這些提示的優點在於,它們能提高使用者的參與度,而且有效克服了“回應偏差”,讓很多應用得到的不再是消極評分。蘋果吸引更廣泛使用者群體參與評分的目的就是提高應用評級的準確性。

揭祕蘋果應用商店評級:真是使用者說了算的移動應用“命脈”嗎?
蘋果在iOS 11系統中開始引入“應用內提示”功能

從某種意義上說,這是一個巨大的成功。使用者評分的參與度飆升。根據Apptentive的資料,平均每個應用程式的評分從2017年的1.9萬次上升到2019年的逾10萬次。相比之下,谷歌應用商店在這段時間內並未提供應用內評分,單個應用的評分僅從3.3萬次上升到4.3萬次。

但批評人士表示,蘋果設計該系統的方式讓開發者得以利用多個漏洞,有意引導消費者提高應用評級。蘋果允許開發者可選擇彈出應用內提示的時間,開發者可以集中向粉絲徵求意見,避免詢問在評分方面有風險的使用者來實現“樣本偏差”。

蘋果還要求開發人員使用1到5星評級的標準提示介面,稱這是為了收集使用者的真實反饋。然而,開發人員可以從中引入“框架偏見”。如果他們給使用者一個積極的提示,比如“祝賀你得了高分!”,然後再要求使用者對應用進行打分,之後得到五星評價的機率就會提高。

蘋果也禁止開發者向使用者傳送“你如何評價這個應用程式?”等問題,在得到肯定的答案後再去呼叫應用商店的官方評分系統。不過,開發商仍可以通過調整問題措辭來“吸引”使用者。比如說,視訊會議應用程式完全可以問“你的視訊通話質量如何?”,在確定得到5星評價後再去請求蘋果官方的評分提示。

“開發者所做的是在公眾評價範圍內儘可能擴大對其做出有利評價的使用者規模。”貝恩諮詢公司(Bain & Company)顧問羅布•馬基(Rob Markey)表示。馬基也是網路優化指標Net Promoter Score的聯合創始人,這一指標主要幫助企業權衡、管理和提高客戶忠誠度。“隨著公司越來越善於操縱分數,評級系統本身對消費者的用處也越來越小。”

其他平臺也經歷過評級虛高的問題。一項調查發現,亞馬遜正對其網站上評論最多的使用者進行調查,有證據表明,這些人通過釋出數千份5星評分而獲利。

當然,蘋果使用者可以選擇不接收應用內提示。他們也可以在任何時候去應用商店發表負面評論,而且開發者不得以任何方式阻止他們。然而,蘋果確實允許應用程式開發商“重置”應用評級,而且由於應用內提示功能讓普通使用者更容易選擇5星評分,很多低分評價完全可以被淹沒。

西科斯基引用一位客戶的例子說,這名客戶的應用獲得了1090個1星評論,但在調整反饋機制後的幾周內,這款應用收到了逾3.5萬份評價,其中90%的人打了5顆星。

諮詢公司Publicis Sapient使用者體驗設計師溫迪•約翰遜(Wendy Johansson)表示:“這在很大程度上是經過精心設計的。”

蘋果一直試圖阻止開發者強迫使用者打出更高評分,並威脅會剔除違反規則的開發者。蘋果在作出回應時表示,其已經從應用商店中下架了不少違反規定的應用程式,也從開發者專案中踢掉了不守規矩的開發者。

“我們的應用商店審查指南明確指出,任何試圖欺騙系統的開發者,比如操縱評分或其應用在搜尋結果中的顯示方式,其應用都有可能被下架,開發者也有可能從開發者專案中刪除。”蘋果補充道。


“反競爭”

然而有證據表明,開發人員已經找到了多種方法,在不違反蘋果規則的情況下玩轉這個評級系統。當被問及所使用的策略時,開發者拿出蘋果自己的應用內提示指南:“在使用者最有可能對你的應用程式感到滿意時發出請求,比如當他們完成動作、關卡或任務時。”

對哈利法來說,蘋果規則還帶來了一個意想不到的後果。開發者每年只能就每個應用向單個使用者請求三次評分。這是為了避免讓消費者感到厭煩,但實際上卻讓應用內提示變成了一種稀缺商品。他說,這促使開發者通過打造“黑鏡演算法”來找出使用者什麼時候最快樂。

揭祕蘋果應用商店評級:真是使用者說了算的移動應用“命脈”嗎?
今年7月,蘋果執行長蒂姆•庫克(Tim Cook)在美國國會眾議院反壟斷聽證會上作證

Mobiquity的萊文表示,其結果是應用商店的評級系統受到影響,更有利於佔市場主導地位的大企業。他補充道:“這完全是反競爭的,因為只有資金更多的大公司才能有效地利用這種情況。”

他認為,評級虛高會扼殺創新,因為開發者可以開發出一個普通應用,但仍然能夠獲得4.5星的評級。他表示:“許多應用程式並沒有得到充分開發,因為現有的所有評價體系都表明使用者喜歡它們。”

由於蘋果並沒有提供完整的評級資料,因此很難準確地指出評級到底漲了多少。但第三方報告顯示,iOS 11推出後,應用商店內各種應用的評級普遍暴漲。

在美國最大的7個銀行應用程式中,2017年初的評分是從1.2星到4.9星不等,現在所有的評分都是4.8星。在谷歌應用商店中,這些應用程式中得分最高的是4.7星,最低的是4.4星。

即使是在購物、生活方式、金融、旅遊和娛樂類等最受歡迎的應用程式中,排名第50位的應用程式也得到了至少4.8星的評分。相比之下,App Annie的資料顯示,谷歌應用商店中排名相同的應用在3.8星至4.7星之間。

萊文分析了8個引入應用內提示的流行應用,發現這些應用的平均得分在6個月內從3星上升到4.7星,而使用者評分參與度則飆升了62倍。

三明治連鎖店賽百味多年來一直因為自家應用在蘋果應用商店中評分不高而苦苦掙扎,但2018年初該公司應用的評級在兩週內從1.7星躍升至4星。軟體更新的一份說明稱,它解決了一些小問題,而主要的新功能是更易於“給應用程式評分和提供反饋”。

更高的評分似乎並未反映出iPhone和iPad上應用的質量變得更好。相關資料顯示,帶有書面評論的評分根本沒有增長。

移動資料分析公司App Annie高階市場分析經理萊希•賽多(Lexi Sydow)表示:“實際上,我們發現iOS平臺所有應用和遊戲的平均分都有所下降,從2017年8月的4.2下降到2017年9月的3.9,再到2020年7月的3.4。”

“你有一個麻煩"

但書面評論不再那麼重要,因為開發人員無需使用過於複雜的技術就可以過濾掉許多1星評分,並獲得更多的高分。

應用評價管理公司Apptentive表示最簡單的方法就是“愛情對話”,這家公司的客戶有eBay、CNN和阿拉斯加航空公司。

這種方法建議開發人員用一條簡單資訊來引導使用者。“你喜歡這個應用程式嗎?”當使用者點選“否”時,就會被引導至一個私人反饋渠道。當他們點選“是”時,就會看到蘋果官方“為此應用打分”的介面。

Apptentive內容主管阿什利‧塞夫曼(Ashley Sefferman)說,她並不認為這是一種“遊戲”,相反其可以幫助開發者找到“可操作的”反饋,並從它們的粉絲那裡得到更多積極評論。

Apptentive的統計資料顯示,大約有五分之二的使用者點選了“否”,這被認為對應用評級是有風險的,因此壓根不會再讓其打分。塞夫曼至少從2016年就開始推薦這項技術,她稱這項技術非常有效,應用程式再沒有理由獲得低分評價。

“你的應用程式沒有獲得5星評分的原因是應用內部的反饋方式不正確,”Apptentive的線上指南中這樣說。

儘管有來自開發者的壓力,但谷歌應用商店長期以來則拒絕提供應用內評分。在Apptentive跟蹤的所有五個類別中,2017年之前從谷歌應用商店Play Store下載的Android應用5星評分比例都高於蘋果。但自2017年以來,蘋果應用商店的應用評分已經遙遙領先。

揭祕蘋果應用商店評級:真是使用者說了算的移動應用“命脈”嗎?
今年8月5日,谷歌開始提供應用內提示功能,吸引使用者評分

這種情況現在可能會改變。今年8月5日,谷歌軟化了態度,開始提供應用內提示,吸引使用者評分。和蘋果一樣,谷歌表示這一舉措的目的是讓開發者獲得更“客觀公正”的反饋。但是其也借用了開發者對這個工具的讚揚。正如一位開發者所說,“在我們實施應用內評價的一週後,就獲得了有史以來的最高評分”。很明顯,不管開發者是否真正改進了他們的應用,都可以期待提升應用評分。

貝恩公司的馬基表示,打造一個擁有公平評級系統的市場,對任何平臺來說都應該是至關重要的。“這就像,你有一個麻煩,”他說。“如果不解決,最終就會失去買家或賣家。”

但開發者和消費者都面臨著同樣的問題:除了蘋果和谷歌之外,智慧手機使用者別無選擇。

來源:矽谷封面
地址:https://new.qq.com/rain/a/20200908A0JQV100

相關文章