hosain-rahman-forbesJawbone聯合創始人兼執行長侯賽因·拉赫曼(Hosain Rahman)表示,通過不斷的試驗,他的健身追蹤器正“幫助人們填補目標跟行動之間的差距”。

當莫妮卡•羅佳提(Monica Rogati)在2013年收到一份工作要約時,她已經建立了全世界最智慧的職業社交網路系統之一,那些在領英網(LinkedIn)個人資料中進行篩選並神奇地推薦“你可能認識的人”的程式碼就出自她之手。而這份新的要約則來自於一家以行動式揚聲器和藍芽耳機而聞名的公司,而這些在當時差不多就是該公司的全部業務

原來,Jawbone正在進軍健康追蹤的業務領域。該公司已經開始銷售一款配備了豐富感測器的腕帶,取名為“UP”,用以監控佩戴者的行走步數和睡眠情況。現在,Jawbone希望有科學家和行為心理學家能夠將這些健康資料利用起來。

這勾起了羅佳提的興趣,於是她接受了Jawbone邀請。她開始研究數萬人的睡眠模式,其中的一些發現引起了她的注意。“我看到……女性每晚的平均睡眠時間要比男性多出21分鐘。”她說,“我當時想,‘這不可能。’”

羅佳提再次檢查了資料,那個數字一次又一次地浮現出來。然後,她查閱了學術文獻。令她驚訝的是,很多科學研究(比如那種在短期內對300個左右被試者進行追蹤調查的研究)都發現,女性的睡眠時間比男性大約多出……21分鐘。Jawbone數以百萬計的資料得出的結果跟數十年的科學研究不謀而合。

然而,那些研究已經是歷史了,而羅佳提的研究才剛剛開始。她可以通過智慧手機和UP手環繼續對成千上萬人進行追蹤,去確認已經得到證實的研究發現,但是如果她能夠更進一步,去實際影響到人們的行為呢?與其去搞清楚使用者到底睡了多長時間,為什麼不能幫助那些女性以及昏昏欲睡的男性睡得更久一些呢?

因此,羅佳提跟Jawbone新組建的資料科學家團隊部署了一次數字化試驗,以驗證被稱為“承諾原則”(commitment principle)的心理學概念:他們向4萬名使用者傳送了資訊,要求使用者表示同意“加入”,然後在對其來說比較早的時間上床睡覺。最後的結果是:三分之一的使用者在表示加入後比以前更早休息,平均算下來早了23分鐘。

儘管這個試驗頗有些“老大哥在看著你”(出自喬治·奧威爾的小說《1984》——譯註)的意味,但那些被演算法推動而採取行動的使用者似乎對此持讚賞態度:Jawbone稱,其90%的UP手環使用者認為,這款產品改變了他們對自己健康的看法。“我們之所以能夠做到這一點,”Jawbone創始人兼執行長侯賽因·拉赫曼(Hosain Rahman)在該公司位於舊金山的總部辦公室說,“是因為我們對資料科學進行了大筆投資。”

這項投資還將走得更遠:Jawbone很快會從使用者手機上的其他應用收集資料,比如Netflix,以嘗試自動化勸導,比如建議你在臨睡前觀看《摩登家庭》(Modern Family),因為你在看這部劇集時能夠比觀看《行屍走肉》(The Walking Dead)首播多睡57分鐘。

這種數碼產品與人的親密程度突顯了當下的一些重要趨勢。從上世紀50年代開始,消費者就一直在被追蹤、衡量並勸導採取某種行動。正如每一個《廣告狂人》(Mad Men)觀眾都知道的,心理學是現代廣告行業的核心,象徵意義、故弄玄虛以及焦慮情緒第一次被用作了商業武器。如今,聯網裝置(包括智慧手機、可穿戴裝置、溫控器以及汽車等等)無處不在,再加上功能強大和高度整合的軟體,這些為行為科學帶來了黃金時代。很快,資料將不再反映我們是誰,它將幫助決定我們是誰。

這個新興領域有時候被稱為“Captology”,即“計算機勸導/感化技術”的縮寫。1996年,來自史丹佛大學的電腦科學家B.J.福格(B.J. Fogg)創造了這個名詞。這種技術帶來的後果是一個更強有力的詞語:豚鼠經濟(Guinea Pig Economy)。

大筆資金已經聚集於此。根據福布斯的估算,如果把風險投資資金和業內先驅公司取得的營收加在一起,現在這已經是個產值70億美元的領域,而且這個數字還在變得越來越大(在全球前1萬家網站中,只有不到20%在使用第三方工具對自己的使用者進行試驗)。而且這還沒有算上數字化勸導引起的漣漪效應,隨著這種做法逐漸普遍,它肯定還會成倍增長。

這種做法帶來的道德問題同樣不容小覷:他們可以訪問關於我們衣食住行以及身體狀態的詳細資訊,大部分時候獲得了我們的同意,但很多時候並非如此。

豚鼠經濟的根源可以追溯到上世紀90年代,當時太陽微系統公司(Sun Micro-systems)有一位名叫雅各布·尼爾森(Jakob Nielsen)的研究員,他發掘了把早期網際網路瀏覽器作為測試平臺的潛力。尼爾森幫助普及了這樣一種概念:不是把同一樣東西展示給所有人看,而是讓小部分訪客看到不同的介面,以判斷哪一個更加有效。A/B測試由此誕生。

在世紀之交,谷歌(Google)將這一概念利用起來。這家搜尋巨頭在本世紀初進行了第一次A/B測試,隨機向數百萬使用者展示擁有10個、20個、或30個連結的搜尋結果頁面。結果顯示,連結最少的頁面載入速度最快,而更快的速度能夠讓人們成為服務的回頭客。

如同谷歌“不作惡”的信條一樣,該公司把A/B測試融入到自己的經營理念當中。到2008年的時候,谷歌每年要進行6,000次試驗,並由此促使其搜尋演算法和頁面佈局出現超過450次調整變化。谷歌研究員黛安·唐(Diane Tang)表示,如今“我們的工程技術和資料科學團隊在特定時間裡要進行成百上千次的A/B測試,以找到從多方面提升我們服務的方式,從判斷使用者訪問頁面時喜歡什麼樣的顏色和佈局,到更有效地利用我們的基礎設施,不一而足。”

這種理念現在已經成為了搜尋引擎的一種核心主題。羅尼·科哈維(Ronny Kohavi)負責微軟(Microsoft)必應搜尋引擎的優化工作,他斷言,網站應該堅持在一半訪客身上進行測試。他透露了自家的情況:必應目前每天在使用者身上進行300次試驗。測試結果能夠直接轉化成財務效益。2013年,必應對是否應該在精選廣告中包含一個以上的連結進行了大規模測試。答案是:兩個或兩個以上比一個更好。該公司表示,測試結果讓公司年營收增加了1億美元。科哈維擁有史丹佛大學授予的博士學位,此前負責亞馬遜(Amazon)的測試工作,他表示:“資料勝過直覺。”而谷歌工程師的說法則更不客氣,他們把仍然憑藉直覺進行運營的網站稱為“河馬”(HiPPO),或“薪水最高者的意見”。

ronny-kohavi羅尼·科哈維負責微軟必應搜尋引擎的試驗工作。

平心而論,如今差不多任何網站站長都能進行A/B測試。谷歌、奧多比(Adobe)以及Mixpanel都銷售此類測試工具,讓任何初級營銷主管都能調整網站或應用上的元素,對顏色和附件工具進行修改。這是一門產值30億美元的生意,而且還在不斷的增長之中。根據市場研究機構TrustRadius進行的一項調查,使用商業軟體的公司中有60%計劃在2015年花費更多的資金進行A/B測試。

然而,在A/B測試隊伍中打頭陣的,則是曾入選福布斯“30位30歲以下俊傑”的一位小夥子,名叫丹·斯羅克(Dan Siroker),他的初創公司Optimizely已經融資8,800萬美元。早在2006年,時年23歲的斯羅克還是谷歌的一位專案經理。當時,他被要求向公司聯合創始人拉里·佩奇(Larry Page)和謝爾蓋·布林(Sergey Brin)推介一個產品創意。同事們都說老闆可能不會喜歡這個創意。斯羅克對自己的差事怕得要命,一位高階經理給了他一些明智的建議:“只要告訴他們,你想進行一次試驗。”斯羅克回憶道。於是,他獲得了批准。

2007年年底時,當時的總統候選人巴拉克·奧巴馬(Barack Obama)參觀了谷歌園區。斯羅克靈機一動,想到了谷歌為內部使用開發的隨機測試工具還可以有其他用途。奧巴馬錶示希望自己的競選活動建立在資料的基礎上,斯羅克接受了這個挑戰,他搬到芝加哥,負責競選團隊的資料分析。他對籌資者的電子郵件和網站進行了谷歌式的A/B測試,並讓支持者註冊數量增長了40%。測試呈現了24種不同的“醒目”註冊頁面,通過篩選使用其中最有效的,結果這讓競選團隊多籌集到6,000萬美元資金。

如果斯羅克留在政治圈,他的淺色頭髮和非常上鏡的笑容應該能夠加分不少。不過,他現在成了這場試驗運動的一位傳道者。2009年,他離開奧巴馬的競選團隊,跟另一位谷歌前員工皮特·庫門(Pete Koomen)共同創辦了Optimizely。這是一家銷售網站調整和分析工具的軟體公司,其產品正是奧巴馬競選團隊(和谷歌)所曾使用過的。Optimizely的工具非常簡單,非程式設計師通過拖放功能選單就能建立數十種字型、顏色和佈局均不相同的頁面,然後選定隨機訪客組進行展示。“我們最成功的客戶建立了一種測試文化。”斯羅克說。Optimizely在英國的銷售負責人奧倫·科恩(Oren Cohen)表示:“你可以在63,000人身上進行一次試驗,而他們並不知道自己參與了,也不知道那會對自己的行為造成什麼樣的影響。”

Optimizely現在擁有逾8,000家客戶,其中包括迪士尼(Disney)、微軟以及索尼(Sony)。該公司的辦公室設在舊金山市中心一間洞穴狀的倉庫裡。斯羅克聲稱,他的測試工具能夠將客戶的線上營收提高21%。舉例來說,百得公司(Black & Decker)的DeWalt品牌測試了自己的“現在購物”(shop now)按鈕,然後發現把它改成“現在就買”(buy now)竟然讓線上商店的營業額增加了數十萬美元。

其他創業公司在Opitmizely的工作基礎上更進了一步。以色列的Commerce Sciences能夠確定人們在訪問你的網站時最關注的東西——可信度、價格或是社會聲望,然後調整網站的樣子去迎合那些人的心理期待。該公司創始人阿維·瑞維奇(Aviv Revach)說,“搔到你癢處的東西並不一定能讓我發笑。”

dan-sirokerOptimizely執行長丹·斯羅克:“我們最成功的客戶建立了一種測試文化。”

操縱上網者的行為很簡單,因為整個交易都是數字化的。我們正在迎來這個顛覆性的時刻,而這也將A/B測試的思維方式帶入到實體世界。資料和測試將為物聯網的建立提供指引——這個人們翹首以盼的新事物將讓我們的離線生活實現互聯。

在這個新興領域,Jawbone的拉赫曼可謂急先鋒。他的初版智慧腕帶在2011年推出,但遭遇了失敗,產品的質量問題迫使他提供全額退款。因此,在不到兩年前,他把自己硬體公司的未來押注在軟體和資料之上。首先,拉赫曼收購了一家分析公司Massive Health,聘請了首任資料科學家亞伯·貢(Abe Gong),然後又繼續進行招募,請來更多像羅佳提這樣的資料分析專家。到2013年11月時,他們已經處於成熟的實驗模式了。Jawbone的第一個假設是:在當年的感恩節,如果他們告訴使用者,從統計上說他們更有可能在賴在沙發上不動,這是否能夠勸導手環佩戴者進行更多的運動呢?Jawbone向5%的使用者發起一項挑戰,要求他們在一天之中走完特定的步數,最終那些選擇接受挑戰的人多走了近1,500步。2014年感恩節,他們的試驗將所有使用者囊括在內:一些人收到大標題的訊息,鼓勵他們走完更多的步數;另一些人收到的資訊更加含蓄,主要是祝他們感恩節快樂,Jawbone建議他們走完的步數被含蓄地放在行文當中。最終結果顯示,如何措辭並不重要,發資訊勸導這個行為本身就足以讓參與者多走1,500步(事實證明,用問題“勸導”比用命令更有效,這給人一種自己擁有選擇的印象。Jawbone的產品經理凱爾文·鄺說“我們不希望讓人們覺得自身的自主權受到威脅。”)。

作為私人持股公司的Jawbone不願意對外披露資料,但市場研究公司易觀國際(Canalys)估計,該公司的健身手環銷量現在應該接近400萬件,而且在去年出現大幅增長。隨著Jawbone的市場份額從2013年的17%提高到去年的21%,該公司的營收也實現躍升。如果該公司即將亮相的升級產品UP3能夠兌現承諾——不僅監控佩戴者的心率,更追蹤身體水合、壓力和疲勞狀況,那麼其產品銷量數字還會繼續增長。

在2014年年底時,Jawbone完成了一輪2.5億美元的大規模融資,獲得了33億美元的估值——這個數字比涉及大資料之前進行的上一輪融資高出一倍多。那些投資者正押注,Jawbone將不只是一家健身手環製造商,有望進化成為成熟的物聯網連線者。Jawbone已經跟三星(Samsung)的智慧物聯網事業部達成了合作,以探索健康以外的更多應用。拉赫曼說,“通過了解你的情況,我們可以告訴你,你在鍛鍊身體時最適合聽哪一種音樂。”

Jawbone正迅速招來強大的競爭。Fitbit正在健身領域採取行動,而且在今夏之前,蘋果(Apple)也將釋出其帶有健身追蹤和資料分析功能的智慧手錶產品。似乎,每一位傳奇性的行為心理學家都在打造初創公司,企圖把A/B測試帶入到實體領域——在過去幾年,他們一直利用亞馬遜的土耳其機器人(Mechanical Turk)開展研究,每個受測者的成本只有20或30美分,而不是過去的5或6美元。

Robert-Cialdini羅伯特·西奧迪尼(Robert Cialdini)為軟體公司Opower自稱的全球最大規模行為研究提供諮詢,這家公司建立在他早期關於人們競爭本能的研究成果基礎之上。

羅伯特·西奧迪尼是“承諾原則”理論之父,他現在擔任Opower的首席科學家。該公司專注於使用西奧迪尼發明的心理學技巧來減少人們的能源消耗。這是基於他著名的“門上通知”試驗:在2007年,西奧迪尼和同事在聖迭戈的居民區走家串戶,在他們的門上張貼通知,鼓勵居民減少能源使用量。一些通知勸導居民減少能源消耗來節省開銷,或者是做一個更好的公民。還有一些只是簡單地說:“社群裡的大部分人”都在節約能源,結果證明這是最有效的。

受此啟發,哈佛大學畢業生亞歷克斯·拉斯基(Alex Laskey)和丹·耶茨(Dan Yates)創立了Opower,該公司的工作基於西奧迪尼的研究發現,即人們莫名地擁有一種跟左鄰右舍攀比的需求。Opower最終請來了西奧迪尼本人,來幫助進行該公司所謂的最大規模行為研究。

Opower的發電廠客戶超過95家,其資料庫裡擁有4,000萬個電費賬單支付者的資料。該公司每次試驗的參與人數可達100萬。Opower已經瞭解到,對於那些能夠最有效使用能源的使用者,如果在發給他們的報告中加入笑臉,這能夠幫助他們保持下去。然而,要是告訴這些表現良好的使用者他們的用電量比鄰居更少,那將適得其反,因為很多人會將此視為浪費能源的藉口。“我們總是會有治療組和對照組。”Opower的首席行為官約翰·巴爾茲(John Balz)說,這實際上只不過是用科學術語對A/B測試進行表達。Opower在去年4月掛牌上市,市值達到6.7億美元。

來自杜克大學的丹·艾瑞里(Dan Ariely)是行為學界的另一位泰斗,他最近跟人共同創立了Timeful。該公司的免費移動應用不斷在使用者身上進行試驗,以瞭解如何通過智慧提醒讓他們的日常生活變得更有效率。47歲的艾瑞里說,他在應用上進行的測試是舊式試驗(過去是在實驗室裡跟被試者面對面完成)的一種進步,它能夠完成“關於人們一天中如何使用每分每秒的更具體測試”。對使用者起到作用的是傳送頻率較少的個性化資訊。

位於芝加哥的LearnMetrics想要成為教育界的Jawbone,該公司目前已經跟42所學校簽署了合作協議。幾個月前,LearnMetrics贏得了亞特蘭大的一份合約,內容是測試在亞特蘭大的K-12義務教育學校,Chromebook膝上型電腦是否擁有比iPad更好的學生參與度。基於成績、考勤記錄以及登入次數這些指標,Chromebook在對比中勝出了。如同任何測試一樣,滯後組會付出一些代價,但這總比學區盲目地為每個學生配發一臺iPad要好得多,那樣就真成了谷歌工程師所謂的“河馬”了。“這些學生獲得了一個接受更好教育的機會,而這一切就是基於他們自己的資料。”LearnMetrics創始人朱利安·米勒(Julian Miller)說。

Dan-Ariely-Stephen-Voss丹·艾瑞里是創業公司Timeful的首席行為官,他通過“自適應演算法”在個體使用者身上進行試驗。

產值2.8萬億美元的醫療保健行業因揮霍浪費深受困擾,現在它正在成為行為塑造的一個實驗室。一家名為Pact的創業公司將其健身軟體銷售給了馬薩諸塞州的一些僱主,這是基於一項針對幾十萬人(他們下載了Pact的免費應用)為期三年的試驗開發出來的。Pact要求使用者押下10美元左右的款項,以激勵自己進行鍛鍊。Pact勸導一組使用者以贏錢為目標,同時以輸錢對另一組使用者發出威脅。“負面(激勵)才能讓你離開沙發到健身房鍛鍊。”Pact創始人張一凡(Yifan Zhang)說道。現在,Pact Health客戶企業的員工可以拿到5美元的獎金或者被罰款同等的金額,這取決於他們能否堅持鍛鍊,而一切都由他們的智慧手機或健身追蹤器進行監控。

另一家名為StickK的創業公司同樣把重點放在懲罰上面。在其原來的網站上,StickK將受測者分成兩組,一組是鼓勵性的,如果受測者能完成健身目標,則向他們喜歡的慈善組織捐款;另一組是懲罰性的,如果受測者達不到目標,那就把錢捐給一家他們討厭的慈善機構(也許是綠色和平組織或者是全國步槍協會)。而後一種方式在敦促使用者減肥方面最為成功。現在,StickK創始人兼耶魯大學經濟學家喬丹·戈德伯格(Jordan Goldberg)正鼓勵新近註冊的6家企業客戶(其中包括一家員工達到10萬人的公司)使用相同的懲罰手段來激勵員工。“我們已經在消費者身上進行了A/B測試,”戈德伯格說,“這樣,當我們前往企業時,他們就不會覺得自己的員工是豚鼠了。”

要想窺見未來,我們可以到招聘創業公司Hired的網站上面看看。資料科學家的職位數量正以兩位數的速度在增長,更加引入注目的是,“首席行為官”已經成為炙手可熱的頭銜。“幾年前,這樣的職位只有20多個。”ideas42的傑米·金梅爾(Jamie Kimmel)說,這是一家非營利性質的行為經濟學顧問機構,“現在,在企業界任職的行為學家可能已經有數百人。”史丹佛大學甚至已經設立了勸導技術實驗室(Persuasive Tech Lab),對這種職業進行制度化培養。

道德合規官會坐視不管嗎?人們天生不喜歡被當做不知情的豚鼠,Facebook對此深有體會。去年,該公司在2012年對其動態訊息進行的一系列試驗被曝光出來。這項所謂的情緒感染試驗對70萬左右使用者狀態更新的措辭進行了操縱,使其看起來比實際更加悲傷或快樂一些。這個試驗把人們嚇壞了,由此引發了全美範圍內的聲討和全球範圍內的政府調查。人們真正憂慮的並不是Facebook讓很多人看起來更加悲傷,而是該公司一開始就對這種試驗持冷漠態度,以及一種可能性——這僅僅是我們知之甚少的冰山一角。根據當時的一篇報導,Facebook的資料科學團隊在進行試驗時沒有受到太多的監督。

交友網站OKCupid的聯合創始人克里斯蒂安·魯德爾(Christian Rudder)在事件曝光後不久也不甘示弱地站出來說,他的網站也對使用者進行了操縱。OKCupid在去年7月份表示,自己進行了一項測試,對誰跟誰是優秀的配對給予錯誤的正向讀數(反之亦然),以觀察配對演算法是否有效。魯德爾說,他最終也沒聽到太多抱怨。他在一篇部落格文章中寫道,“你猜怎麼著?如果你使用網際網路,那你在任何一刻都會成為數百項試驗的受測者。”

A/B測試領域需要一些秩序。作者尼爾·艾亞爾(Nir Eyal)表示,網路公司總是會事先進行“後悔測試”。“當我決定在不同的專案上要做什麼和不做什麼時,我總是問自己,‘如果使用者完成了這個特定行為,知道自己剛剛做了什麼,他們會感到後悔嗎?’”

Jawbone已經在研究追蹤UP佩戴者的GPS訊號,這樣他們就能在你回家時勸導你“順便去趟圖書館”,而不僅僅是完成特定的步數。該公司還沒有準備好把那些測試公之於眾。“更大的能力意味著更大的責任。”A/B測試的傳道者斯羅克說,“工具的使用者需要清楚有利和不利因素。”

就目前來說,這些現代“廣告狂人”大多是一知半解地觀察著這個新世界。“在過去20年的科技世界,是人們在照顧和維護著計算機。”應用分析平臺Appcelerator執行長傑夫·海尼(Jeff Haynie)說,“而未來20年將是計算機照顧我們。”

Jawbone最初的資料科學家亞伯·貢認為,豚鼠們最終將找到對抗不速之客的方法。“有更多的工具(比如廣告攔截外掛)來幫助人們控制自己看到的東西。”他說,未來人們將選擇更多的服務,在健康和時間管理等領域改變自己的行為方式,“我猜,我們目前正處於行為操縱的高峰期。”當然,這個假設之後也會接受檢驗。

via:福布期中文