紐約時報如何使用機器學習使其付費牆更智慧

banq發表於2022-08-26

當《紐約時報》付費專區推出時,所有使用者的計量表數都是一樣的。從那時起,《紐約時報》已經轉型為一家資料驅動的數字公司,其付費牆現在成功地使用了一種名為 Dynamic Meter 的因果機器學習模型來設定個性化的電錶限制,從而打造更智慧的付費牆。


該公司的付費牆戰略圍繞著訂閱漏斗的概念:
漏斗的頂端是尚未在《紐約時報》上擁有賬戶的未註冊使用者。一旦他們達到了未註冊狀態的儀表限制,他們就會看到一堵註冊牆,阻止他們進入,並要求他們在我們這裡建立一個賬戶,或者如果他們已經有一個賬戶,則要求他們登入。這樣做使他們能夠獲得更多的免費內容。
而且,由於他們的活動現在與他們的註冊ID相關聯,這使我們能夠更好地瞭解他們目前對時代內容的胃口。
這些使用者資訊對任何機器學習應用都是很有價值的,而且也為動態儀表提供了動力。
一旦註冊使用者達到了他們的收費標準,他們就會收到一個帶有訂閱提議的付費牆。動態儀表模型控制的正是這一時刻。該模型從註冊使用者的第一方參與資料中學習,並確定適當的儀表限制,以最佳化一個或多個業務K.P.I.s(關鍵績效指標)。

動態儀表模型必須發揮雙重作用:
它應該支援我們幫助人們瞭解世界的使命和我們獲取訂閱的商業目標。這是透過同時最佳化兩個指標來實現的:註冊使用者對紐約時報內容的參與度和付費牆在特定時間內產生的訂閱數量。
這兩個指標有一個內在的權衡,因為提供更多的付費牆自然會帶來更多的訂閱,但要以文章的閱讀量為代價。

這種權衡在隨機對照試驗(R.C.T.)收集的資料中清晰可見:
隨著註冊使用者的米數限制的增加,以平均頁面瀏覽量衡量的參與度變得更大。這伴隨著訂閱轉換率的降低,主要是因為遇到付費牆的註冊使用者數量減少。
相反,由於更嚴格的儀表限制,更多的摩擦也影響了讀者的習慣,有可能讓他們對我們的內容不感興趣。這反過來又影響了他們在長期內轉化為訂閱者的潛力。

從本質上講,動態儀表必須對轉換和參與進行最佳化,同時平衡兩者之間的權衡。

鑑於我們正在對兩個目標進行最佳化,即訂閱傾向和參與度,我們訓練兩個機器學習模型,我們稱之為 "基礎學習者"(公式1)。
這些基礎學習者的結構類似於一個流行的元學習者模型,稱為 "S-學習者"。
這樣的模型透過使用特徵X和處理變數T來預測目標變數。
這裡,處理變數T是一個分類變數,指定給每個註冊使用者的儀表限制。
這些特徵完全是由關於他們參與《紐約時報》內容的第一方資料決定的。
我們在模型中不使用任何人口統計學或心理學特徵,以避免對受保護階層的不公平偏見(我們致力於以公平和負責任的方式在《紐約時報》使用機器學習;你可以在這裡here找到關於我們在評論稽核方面的機器學習方法的討論)。

使用具有特徵X和相應待遇T的使用者的R.C.T.資料,我們可以擬合兩個機器學習模型,f和g,分別預測訂閱傾向(p)和歸一化參與(e)。
為了同時使這兩個目標最大化,我們用一個凸的線性組合將它們轉換成一個單一的目標s,該目標引入了權重係數δ,其值從0到1(公式2)。
它作為一個摩擦引數,允許我們明確地設定我們希望給予訂閱的重要性,而不是參與。
一旦設定了一定的δ,處方政策就會給使用者分配一個待遇,使綜合目標函式s最大化(公式3)。
該策略可以針對不同的δ值反覆應用,給出一組形成帕累託前沿的最佳解決方案。帕累託前沿通常是凸的,包含了至少在一個目標函式中優於其他所有解決方案,當我們沿著這個前沿移動時,其中一個目標函式會減少,而另一個則會增加。

詳細點選標題

相關文章