clubhouse使用機器學習實現人與聊天房間的匹配

banq發表於2022-05-05

早期,clubhouse開用簡單的啟發式方法對走廊上的房間進行排名,根據你有多少朋友在其中,或者房間的主題與你選擇的主題有多密切等等來挑選和推薦房間。
後來,我們已經轉向使用機器學習模型,它可以對走廊上的房間排名做出更細微的預測,從而提高整體質量。

我們的梯度提升決策樹(GBDT)排名模型是根據數百個量化你在過去房間活動的各種屬性的特徵來訓練的。
例如,該模型研究你是否在小型私人房間與大型公共房間中花費更多時間,或者你是否經常發言或喜歡傾聽,並利用這些來為你的房間進行最佳排名。
該模型還關注房間本身的特點,如其持續時間和參與者的數量,以及俱樂部的特點。
排名模型也接受使用者和俱樂部的嵌入向量作為輸入。
這些嵌入在使用者和俱樂部的互動資料上進行訓練,以建立使用者和俱樂部的密集表示。

該模型被訓練成一個分類器,目標是過去房間印象中的房間加入/不加入。每個房間的分類器得分,一個在0和1之間的值,被用來確定房間在走廊中的相對順序。

我們的模型訓練和推理系統在很多方面看起來像一個傳統的排名系統,但有一些關鍵的區別,這些區別來自於我們對現場房間進行排名的事實。迅速適應現場房間的變化和低預測延遲對於保持走廊的新鮮感和趣味性是最重要的。

詳細點選標題

相關文章