基於使用者投票的排名演算法：Stack Overflow

發表於2012-03-26

原文網址 : http://blog.jobbole.com/16146/

演算法

來源：阮一峰

上一篇文章，我介紹了Reddit 的排名演算法。

它的特點是，使用者可以投贊成票，也可以投反對票。也就是說，除了時間因素以外，只要考慮兩個變數就夠了。

但是，還有一些特定用途的網站，必須考慮更多的因素。世界排名第一的程式設計師問答社群Stack Overflow，就是這樣一個網站。

你在上面提出各種關於程式設計的問題，等待別人回答。訪問者可以對你的問題進行投票（贊成票或反對票），表示這個問題是不是有價值。

一旦有人回答了你的問題，其他人也可以對這個回答投票（贊成票或反對票）。

排名演算法的作用是，找出某段時間內的熱點問題，即哪些問題最被關注、得到了最多的討論。

在Stack Overflow的頁面上，每個問題前面有三個數字，分別表示問題的得分、回答的數目和該問題的瀏覽次數。以這些變數為基礎，就可以設計演算法了。

創始人之一的Jeff Atwood，曾經在幾年前，公佈過排名得分的計算公式。

寫成php程式碼，就是下面這樣：

各個演算法變數的含義如下：

（1）Qviews（問題的瀏覽次數）

某個問題的瀏覽次數越多，就代表越受關注，得分也就越高。這裡使用了以10為底的對數，用意是當訪問量越來越大，它對得分的影響將不斷變小。

（2）Qscore（問題得分）和Qanswers（回答的數量）

首先，Qscore（問題得分）= 贊成票-反對票。如果某個問題越受到好評，排名自然應該越靠前。

Qanswers表示回答的數量，代表有多少人蔘與這個問題。這個值越大，得分將成倍放大。這裡需要注意的是，如果無人回答，Qanswers就等於0，這時Qscore再高也沒用，意味著再好的問題，也必須有人回答，否則進不了熱點問題排行榜。

（3）Ascores（回答得分）

一般來說，”回答”比”問題”更有意義。這一項的得分越高，就代表回答的質量越高。

但是我感覺，簡單加總的設計還不夠全面。這裡有兩個問題。首先，一個正確的回答勝過一百個無用的回答，但是，簡單加總會導致，1個得分為100的回答與100個得分為1的回答，總得分相同。其次，由於得分會出現負值，因此那些特別差的回答，會拉低正確回答的得分。

（4）Qage（距離問題發表的時間）和Qupdated（距離最後一個回答的時間）

改寫一下，可以看得更清楚：

Qage和Qupdated的單位都是秒。如果一個問題的存在時間越久，或者距離上一次回答的時間越久，Qage和Qupdated的值就相應增大。

也就是說，隨著時間流逝，這兩個值都會越變越大，導致分母增大，因此總得分會越來越小。

（５）總結

Stack Overflow熱點問題的排名，與參與度（Qviews和Qanswers）和質量（Qscore和Ascores）成正比，與時間（Qage和Qupdated）成反比。

（完）

stack overflow
2019-03-10
有趣的BUG之Stack Overflow
2022-05-23
Windows Kernel Exploitation Notes(一)——HEVD Stack Overflow
2021-06-29
Windows
Elastic stack(基於7.0.0)
2019-04-28
AST
AutoEx應用崩潰自動匹配Stack Overflow的解答
2019-02-22
應用崩潰
Stack Overflow：2020 年開發人員調查
2020-06-16
Stack Overflow 宣佈：將於 3 月 31 日中斷 Jobs、Developer Story 等功能
2022-01-31
Developer
Stack Overflow：2019全球程式語言高薪排行榜
2019-08-19
高薪
每日安全資訊：Stack Overflow 遭遇黑客攻擊
2019-05-18
黑客
千萬條資料，Stack Overflow 是如何實現快速分頁的？
2018-05-02
Stack Overflow：2019年全球開發者調查報告
2019-04-10
全球程式語言薪資排行榜（Stack Overflow）_2019.08
2019-08-22
Stack Overflow 2018 開發者調查報告出爐
2018-03-24
每日安全資訊：Stack Overflow 安全事件新進展：部分使用者私人資訊遭竊
2019-05-19
事件
哪門程式語言更賺錢？看看 Stack Overflow 的最新調查
2018-09-16
win10網頁出現stack overflow at line 0的解決方法
2019-12-19
Win10網頁
2021年Stack Overflow程式設計師開發者調查
2021-08-06
程式設計師
Stack Overflow首席大神，他回答了超過3萬個問題
2018-12-19
動手做：構建模型來預測Stack Overflow中的問題標籤
2019-05-13
模型
基於JSP自定義投票網站系統設計
2020-10-25
JS網站
使用ChatGPT人工智慧回答國外知乎Stack Overflow上問題？
2022-12-06
ChatGPT人工智慧
在叢集環境中執行的Spring計劃排程任務 - Stack Overflow
2020-12-14
Spring
Stack Overflow：2020年全球開發者調查報告 TypeScript擊敗 Python
2020-05-28
TypeScriptPython
Stack Overflow遭遇黑客攻擊目前沒有證據表明資料被竊
2019-05-18
黑客
爆火的ChatGPT太強了！寫程式碼、改bug，網友：可取代Stack Overflow了
2022-12-05
ChatGPT
Stack Overflow：2018年第8次程式設計師界人口普查報告
2018-09-25
程式設計師
[LeetCode] 1366. Rank Teams by Votes 透過投票對團隊排名
2024-07-06
LeetCode
Elastic Stack基礎概念
2022-01-29
AST
最新進展|關於Python治理模式的投票
2018-12-09
Python模式
Redis Stack：基於Redis的搜尋、文件、圖形和時間序列功能
2022-03-26
Redis
Kernel pwn 基礎教程之 Heap Overflow
2022-04-22
基於 Nebula Graph 的 BetweennessCentrality 演算法
2022-04-19
演算法
研究發現從 Stack Overflow 複製程式碼的習慣導致 GitHub 專案安全性下降
2019-10-28
Github
overflow
2020-12-19
優化的求眾數方法 - 摩爾投票演算法（演算法思想+求眾數的三種方法+摩爾投票演算法改進版求眾數 II）
2019-03-26
優化演算法
美國西弗吉尼亞州完成首例基於區塊鏈的州選舉投票
2018-05-12
區塊鏈
Pandas 基礎 (12) - Stack 和 Unstack
2019-04-14
基於圖的機器演算法（一）
2019-02-25
演算法
[譯] 基於評論的機器學習線上課程排名
2019-03-03
機器學習

基於使用者投票的排名演算法：Stack Overflow

相關文章