PHP+Redis 有序集合實現 24 小時排行榜實時更新

xugege發表於2019-06-24

基本介紹

Redis 有序集合和集合一樣也是string型別元素的集合,且不允許重複的成員。
不同的是每個元素都會關聯一個double型別的分數。redis正是通過分數來為集合中的成員進行從小到大的排序。
有序集合的成員是唯一的,但分數(score)卻可以重複。
集合是通過雜湊表實現的,所以新增,刪除,查詢的複雜度都是O(1)。 集合中最大的成員數為 2^32 - 1^ (4294967295, 每個集合可儲存40多億個成員)。
有序集合首先是集合,其成員(member)具有唯一性,其次,每個成員關聯了一個分數(score),使得成員可以按照分數排序。

需求描述

設想在一個遊戲中,有上百萬的玩家資料,如果現在需要你根據玩家的經驗值整理一個前10名的排行榜,你會怎麼做呢?一般的做法是寫一條類似下面這條sql語句的方式來獲取:

    select * from game_socre order by score desc limit 0,20

這種方式在資料量較小的情況下可行,但是在資料量大的情況下查詢速度將變慢,特別是還需要聯表查詢時,速度下降的就更明顯了。

實現

這時你可以考慮使用redis來實現這個功能。
實現這個功能主要用到的redis資料型別是redis的有序集合zset。zset 是set 型別的一個擴充套件,比原有的型別多了一個順序屬性.此屬性在每次插入資料時會自動調整順序值,保證value值按照一定順序連續排列。
主要的實現思路是:
1、在一個新的玩家參與到遊戲中時,在redis中的zset中新增一條記錄(記錄內容看具體的需求)score為0
2、當玩家的經驗值發生變化時,修改該玩家的score值
3、使用redis的ZREVRANGE方法獲取排行榜
返回有序集key中,指定區間內的成員。其中成員的位置按score值遞減(從大到小)來排列。具有相同score值的成員按字典序的反序排列。 除了成員按score值遞減的次序排列這一點外,ZREVRANGE命令的其他方面和ZRANGE命令一樣。
redis 127.0.0.1:6379> ZADD KEY_NAME SCORE1 VALUE1.. SCOREN VALUEN

  • 1、資料準備

php+redis有序集合實現24小時排行榜實時更新

  • 2、獲取score高分top10排名(ZREVRANGE為降序,ZRANGE為升序)

php+redis有序集合實現24小時排行榜實時更新

  • 3、檢視使用者ee的實際排名(ZREVRANK為降序,ZRANK為升序)、實時分數

php+redis有序集合實現24小時排行榜實時更新

進一步需求

需要實現最近的24小時使用者積分排行榜,並統計前10名的玩家和積分

實現

主要的實現思路是:
利用ZADD按小時劃分新增使用者的積分資訊,然後用ZUNIONSTORE並集實現24小時的遊戲積分總和,實現“24小時排行榜”;(如果有更好的思路,能夠在下方留言不吝賜教一下就更好了)

    ZUNIONSTORE destination numkeys key [key ...]
    Redis Zunionstore 命令計算給定的一個或多個有序集的並集,其中給定 key 的數量必須以 numkeys 引數指定,並     將該並集(結果集)儲存到 destination 。
    預設情況下,結果集中某個成員的分數值是所有給定集下該成員分數值之和 。

可能碰到的問題

  • 1、相同分數問題
    Redis在遇到分數相同時是按照集合成員自身的字典順序來排序,這裡即是按照”user2″和”user3″這兩個字串進行排序,以逆序排序的話user3自然排到了前面。要解決這個問題,我們可以考慮在分數中加入時間戳,計算公式為:
    帶時間戳的分數 = 實際分數*10000000000 + (9999999999 – timestamp)

    timestamp我們採用系統提供的time()函式,也就是1970年1月1日以來的秒數,我們採用32位的時間戳(這能堅持到2038年),由於32位時間戳是10位十進位制整數(最大值4294967295),所以我們讓時間戳佔據低10位(十進位制整數),實際分數則擴大10^10倍,然後把兩部分相加的結果作為zset的分數。考慮到要按時間倒序排列,所以時間戳這部分需要顛倒一下,這便是用9999999999減去時間戳的原因。當我們要讀取玩家實際分數時,只需去掉後10位即可。
    初步看起來這個方案還不錯,但這裡面有兩個問題。
    第一個問題是小問題,採用秒為時間戳可能區分度還不夠,如果同一秒出現兩個分數相同的仍然會出現前面的問題,當然我們可以選擇精度更高的時間戳,但在實際場景中,同一秒誰排前面已經無關緊要。
    第二個問題是大問題,因為Redis的分數型別採用的是double,64位雙精度浮點數只有52位有效數字,它能精確表達的整數範圍為-2^53到2^53,最高只能表示16位十進位制整數(最大值為9007199254740992,其實連16位也不能完整表示)。這就是說,如果前面時間戳佔了10位的話,分數就只剩下6位了,這對於某些排行榜分數來說是不夠用的。我們可以考慮縮減時間戳位數,比如從2015年1月1日開始計時,但這仍然增加不了幾位。或者減少區分度,以分鐘、小時來作為時間戳單位。
    如果Redis的分數型別為int64,我們就沒有上面的煩惱。說到這裡,其實Redis真應該再額外提供一個int64型別的ZSet,但目前只能是幻想,除非自己改其原始碼。

本作品採用《CC 協議》,轉載必須註明作者和本文連結

相關文章