對於隨機數的一些分析

jeanron100發表於2018-03-28
對於隨機數的一些分析

多年前我朋友圈的一個朋友公司年會抽獎出現了下面的這樣一幕:CTO現場review程式碼。本來帶著一絲娛樂精神,結果被無限放大了。所以年會中大家都會很自然想review下程式碼。

對於隨機數的一些分析

比如這種姿勢:

對於隨機數的一些分析

然後就開始review程式碼。

對於隨機數的一些分析

我們就開幾個腦洞,來從我的理解來說一下隨機數的情況。

生成一個隨機數看起來很簡單,實則不易,怎麼讓一個確定的值得到一個不確定的值,這個想起來都有點困難,所以如果自己想實現,結果發現遠比自己琢磨的要複雜的多,如果放眼程式領域,就拿Java來說,Java不同版本中對於隨機演算法的實現是有差別的。

比如Random的方法在JDK6中會使用System.nanoTime()的方式,而在早期的版本是使用currentTimeMillis,相比而言,nanoTime是以毫微秒為單位,而currentTimeMillis返回的是系統當前時間和1970-01-01之前間隔時間的毫秒數。

而且在隨機演算法的實現細節上,也有一些差別。

關於隨機演算法,還有一本書,這本書有400多頁,涉及的面非常廣。

對於隨機數的一些分析

而如果我們不寫SQL行不行,肯定可以,因為對於DBA來說,SQL能做任何想做的事情。

比如要得到一個隨機數,寫SQL其實有很多中寫法。比如限定資料的範圍是7~12,可以這樣寫。

mysql> SELECT FLOOR(7 + (RAND() * 6));

+-------------------------+

| FLOOR(7 + (RAND() * 6)) |

+-------------------------+

| 10 |

+-------------------------+

1 row in set

比如限定的資料範圍是100以內,可以這樣寫。

mysql> select truncate(round(rand(),2)*100,0);

+---------------------------------+

| truncate(round(rand(),2)*100,0) |

+---------------------------------+

| 78 |

+---------------------------------+

當然這樣只是最基本的實現,還沒有考慮到種子函式的影響。

我們暫且拋開實現的複雜度,來看看結合一些場景的不同實現,我臨時自造了幾個概念,但是意思應該是相通的。

平均隨機數

這是一種看起來隨機,但是資料分佈又可控的方式。

比如1~100我生成10個數字,我可以每10個數字分為1組。每組做一個隨機。

這樣我對1~10生成一個隨機序列,比如第一個隨機數是2,我就從20~29裡面選擇一個數字,下一數字是5,則從50~59裡面選出1個數字。

對於隨機數的一些分析

透過這種方式資料的分佈方式決定是可控的,但是又保證了隨機的特性。

一次性隨機數

這類隨機數就好比陝西的油潑面一樣,簡單快捷,一勺油即可搞定。如果我需要10個數字,那麼我一次就生成10個隨機數字。

看起來實現有些難,其實還好,使用rand()和limit即可。

插入8條資料。

mysql> insert into random values

(1),(2),(40),(30),(20),(9),(15),(21);

Query OK, 8 rows affected

Records: 8 Duplicates: 0 Warnings: 0

預設得到的資料是有序的。

mysql> select *from random;

+----+

| id |

+----+

| 1 |

| 2 |

| 40 |

| 30 |

| 20 |

| 9 |

| 15 |

| 21 |

+----+

8 rows in set

使用rand來得到一個隨機序列。

mysql> select *from random order by rand();

+----+

| id |

+----+

| 1 |

| 2 |

| 30 |

| 20 |

| 40 |

| 21 |

| 15 |

| 9 |

+----+

8 rows in set

如果需要擷取,就可以使用limit了。

mysql> select *from random order by rand() limit 4;

+----+

| id |

+----+

| 30 |

| 21 |

| 9 |

| 20 |

+----+

4 rows in set

動態隨機數

這類隨機數的代價最高,需要反覆計算。總之不確定性要高很多,但是隨機性更大。

比如對100個數中取出10個數,我們每取出一個數,就需要把它排除掉,從列表裡重新再取,這樣如果是連續的數字 1 2 3也是有可能的。

我們來透過SQL來簡答模擬一下抽獎的過程。

初始化表數和資料。

create table lucky_money(id int primary key,money int,status smallint);

儲存過程如下:

delimiter $$

create procedure proc_init ()

begin

declare

init_data integer default 1;

while init_data<=1500 do

insert into lucky_money values(init_data,0,0);

set init_data = init_data +1;

end while;

end $$

delimiter ;

call proc_init();

得到的資料是有序的。即員工號。

| 1497 | 0 | 0 |

| 1498 | 0 | 0 |

| 1499 | 0 | 0 |

| 1500 | 0 | 0 |

+------+-------+--------+

1500 rows in set

我們修改狀態,隨機得到一些資料的變化。

update lucky_money set money=1000,status=1 order by rand() limit 200;

update lucky_money set money=3000,status=1 where status=0 order by rand() limit 80;

update lucky_money set money=5000,status=1 where status=0 order by rand() limit 20;

所以第一輪之後,平均獎金是360元。

mysql> select avg(money) from lucky_money;

+------------+

| avg(money) |

+------------+

| 360.0000 |

+------------+

1 row in set

來自 “ ITPUB部落格 ” ,連結:http://blog.itpub.net/23718752/viewspace-2152327/,如需轉載,請註明出處,否則將追究法律責任。

相關文章