在日常生活中,隨機數實際上經常遇到,想丟骰子,抓鬮,還有抽籤。呵呵,非常簡單就可以實現。那麼在做程式設計,真的要通過自己程式設計出隨機數那還真的不簡單了。現在很多都是作業系統核心會提供相應的api,這些原始引數是獲取一些計算機執行原始資訊,如記憶體,電壓,物理訊號等等,它的值在一個時間段可以保證是唯一的了。好了,廢話我就不說了。呵呵。
shell指令碼程式我們有那些獲得隨機數方法呢?
一、通過時間獲得隨機數(date)
這個也是我們經常用到的,可以說時間是唯一的,也不會重複的,從這個裡面獲得同一時間的唯一值。適應所有程式裡面了。
例子:
1 2 3 4 5 6 7 8 9 10 11 12 13 |
[chengmo@centos5 shell]$ date +%s 1287764773 #獲得時間戳,當前到:1970-01-01 00:00:00 相隔的秒數 #如果用它做隨機數,相同一秒的資料是一樣的。在做迴圈處理,多執行緒裡面基本不能滿足要求了。 [chengmo@centos5 shell]$ date +%N 738710457 #獲得當前時間的納秒資料,精確到億分之一秒。 #這個相當精確了,就算在多cpu,大量迴圈裡面,同一秒裡面,也很難出現相同結果,不過不同時間裡面還會有大量重複碰撞 [chengmo@centos5 shell]$ date +%s%N 1287764807051101270 #這個可以說比較完美了,加入了時間戳,又加上了納秒 |
通過上面說明,用它來做隨機數的基數了,接下來我們看怎麼樣獲得一段資料內怎麼樣獲得隨機數。
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 |
#!/bin/sh #寫個隨機函式,呼叫方法random min max #在min 與 max直接獲得隨機整數 #copyright chengmo QQ:8292669 #獲得隨機數返回值,shell函式裡算出隨機數後,更新該值 function random() { min=$1; max=$2-$1; num=$(date +%s+%N); ((retnum=num%max+min)); #進行求餘數運算即可 echo $retnum; #這裡通過echo 列印出來值,然後獲得函式的,stdout就可以獲得值 #還有一種返回,定義全價變數,然後函式改下內容,外面讀取 } #得到1-10的seq資料項 for i in {1..10}; do out=$(random 2 10000); echo $i,"2-10000",$out; done; |
看看執行結果:
[chengmo@centos5 shell]$ sh testrandom.sh
1,2-10000,5600
2,2-10000,5295
3,2-10000,3432
4,2-10000,3148
5,2-10000,9041
6,2-10000,4290
7,2-10000,2380
8,2-10000,9009
9,2-10000,5474
10,2-10000,3664
一個迴圈裡面,得到值各不相同。
這個是我們常用方法,適應各種語言,是一個通用演算法,就算伺服器不提供,某時刻相同唯一資料標記,我們也可以通過這種方法,做自己的偽隨機數。下面還有更簡單方法呢,不要我們自己做了。
2、通過內部系統變數($RANDOM)
其實,linux已經提供有個系統環境變數了,直接就是隨機數,哈哈,覺得剛學習方法,是不是白費了!!
1 2 3 4 5 6 |
[chengmo@centos5 shell]$ echo $RANDOM 10918 [chengmo@centos5 shell]$ echo $RANDOM 10001 #連續2次訪問,結果不一樣,這個資料是一個小於或等於5位的整數 |
可能有疑問了,如果超過5位的隨機數怎麼得到呢?
呵呵,加個固定10位整數,然後進行求餘,跟例1 一樣了。接下來的例子又是我們自立更生做了。
3、通過系統內部唯一資料生成隨機數(/dev/random,urandom)
我們知道dev目錄下面,是linux一些預設裝置,它給我們感覺就是放的是鍵盤,硬碟,光碟機等裝置的對應檔案了。 其實linux有些裝置很特殊,有特殊用途。前面我們說到的:/dev/[udp|tcp]/host/port比較特殊吧。呵呵,有扯遠了。
/dev/random裝置,儲存著系統當前執行的環境的實時資料。它可以看作是系統某個時候,唯一值資料,因此可以用作隨機數後設資料。我們可以通過檔案讀取方式,讀得裡面資料。/dev/urandom這個裝置資料與random裡面一樣。只是,它是非阻塞的隨機數發生器,讀取操作不會產生阻塞。
例項:
1 2 3 4 5 6 7 8 9 10 11 12 13 14 |
[chengmo@centos5 shell]$ head -1 /dev/urandom ãņù…•KTþçanVÕã¹Û&¡õ¾“ô2íùU“ žF¦_ ÿ”†mEðûUráÏ=J¯TŸA•ÌAÚRtÓ #讀一行,怎麼是亂碼呢?其實它是通過二進位制資料儲存實時資料的,那麼我們怎麼樣把它變成整型資料呢? [chengmo@centos5 ~/shell]$ head -200 /dev/urandom | cksum 1615228479 50333 #由於urandom的資料是非常多,不能直接通過cat讀取,這裡取前200行,其實整個資料都是變化的,取多少也一樣是唯一的。 #cksum 將讀取檔案內容,生成唯一的表示整型資料,只有檔案內容不變,生成結果就不會變化,與php crc函式 [chengmo@centos5 shell]$ head -200 /dev/urandom | cksum | cut -f1 -d" " 484750180 #cut 以” “分割,然後得到分割的第一個欄位資料 |
得到整型資料,然後,類似一的方法就可以獲得到隨機數了。 題外話:在程式裡面,我們經常md5得到唯一值,然後是字串的,如果想表示成整型方式,可以通過crc函式.crc是迴圈冗餘校驗,相同資料通過運算,都會得到一串整型資料。現在這種驗證應用很廣。詳細要了解,可以參考:crc.
下面還有個方法,直接從裝置讀取生成好的uuid碼。
4、讀取linux 的uuid碼
在提到這個之前,有個概念,就是什麼是uuid呢?
UUID碼全稱是通用唯一識別碼 (Universally Unique Identifier, UUID),它 是一個軟體建構的標準,亦為自由軟體基金會 (Open Software Foundation, OSF) 的組織在分散式計算環境 (Distributed Computing Environment, DCE) 領域的一部份。
UUID 的目的,是讓分散式系統中的所有元素,都能有唯一的辨識資訊,而不需要通過中央控制端來做辨識資訊的指定。如此一來,每個人都可以建立不與其它人衝突的 UUID。在這樣的情況下,就不需考慮資料庫建立時的名稱重複問題。它會讓網路任何一臺計算機所生成的uuid碼,都是網際網路整個伺服器網路中唯一的。它的原資訊會加入硬體,時間,機器當前執行資訊等等。
UUID格式是:包含32個16進位數字,以“-”連線號分為五段,形式為8-4-4-4-12的32個字元。範例;550e8400-e29b-41d4-a716-446655440000 ,所以:UUID理論上的總數為216 x 8=2128,約等於3.4 x 1038。 也就是說若每奈秒產生1兆個UUID,要花100億年才會將所有UUID用完。
其實,大家做資料庫設計時候,肯定聽說過,guid(全域性唯一識別符號)碼,它其實是與uuid類似,由微軟支援。 這裡編碼,基本有作業系統核心產生。大家記得把,在windows裡面,無論資料庫,還是其它軟體,很容易得到這個uuid編碼。
linux 的uuid碼
linux的uuid碼也是有核心提供的,在/proc/sys/kernel/random/uuid這個檔案內。其實,random目錄,裡面還有很多其它檔案,都與生成uuid有關係的。
1 2 3 4 5 6 7 8 9 |
[chengmo@centos5 ~/shell]$ cat /proc/sys/kernel/random/uuid dff68213-b700-4947-87b1-d9e640334196 [chengmo@centos5 ~/shell]$ cat /proc/sys/kernel/random/uuid 7b57209a-d285-4fd0-88b4-9d3162d2e1bc #連續2次讀取,得到的uuid是不同的 [chengmo@centos5 ~/shell]$ cat /proc/sys/kernel/random/uuid| cksum | cut -f1 -d" " 2141807556 #同上方法得到隨機整數 |
這是linux下面,幾種常見活動隨機數整數方法,除了第一個是不同外,其實後3個,產生隨機碼的偽資料來源,都與/dev/random裝置有關係。只是它們各自呈現不同而已。如果你還有更多其它方法,請給我訊息,與大家分享了。