oracle中的數值資料儲存格式分析(ZT)

lawzjf發表於2006-04-23

原文網址 : http://blog.itpub.net/37724/viewspace-152532/

　Oracle的NUMBER型別最多由三個部分構成，這三個部分分別是最高位表示位、資料部分、符號位。其中負數包含符號位，正數不會包括符號位。另外，數值0比較特殊，它只包含一個數值最高位表示位80，沒有資料部分。

　　正數的最高位表示位大於80，負數的最高位表示位小於80。其中一個正數的最高位是個位的話，則最高位表示位為C1，百位、萬位依次為C2、C3，百分位、萬分為依次為C0、BF。一個負數的最高位為個位的話，最高位表示位為3E，百位、萬位依次為3D、3C，百分位、萬分位依次為3F、40。
　　

資料部分每一位都表示2位數。這個兩位數可能是從0到99，如果是資料本身是正數，則分別用二進位制的1到64表示，如果資料本身是負數，則使用二進位制65到2表示。

　　符號位用66表示。

　　上面的這些是我透過DUMP結果總結出來的，對於上面提到的這些關係常數，Oracle之所以這樣選擇是有道理的，我們後面根據例子也可以推匯出來，而且會進一步說明為什麼會採用這種方式表示。這裡列出的意思是使大家先對NUMBER型別資料有一個大概的瞭解。

　　下面我們透過一個例子詳細說明：

SQL> CREATE TABLE TEST_NUMBER (NUMBER_COL NUMBER);

表已建立。

SQL> INSERT INTO TEST_NUMBER VALUES (0);

已建立 1 行。

SQL> INSERT INTO TEST_NUMBER VALUES (1);

已建立 1 行。

SQL> INSERT INTO TEST_NUMBER VALUES (2);

已建立 1 行。

SQL> INSERT INTO TEST_NUMBER VALUES (25);

已建立 1 行。

SQL> INSERT INTO TEST_NUMBER VALUES (123);

已建立 1 行。

SQL> INSERT INTO TEST_NUMBER VALUES (4100);

已建立 1 行。

SQL> INSERT INTO TEST_NUMBER VALUES (132004078);

已建立 1 行。

SQL> INSERT INTO TEST_NUMBER VALUES (2.01);

已建立 1 行。

SQL> INSERT INTO TEST_NUMBER VALUES (0.3);

已建立 1 行。

SQL> INSERT INTO TEST_NUMBER VALUES (0.00000125);

已建立 1 行。

SQL> INSERT INTO TEST_NUMBER VALUES (115.200003);

已建立 1 行。

SQL> INSERT INTO TEST_NUMBER VALUES (-1);

已建立 1 行。

SQL> INSERT INTO TEST_NUMBER VALUES (-5);

已建立 1 行。

SQL> INSERT INTO TEST_NUMBER VALUES (-20032);

已建立 1 行。

SQL> INSERT INTO TEST_NUMBER VALUES (-234.432);

已建立 1 行。

SQL> COMMIT;

提交完成。

SQL> COL D_NUMBER FORMAT A50
SQL> SELECT NUMBER_COL, DUMP(NUMBER_COL, 16) D_NUMBER FROM TEST_NUMBER;

NUMBER_COL D_NUMBER
---------- --------------------------------------------------
0 Typ=2 Len=1: 80
1 Typ=2 Len=2: c1,2
2 Typ=2 Len=2: c1,3
25 Typ=2 Len=2: c1,1a
123 Typ=2 Len=3: c2,2,18
4100 Typ=2 Len=2: c2,2a
132004078 Typ=2 Len=6: c5,2,21,1,29,4f
2.01 Typ=2 Len=3: c1,3,2
.3 Typ=2 Len=2: c0,1f
.00000125 Typ=2 Len=3: be,2,1a
115.200003 Typ=2 Len=6: c2,2,10,15,1,4
-1 Typ=2 Len=3: 3e,64,66
-5 Typ=2 Len=3: 3e,60,66
-20032 Typ=2 Len=5: 3c,63,65,45,66
-234.432 Typ=2 Len=6: 3d,63,43,3a,51,66

已選擇15行。

下面根據例子得到的結果，對每行進行說明。首先說明兩點基本的。DUMP函式返回的TYPE＝2表示DUMP的資料型別是NUMBER，LENGTH＝N表示數值在資料庫中儲存的長度是N。

　　1.DUMP(0)的結果是0x80，在前面已經提到，0只有高位表示位，沒有資料位。由於0的特殊，既不屬於正數，也不屬於負數，因此使用高位表示位用80表示就足夠了，不會和其它資料衝突，Oracle出於節省空間的考慮將後面資料部分省掉了。但是為什麼Oracle選擇0x80表示0呢？我們知道正數和負數互為相反數，每個正數都有一個對應的負數。因此如果我們要使用編碼表示數值，則表示正數和負數的編碼應該各佔一半，這樣才能保證使Oracle表示資料範圍是合理的。而0x80的二進位制編碼是1000 0000，正好是一個位元組編碼最大值的一半，因此，Oracle選擇0x80來表示0，是十分有道理的。

　　2.DUMP(1)的結果是0xc102，0xc1表示了最高位個位，0x2表示數值是1。首先，Oracle為什麼用C1表示個位呢？其實，道理和剛才的差不多。採用科學計數法，任何一個實數S都可以描述為A.B×10n，A表示整數部分，B表示小數部分，而N表示10的指數部分。當S大於1時，N大於等於0，S小於1時，N小於0。也就是說，採用指數的方式表示，N大於0和N小於0的情況各佔一半左右時，Oracle所表示的範圍最廣。因此，Oracle選擇了C1表示個位是最高位的情況。

SQL> SELECT TO_CHAR(ROUND(TO_NUMBER('81', 'XXX') + (TO_NUMBER('FF', 'XXX') - TO_NUMBER('81', 'XXX') + 1)/2), 'XX') FROM DUAL;

TO_
---
C1

　　為什麼ORACLE使用0x2表示1，而不直接使用0x1表示1呢？Oracle每個位元組表示2位數，因此對於這個2位數，出現的可能是0～99共100種可能，問題出在0這裡。Oracle底層是用C語言實現的，我們知道二進位制0在C語言中用作字串終結符，Oracle為了避免這個問題，因此使用了0x1表示0，並依次類推，使用0x64表示99。

　　3.DUMP(2)的結果是0xc103。

　　4.DUMP(25)的結果是0xc11a。前面提到，資料部分是以2位為最小單位儲存的。因此對於25來說，最高位表示位仍然是個位，個位上的值是25，根據上面推出的規則，25在儲存為0xc11a。

SQL> SELECT TO_CHAR(25 + 1, 'xx') FROM DUAL;

TO_
---
1a

　　5.DUMP(123)的結果是0xc20218。由於123最高為是百位，所以最高位表示位為0xc2，百位上是1，用0x02表示，個位上是23，用0x18表示。

　　6.DUMP(4100)的結果是0xc22a。

　　注意一點，如果數字最後數位上如果是0，Oracle出於節省空間的考慮不會儲存。比如：4100只儲存百位上的41，12000000只儲存百位位上的12，512000只儲存萬位上的51和百位上的20。

　　7.DUMP(132004078)的結果是0xc5022101294f。最高位是億位，因此用0xC5表示，億位上是1用0x02表示，百位位上是32用0x21表示，萬位上是0用0x01表示，百位上是40用0x29表示，個位上78用0x4F表示。

　　注意：中間數位上的0不能省略。

　　8.DUMP(2.01)的結果是0xc10302。最高位是個位用0xC1表示，個位上是2用0x03表示，百分位上是1用0x02表示。

　　注意：個位下面一位是百分位不是十分位。

　　9.DUMP(0.3)的結果是0xc01f。最高位是百分位，使用0xC0表示，百分位上是30用0x1F表示。

　　10.DUMP(0.00000125)的結果是0xbe021a。最高位是百萬分位，用0xBE表示，最高位上的1用0x02表示，25用0x1a表示。

　　11.DUMP(115.200003)的結果是0xc20210150104。

　　12.DUMP(-1)的結果是0x3e6466。最高位個位，用0x3E表示，64表示個位上是1，66是符號位，表示這個數是負數。

　　負數和正數互為相反數，負數的最高位表示位和它對應的相反數的最高位相加的值是FF。1的最高位表示位是C1，-1的最高位表示位是3E。負數中1用64表示。負數中的數值和它相反數的資料相加是0x66，也就是符號位。正數1用0x02表示，負數1用0x64表示，二者相加是0x66。負數多個一個標識位，用0x66表示。由於正數的表示範圍是0x01到0x64，負數的表示範圍是0x65到0x02。因此，不會在表示數字時出現的0x66表示。

　　13.DUMP(-5)的結果是0x3e6066。0x3e表示最高位是個位，0x60表示個位上是5，0x66是符號標識位。0x3E加0xC1是0xFF。0x60加0x06的結果是0x66。

　　14.DUMP(-20032)的結果是0x3c63654566。最高位是萬位，正數的萬位是0xC3，因此負數的萬位是0x3C。萬位上是2，正數用0x03表示，負數為0x63，百位上是0，正數用0x01表示，負數使用0x65表示，個位上是32，正數用0x21表示，負數使用0x45表示。0x66是負數表示位。

　　15.DUMP(-234.432)的結果是0x3d63433a5166。

　　根據Oracle的儲存特性，還可以推出Oracle的number型別的取值範圍。

　　Oracle的concept上是這樣描述的：

The following numbers can be stored in a NUMBER column:

Positive numbers in the range 1 x 10^-130 to 9.99...9 x 10^125 with up to 38 significant digits.

Negative numbers from -1 x 10^-130 to 9.99...99 x 10^125 with up to 38 significant digits.

Zero.

　　下面來推匯出取值範圍。

來看符號位，0xC1表示個位。

SQL> select to_number('ff', 'xxx') - to_number('c1', 'xxx') from dual;

TO_NUMBER('FF','XXX')-TO_NUMBER('C1','XXX')
-------------------------------------------
62

　　由於Oracle是兩位、兩位儲存的，因此最高位相當於62×2=124，而且最高位上最大值是99，因此正數的最大值為9.999……×10^125。

SQL> select to_number('c1', 'xxx') - to_number('80', 'xxx') from dual;

TO_NUMBER('C1','XXX')-TO_NUMBER('80','XXX')
-------------------------------------------
65

　　最高位相當於65×2=130，因此正數的最小值為1×10^-130。

　　負數和正數在各使用了一半的編碼，因此具有相同的極值範圍。

來自 “ ITPUB部落格 ” ，連結：http://blog.itpub.net/37724/viewspace-152532/，如需轉載，請註明出處，否則將追究法律責任。

相關文章

Oracle基本資料型別儲存格式淺析——RAW型別
2020-03-31
Oracle資料型別
redis-5.資料儲存格式
2021-01-13
Redis
oracle儲存過程書寫格式
2020-07-14
Oracle儲存過程
oracle使用儲存過程將表資料以excel格式匯出
2024-07-24
Oracle儲存過程Excel
數值資訊的機器級儲存
2018-03-14
TIDB儲存TiKV的鍵值對資料
2024-05-26
TiDB
Android中的資料儲存之檔案儲存
2020-03-11
Android
比較 Apache Hadoop 資料儲存格式 - techwell
2021-12-24
ApacheHadoop
Bond——大資料時代的資料交換和儲存格式
2024-07-08
大資料
[20191219]oracle timestamp資料型別的儲存.txt
2019-12-19
Oracle資料型別
Druid：實時分析資料儲存
2022-12-04
UI
3 python的數值在記憶體中如何儲存
2024-03-19
Python記憶體
iOS開發資料儲存篇—iOS中的幾種資料儲存方式
2018-11-29
iOS
YottaChain：數字貨幣YTA助力資料儲存創造價值
2019-08-24
AI
oracle RAC 更換儲存遷移資料
2018-03-12
Oracle
一個數值儲存核取方塊的值
2018-08-23
修改Oracle資料庫字符集(zt)
2019-03-28
Oracle資料庫
資料載入、儲存及檔案格式知識圖譜-《利用Python進行資料分析》
2020-07-11
Python
記憶體中的資料儲存
2019-10-03
記憶體
Android中的資料儲存之SharedPreferences
2020-03-12
Android
【Redis】redis各型別資料儲存分析
2019-03-03
Redis型別
Mysql 行的儲存格式
2021-12-09
MySql
[20241009]oracle timestamp with time zone資料型別的儲存.txt
2024-10-09
Oracle資料型別
Oracle 10g RAC 資料儲存更換
2021-02-03
Oracle 10g
資料儲存--檔案儲存
2024-05-26
Oracle資料塊格式
2020-01-17
Oracle
mysql 儲存過程中變數的定義與賦值操作
2021-09-09
MySql儲存過程變數賦值
mysql儲存資料，varchar型別中的資料變成了科學計數法？
2020-09-24
MySql型別
EMC儲存Raid故障資料分析報告
2019-05-28
AI
electron-store會將資料儲存為什麼格式
2024-04-21
oracle的儲存過程
2018-04-02
Oracle儲存過程
資料儲存(1)：從資料儲存看人類文明-資料儲存器發展歷程
2020-07-27
【融雲分析】從過剩儲存資源到分散式時序資料庫的長儲存
2019-03-15
分散式資料庫
軟體定義儲存助力數字中國建設：智慧高效又經濟的資料儲存方式
2021-05-27
分散式儲存中的資料分佈策略
2018-11-22
分散式
JavaScript中的資料型別-儲存差別
2024-09-05
JavaScript資料型別
MySql資料儲存格式Compact及計算MySql的B+Tree高度
2022-02-08
MySql
聚焦資料時代新儲存需求，浪潮儲存的新儲存之道
2020-12-03
Python匯入Excel表格資料並以字典dict格式儲存
2023-01-18
PythonExcel