浮點運算簡介(part I)... (6千字)

看雪資料發表於2002-03-31

浮點運算簡介

                                        Hume/冷雨飄心

對於習慣於C的靈活多變的資料型別和方便的計算那些人而言,瞭解底層的浮點運算似乎沒有什麼意義,現在Visual盛行的時代還有多少人關心那些所謂的底層呢?
對了AfOs來說,浮點運算是程式設計中很重要的一部分,因為我們可能會面臨一些稍微複雜的運算,如果你和我一樣是Die-hard的asm擁護者,不想輕易用C來解決問題,你肯定能想像在asm下用整數運算求sin(2.3)的痛苦,實際上,微機早就為我們準備瞭解決之道:那就是浮點運算.但現在關於浮點運算的資料較少,相信很多人和我一樣還不掌握這種強有力的技術,那好,我們一起來學習學習.
                     


                                (一)浮點數
                                    (This Part mainly Froe Bill's Article)
在這之前,先來看幾個術語:
FPU->Floating Point Unit,浮點運算部件
BCD->Binary Coded Decimal 壓縮的二十進位制數,是用4個位來表示數字0~9,一個byte表示兩個十進位制數,比如01111001表示89
科學計數法:這是科學的~~~~具體含義查查初中還是小學的數學課本 D:)

浮點運算使用三種不同的資料:
        1)整數(Integer),又分為字,短整數(Short Integer)和長整數(Long Integer)
        2)實數(Real)分單精度(Single Real)和雙精度(Double Real)
        3)壓縮的二十進位制數(BCD)
   
    下面是其位數(bits)和能表示的大致範圍和


        Type            Length          Range
        -----------------------------------------------
        Word Integer    16 bit          -32768 to 32768
        Short Integer  32 bit          -2.14e9 to 2.14e9
        Long Integer    64 bit          -9.22e18 to 9.22e18
        Single Real    32 bit          1.18e-38 to 3.40e38
        Double Real    64 bit          2.23e-308 to 1.79e308
        extended Real  80 bit          3.37e-1932 to 1.18e4932
        Packed BCD      80 bit          -1e18 to 1e18

雙精度數和擴充套件精度數表示範圍對一般應用來說已經足夠大了!

1)整數,以補碼形式儲存,正數的補碼是其本身,負數補碼是其絕對值的各位變反後加1,下面是實際儲存的例子:
        0024            var1 dw 24
        FFFE            var2 dw -2
        000004D2        var3 dd 1234
        FFFFFF85        var4 dd -123
        0000000000002694var5 dq 9876
        FFFFFFFFFFFFFEBFvar6 dq -321

2)BCD數
        在FPU中用80位表示正好是浮點堆暫存器的寬度,在其格式如下儲存:
    Bit
        79___72_71________________________________________0
        符號            ---18個二十進位制數--------
看下面的例子:
        00000000000000012345        var1  dt    12345
        80000000000000000100        var2  dt    -100

3)浮點數,這個複雜點,有三種格式

        單精度:_31_30________23_22___________0
              符號    指數        有效數

        雙精度:_63_62__________52_51__________________0
              符號    指數            有效數

        擴充套件精度數:
              _79_78____________64_63___________________0
              符號    指數              有效數
例子:
        C377999A                    var1  dd      -247.6
        40000000                    var2  dd      2.0
        486F4200                    var3  real4  2.45e+5
        4059100000000000            var4  dq      100.25
        3F543BF727136A40            var5  real8  0.00123

        C377999A                    var1  dd      -247.6
        40000000                    var2  dd      2.0
        486F4200                    var3  real4  2.45e+5
        4059100000000000            var4  dq      100.25
        3F543BF727136A40            var5  real8  0.001235
        400487F34D6A161E4F76        var6  real10  33.9876

DD和real4都可以在asm中來定義單精度浮點數,4 bytes
DQ和real8都可以在asm中來定義雙精度浮點數,8 bytes
DT和real10都可以在asm中來定義擴充套件精度浮點數,10 bytes
                       
                        (二)浮點部件

FPU從功能上分為兩個部分:控制單元和運算單元,控制單元主要面向CPU,而算數單元負責具體算數運算.
FPU即浮點部件包括8個通用暫存器,5個錯誤指標暫存器和三個控制暫存器.

1)8個通用暫存器每個80 bit,形成一個暫存器堆疊,所有的計算結果都儲存在暫存器堆疊中,其中資料全部是80位的擴充套件精度格式,即使是BCD,整數,單精度和雙精度等在裝入暫存器的時候都要被FPU自動轉化為80位的擴充套件精度格式,注意棧頂通常表示為ST(0),然後是ST(1)...ST(i),ST(i)是相對於棧頂而言的.

和堆疊很相似,只不過寬度為80bit,映像如下:
                _______________________
              |        ST(0)          |     
              |_______________________|
              |        ST(1)          |
              |_______________________|
              |    ......            |
              |    ......            |
              |        ST(i)          |           
              |_______________________|

2)控制暫存器,FPU有三個控制暫存器:狀態暫存器,控制暫存器和標記暫存器

狀態暫存器->SW
        _M_____D________10___9____8___7_________5_________________________0__
      |  B |  C3| TOP| C2 | C1 | C0 | ES |    | PE | UE | OE | ZE | DE | IE |
      |____|____|____|____|____|____|____|____|____|____|____|____|____|____|

B:    浮點部件正忙
C0-C3  指示浮點運算的結果,不同指令有不同含義
TOP    指示棧頂,通常是0
ES 以下任何位置位 (pe, ue, oe, ze, de, or ie) 則置位
PE 精度故障 
UE 數字太小無法表示溢位 
OE 現有精度無法表示,數字太大溢位 
ZE 除0錯 
DE 指示至少有一個運算元未規格化 
IE 無效錯誤,指示堆疊上溢或下溢,無效運算元等


控制暫存器:
        _15____________10___9____8___7_________5______________________0__
      |              |IC | RC | PC  |    | PM | UM | OM | ZM | DM | IM |
      |____|____|____|___|__|_|__|__|____|____|____|____|____|____|____|

IC 無窮大控制,對486,已經無效
RC 舍入控制
        00 = 朝最接近或者偶數舍入
        01 = 朝負無窮大方向舍入
        10 = 朝正無窮大方向舍入
        11 = 超0方向截斷
PC 精度控制
        00 = 單精度
        01 = 保留
        10 = 雙精度
        11 = 擴充套件精度
PM~IM 遮蔽狀態暫存器低5位指示的錯誤.為1則遮蔽.


標記暫存器:
        每2 bit表示一個對應堆疊暫存器的狀態,具體含義如下:
      15________________________________________3_____0
      |Tag7 |...................................|tag1|
      |_____|___________________________________|____|
       
含義:
        00 = 有效
        01 = 零
        10 = 無效或無窮大
        11 = 為空

                             

(三)浮點指令系統及MASM下浮點程式設計

事實上最重要和比較難於找到資料在(一)和(二)部分中已經介紹,下面是為了完整性的考慮,如果你是第一次接觸浮點指令,看看下面的摘要也無妨.另外本文未涉及到的一個方面是關於浮點處理異常的情況,因為涉及到保護模式和中斷、任務切換以及SEH等較多內容,我相信介紹之後只會令人更加迷惑,況且我現在似乎也無法把這幾個問題完全說清除,一般我們幾乎不需要知道這些.讓我們先來看主要內容.

關於浮點程式設計是一個大的話題,我只是提綱挈領地簡述Masm32V7(/V6)中的設計方法,因為486以上的CPU內建了浮點部件所以可以在程式裡直接使用浮點指令.下面是一個小例子:

__MASMSTD  equ    1
.386p
.model flat, stdcall
option casemap :none  ; case sensitive
include c:\hd\hd.h
include c:\hd\mac.h

;;--------------
    .DATA
num1    dq      12345
num2    dq      98765
res    dd      0
        .DATA?
buf    db 200 dup(?)

;;-----------------------------------------
    .CODE
__Start:
        finit                  ;初始化浮點部件
        fild    num1            ;裝入num1
        fild    num2            ;裝入num2
        fmul                    ;執行乘法
        fist    res            ;儲存
        invoke    wsprintf,addr buf,CTEXT("the result is: %ld"),res       
        invoke    StdOut,addr buf ;顯示,注意是控制檯顯示,編譯用/SUBSYSTEM:CONSOLE
       
    invoke    StdIn,addr buf,20
        invoke    ExitProcess,0 
END    __Start

具體你要怎樣運用指令,那就得看你自己所要進行的操作和要執行的演算法了.注意在fpu內部暫存器總是以擴充套件精度數來表示數值的,因此進行整數運算最後要用fist來儲存,這樣才能得到正確的結果,這些轉換是由fpu自動完成的.

浮點指令系統分為五類:資料傳送類、算術運算類、超越函式類、比較類、環境及系統控制類.
我並不想列出所有函式的引數以及用法,因為這會是勞動力的浪費.我打字用拼音的!:D)具體參考資料見文章最後,別的我就幫不上你了. 

1)資料傳送類,主要包括
這類指令主要是從記憶體裝入浮點暫存器堆資料,一般目的地址總是棧頂ST(0),用偵錯程式你可以清除的看到這一點.注意帶P結尾的操作,是在前面操作完成之後出棧,也就是原來ST(1)的內容現在成了ST(0)的內容,注意到這一點,你可以方便地設計出靈活多變的程式.
裝入:    
        FLD    Push real onto stack
        FILD    Convert two's complement integer to real and push
        FBLD    Convert BCD to real and push to stack
儲存:    
        FST    Store floating-point number from stack
        FSTP    Convert top of stack to integer
        FIST    
        FISTP    Convert top of stack to integer
        FBSTP    Store BCD to integer and pop stack
交換:    
        FXCH    Exchange top two stack elements
常數裝載:    
        FLD1    裝入常數1.0
        FLDZ    裝入常數0.0
        FLDPI    裝入常數pi (=3.1415926....精度足夠,放心使用)
        FLDL2E    裝入常數log(2)e
        FLDL2T    裝入常數log(2)10
        FLDLG2    裝入常數log(10)2
        FLDLN2    裝入常數Log(e)2

我逼併不想列出所有的浮點指令的詳細格式,因為沒有必要!很多資料都有這些指令格式的介紹,浮點指令均以F開頭,LD表示Load,ILD表示整數的Load,BLD是二十進位制數的Load,這樣記起來就很容易了,很多指令功能都可以根據指令一眼看出來.


2)算術運算類
加法:    
        FADD/FADDP    Add/add and pop
        FIADD    Integer add
減法:    
        FSUB/FSUBP    Subtract/subtract and pop
        FSUBR/FSUBRP    Subtract/subtract and pop with reversed operands
        FISUB    Integer subtract
        FISUBR    Integer subtract/subtract with reversed operands
乘法:    
        FMUL/FMULP    Multiply/multiply and pop
        FIMUL    Integer multiply
除法:    
        FDIV/FDIVP    Divide/divide and pop
        FIDIV    Integer divide
        FDIVR/FDIVRP    Divide/divide and pop with reversed operands
        FIDIVR    integer divide with reversed operands
其他:    
        FABS    Calculate absolute value
        FCHS    Change sign
        FRNDINT    Round to integer
        FSQRT    Calculate square root
        FSCALE    Scale top of stack by power of 2
        FXTRACT    Separate exponent and mantissa
        FPREM    Calculate partial remainder
        FPREM1    Calculate partial remainder in IEEE format

如果指令後面未帶運算元,其預設的運算元為ST(0)和ST(1),關於帶R字尾的指令是正常運算元的順序變反,比如fsub執行的是x-y,fsubr執行的就是y-x.

3)超越函式類
三角函式    
        FSIN    Calculate sine
        FCOS    Calculate cosine
        FSINCOS    Calculate quick sine and cosine
        FPTAN    Calculate partial tangent
        FPATAN    Calculate partial arctangent
Log類    
        FYL2X    Calculate y times log base 2 of x
        FYL2XP1    Calculate y times log base 2 of (x+1)
        F2XM1    Calculate (2^x)-1

4)比較類
        FCOM    Compare
        FCOMP    Compare and pop
        FICOM    Integer compare
        FTST    Integer compare and pop
        FUCOM    Unordered compare
        FUCOMP    Unordered compare and pop
        FXAM    Set condition code bits for value at top of stack
        FSTSW    Store status word

會根據結果設定,C0~C3,在上面並未就C0~C3進行具體介紹,C1是用來判斷上溢或者下溢的,C0相當於EFLAGS裡面的CF,作用也基本一致,C2相當於PF,C3相當於ZF,你可能會看到如下指令
        FSTSW  ax
        SAHF
        JZ      label
為什麼如此呢,因為用如上指令將狀態字存入EFLAGS,C0正好置於CF位,C3正好置於ZF位.

5)環境及系統控制類
        FLDCW    Load control word
        FSTCW    Store control word
        FSTSW    Store status word
        FLDENV    Load environment block
        FSTENV    Store environment block
        FSAVE    Save coprocessor state
        FRSTOR    Restore coprocessor state

        FINIT    Initialize coprocessor
        FCLEX    Clear exception flags
        FINCSTP    Increment stack pointer
        FDECSTP    Decrement stack pointer
        FFREE    Mark element as free
        FNOP    No operation
        FWAIT    Wait until floating-point instruction complete

我實在不想羅嗦了,因為這些指令的格式以及用法在Masm32V7的help目錄下面的fphelp.hlp檔案中有詳細的說明,當然也還有很多其他的指令格式列表,我之所以列出來是為了完整性.這裡還有一個比較困難的問題就是浮點數的顯示,windows沒有現成的函式呼叫,wsprintf只能顯示整數,但有好多庫支援,比如LYB主頁上的浮點開發包,當然等你搞熟了這些東西,也可以自己寫.

關於浮點程式的除錯,建議使用Softice,因為Trw不支援浮點堆疊的顯示,現在網上有一個fpu外掛,可以部分解決問題,不過不夠好用.一切看你自己的選擇了.

相關文章