浮點運算簡介 (轉)

gugu99發表於2007-08-15
浮點運算簡介 (轉)[@more@]

浮點運算簡介

  Hume/冷雨飄心

對於習慣於C的靈活多變的資料型別和方便的計算那些人而言,瞭解底層的浮點運算似乎沒有什麼意義,現在Visual盛行的時代還有多少人關心那些所謂的底層呢?
對了AfOs來說,浮點運算是中很重要的一部分,因為我們可能會面臨一些稍微複雜的運算,如果你和我一樣是Die-hard的asm擁護者,不想輕易用C來解決問題,你肯定能想像在asm下用整數運算求sin(2.3)的痛苦,實際上,微機早就為我們準備瞭解決之道:那就是浮點運算.但現在關於浮點運算的資料較少,相信很多人和我一樣還不掌握這種強有力的技術,那好,我們一起來學習學習.
 


  (一)浮點數
  (This Part mainly Froe Bill's Article)
在這之前,先來看幾個術語:
FPU->Floating Point Unit,浮點運算部件
BCD->Binary Coded Decimal 的二十進位制數,是用4個位來表示數字0~9,一個byte表示兩個十進位制數,比如01111001表示89
科學計數法:這是科學的~~~~具體含義查查初中還是小學的數學課本 D:)

浮點運算使用三種不同的資料:
  1)整數(Integer),又分為字,短整數(Short Integer)和長整數(Long Integer)
  2)實數(Real)分單精度(Single Real)和雙精度(Double Real)
  3)壓縮的二十進位制數(BCD)
 
  下面是其位數(bits)和能表示的大致範圍和


  Type  Length  Range
  -----------------------------------------------
  Integer  16 bit  -32768 to 32768
  Short Integer  32 bit  -2.14e9 to 2.14e9
  Long Integer  64 bit  -9.22e18 to 9.22e18
  Single Real  32 bit  1.18e-38 to 3.40e38
  Double Real  64 bit  2.23e-308 to 1.79e308
  extended Real  80 bit  3.37e-1932 to 1.18e4932
  Packed BCD  80 bit  -1e18 to 1e18

雙精度數和擴充套件精度數表示範圍對一般應用來說已經足夠大了!

1)整數,以補碼形式,正數的補碼是其本身,負數補碼是其絕對值的各位變反後加1,下面是實際儲存的例子:
  0024  var1 dw 24
  FFFE  var2 dw -2
  000004D2  var3 dd 1234
  FFFFFF85  var4 dd -123
  0000000000002694var5 dq 9876
  FFFFFFFFFFFFFEBFvar6 dq -321

2)BCD數
  在FPU中用80位表示正好是浮點堆暫存器的寬度,在其格式如下儲存:
  Bit
  79___72_71________________________________________0
  符號  ---18個二十進位制數--------
看下面的例子:
  00000000000000012345  var1  dt  12345
  80000000000000000100  var2  dt  -100

3)浮點數,這個複雜點,有三種格式

  單精度:_31_30________23_22___________0
  符號  指數  有效數

  雙精度:_63_62__________52_51__________________0
  符號  指數  有效數

  擴充套件精度數:
  _79_78____________64_63___________________0
  符號  指數  有效數
例子:
  C377999A  var1  dd  -247.6
  40000000  var2  dd  2.0
  486F4200  var3  real4  2.45e+5
  4059100000000000  var4  dq  100.25
  3F543BF727136A40  var5  real8  0.00123

  C377999A  var1  dd  -247.6
  40000000  var2  dd  2.0
  486F4200  var3  real4  2.45e+5
  4059100000000000  var4  dq  100.25
  3F543BF727136A40  var5  real8  0.001235
  400487F34D6A161E4F76  var6  real10  33.9876

DD和real4都可以在asm中來定義單精度浮點數,4 bytes
DQ和real8都可以在asm中來定義雙精度浮點數,8 bytes
DT和real10都可以在asm中來定義擴充套件精度浮點數,10 bytes
 
  (二)浮點部件

FPU從功能上分為兩個部分:控制單元和運算單元,控制單元主要面向,而算數單元負責具體算數運算.
FPU即浮點部件包括8個通用暫存器,5個錯誤指標暫存器和三個控制暫存器.

1)8個通用暫存器每個80 bit,形成一個暫存器堆疊,所有的計算結果都儲存在暫存器堆疊中,其中資料全部是80位的擴充套件精度格式,即使是BCD,整數,單精度和雙精度等在裝入暫存器的時候都要被FPU自動轉化為80位的擴充套件精度格式,注意棧頂通常表示為ST(0),然後是ST(1)...ST(i),ST(i)是相對於棧頂而言的.

和堆疊很相似,只不過寬度為80bit,映像如下:
  _______________________
  |  ST(0)  | 
  |_______________________|
  |  ST(1)  |
  |_______________________|
  |  ......  |
  |  ......  |
  |  ST(i)  | 
  |_______________________|

2)控制暫存器,FPU有三個控制暫存器:狀態暫存器,控制暫存器和標記暫存器

狀態暫存器->SW
  _M_____D________10___9____8___7_________5_________________________0__
  |  B |  C3| TOP| C2 | C1 | C0 | ES |  | PE | UE | OE | ZE | DE | |
  |____|____|____|____|____|____|____|____|____|____|____|____|____|____|

B:  浮點部件正忙
C0-C3  指示浮點運算的結果,不同指令有不同含義
TOP  指示棧頂,通常是0
ES 以下任何位置位 (pe, ue, oe, ze, de, or ie) 則置位
PE 精度故障 
UE 數字太小無法表示 
OE 現有精度無法表示,數字太大溢位 
ZE 除0錯 
DE 指示至少有一個運算元未規格化 
IE 無效錯誤,指示堆疊上溢或下溢,無效運算元等


控制暫存器:
  _15____________10___9____8___7_________5______________________0__
  |  |IC | RC | PC  |  | PM | UM | OM | ZM | DM | IM |
  |____|____|____|___|__|_|__|__|____|____|____|____|____|____|____|

IC 無窮大控制,對486,已經無效
RC 舍入控制
  00 = 朝最接近或者偶數舍入
  01 = 朝負無窮大方向舍入
  10 = 朝正無窮大方向舍入
  11 = 超0方向截斷
PC 精度控制
  00 = 單精度
  01 = 保留
  10 = 雙精度
  11 = 擴充套件精度
PM~IM 遮蔽狀態暫存器低5位指示的錯誤.為1則遮蔽.


標記暫存器:
  每2 bit表示一個對應堆疊暫存器的狀態,具體含義如下:
  15________________________________________3_____0
  |Tag7 |...................................|tag1|
  |_____|___________________________________|____|
 
含義:
  00 = 有效
  01 = 零
  10 = 無效或無窮大
  11 = 為空

 
(三)浮點指令及MASM下浮點設計

事實上最重要和比較難於找到資料在(一)和(二)部分中已經介紹,下面是為了完整性的考慮,如果你是第一次接觸浮點指令,看看下面的摘要也無妨.另外本文未涉及到的一個方面是關於浮點處理異常的情況,因為涉及到保護和中斷、任務切換以及SEH等較多內容,我相信介紹之後只會令人更加迷惑,況且我現在似乎也無法把這幾個問題完全說清除,一般我們幾乎不需要知道這些.讓我們先來看主要內容.

關於浮點程式設計是一個大的話題,我只是提綱挈領地簡述Masm32V7(/V6)中的設計方法,因為486以上的CPU內建了浮點部件所以可以在程式裡直接使用浮點指令.下面是一個小例子:

__MASMSTD  equ  1
.386p
.model flat, stdcall
option casemap :none  ; case sensitive
include c:hdhd.h
include c:hdmac.h

;;--------------
  .DATA
num1  dq  12345
num2  dq  98765
res  dd  0
  .DATA?
buf  200 dup(?)

;;-----------------------------------------
  .CODE
__Start:
  finit  ;初始化浮點部件
  fild  num1  ;裝入num1
  fild  num2  ;裝入num2
  fmul  ;乘法
  fist  res  ;儲存
  invoke  wsprintf,addr buf,CTEXT("the result is: %ld"),res 
  invoke  StdOut,addr buf ;顯示,注意是控制檯顯示,編譯用/SUBSYSTEM:CONSOLE
 
  invoke  StdIn,addr buf,20
  invoke  ExitProcess,0 
END  __Start

具體你要怎樣運用指令,那就得看你自己所要進行的操作和要執行的演算法了.注意在fpu內部暫存器總是以擴充套件精度數來表示數值的,因此進行整數運算最後要用fist來儲存,這樣才能得到正確的結果,這些轉換是由fpu自動完成的.

浮點指令系統分為五類:資料傳送類、算術運算類、超越類、比較類、環境及系統控制類.
我並不想列出所有函式的引數以及用法,因為這會是勞動力的浪費.我打字用拼音的!:D)具體參考資料見文章最後,別的我就幫不上你了. 

1)資料傳送類,主要包括
這類指令主要是從裝入浮點暫存器堆資料,一般目的地址總是棧頂ST(0),用器你可以清除的看到這一點.注意帶P結尾的操作,是在前面操作完成之後出棧,也就是原來ST(1)的內容現在成了ST(0)的內容,注意到這一點,你可以方便地設計出靈活多變的程式.
裝入: 
  FLD  Push real onto stack
  FILD  Convert two's complement integer to real and push
  FBLD  Convert BCD to real and push to stack
儲存: 
  FST  Store floating-point number from stack
  FSTP  Convert top of stack to integer
  FIST 
  FISTP  Convert top of stack to integer
  FBSTP  Store BCD to integer and pop stack

  FXCH  top two stack elements
常數裝載: 
  FLD1  裝入常數1.0
  FLDZ  裝入常數0.0
  FLDPI  裝入常數pi (=3.1415926....精度足夠,放心使用)
  FLDL2E  裝入常數log(2)e
  FLDL2T  裝入常數log(2)10
  FLDLG2  裝入常數log(10)2
  FLDLN2  裝入常數Log(e)2

我逼併不想列出所有的浮點指令的詳細格式,因為沒有必要!很多資料都有這些指令格式的介紹,浮點指令均以F開頭,LD表示Load,ILD表示整數的Load,BLD是二十進位制數的Load,這樣記起來就很容易了,很多指令功能都可以根據指令一眼看出來.


2)算術運算類
加法: 
  FADD/FADDP  Add/add and pop
  FIADD  Integer add
減法: 
  FSUB/FSUBP  Subtract/subtract and pop
  FSUBR/FSUBRP  Subtract/subtract and pop with reversed operands
  FISUB  Integer subtract
  FISUBR  Integer subtract/subtract with reversed operands
乘法: 
  FMUL/FMULP  Multiply/multiply and pop
  FIMUL  Integer multiply
除法: 
  FDIV/FDIVP  Div/divide and pop
  FIDIV  Integer divide
  FDIVR/FDIVRP  Divide/divide and pop with reversed operands
  FIDIVR  integer divide with reversed operands
其他: 
  FABS  Calculate absolute value
  FCHS  Change sign
  FRNDINT  Round to integer
  FSQRT  Calculate square
  FSCALE  Scale top of stack by power of 2
  FXTRACT  Separate exponent and mantissa
  FPREM  Calculate partial remainder
  FPREM1  Calculate partial remainder in IEEE format

如果指令後面未帶運算元,其預設的運算元為ST(0)和ST(1),關於帶R字尾的指令是正常運算元的順序變反,比如fsub執行的是x-y,fsubr執行的就是y-x.

3)超越函式類
三角函式 
  FSIN  Calculate sine
  FCOS  Calculate cosine
  FSINCOS  Calculate quick sine and cosine
  FPTAN  Calculate partial tangent
  FPATAN  Calculate partial arctangent
Log類 
  FYL2X  Calculate y times log base 2 of x
  FYL2XP1  Calculate y times log base 2 of (x+1)
  F2XM1  Calculate (2^x)-1

4)比較類
  FCOM  Compare
  FCOMP  Compare and pop
  FICOM  Integer compare
  FTST  Integer compare and pop
  FUCOM  Unordered compare
  FUCOMP  Unordered compare and pop
  FXAM  Set condition code bits for value at top of stack
  FSTSW  Store status word

會根據結果設定,C0~C3,在上面並未就C0~C3進行具體介紹,C1是用來判斷上溢或者下溢的,C0相當於EFLAGS裡面的CF,作用也基本一致,C2相當於PF,C3相當於ZF,你可能會看到如下指令
  FSTSW  ax
  SAHF
  JZ  label
為什麼如此呢,因為用如上指令將狀態字存入EFLAGS,C0正好置於CF位,C3正好置於ZF位.

5)環境及系統控制類
  FLDCW  Load control word
  FSTCW  Store control word
  FSTSW  Store status word
  FLDENV  Load environment block
  FSTENV  Store environment block
  FSAVE  Save coprocessor state
  FRSTOR  Restore coprocessor state

  FINIT  Initialize coprocessor
  FCLEX  Clear exception flags
  FINCSTP  Increment stack pointer
  FDECSTP  Decrement stack pointer
  FFREE  Mark element as free
  FNOP  No operation
  FWAIT  Wait until floating-point instruction complete

我實在不想羅嗦了,因為這些指令的格式以及用法在Masm32V7的help目錄下面的fphelp.hlp中有詳細的說明,當然也還有很多其他的指令格式列表,我之所以列出來是為了完整性.這裡還有一個比較困難的問題就是浮點數的顯示,沒有現成的函式,wsprintf只能顯示整數,但有好多庫支援,比如LYB主頁上的浮點開發包,當然等你搞熟了這些東西,也可以自己寫.

關於浮點程式的除錯,建議使用Softice,因為Trw不支援浮點堆疊的顯示,現在網上有一個fpu,可以部分解決問題,不過不夠好用.一切看你自己的選擇了.


來自 “ ITPUB部落格 ” ,連結:http://blog.itpub.net/10748419/viewspace-958720/,如需轉載,請註明出處,否則將追究法律責任。

相關文章