浮點運算簡介(part I)... (6千字)
浮點運算簡介
Hume/冷雨飄心
對於習慣於C的靈活多變的資料型別和方便的計算那些人而言,瞭解底層的浮點運算似乎沒有什麼意義,現在Visual盛行的時代還有多少人關心那些所謂的底層呢?
對了AfOs來說,浮點運算是程式設計中很重要的一部分,因為我們可能會面臨一些稍微複雜的運算,如果你和我一樣是Die-hard的asm擁護者,不想輕易用C來解決問題,你肯定能想像在asm下用整數運算求sin(2.3)的痛苦,實際上,微機早就為我們準備瞭解決之道:那就是浮點運算.但現在關於浮點運算的資料較少,相信很多人和我一樣還不掌握這種強有力的技術,那好,我們一起來學習學習.
(一)浮點數
(This Part mainly Froe Bill's Article)
在這之前,先來看幾個術語:
FPU->Floating Point Unit,浮點運算部件
BCD->Binary Coded Decimal 壓縮的二十進位制數,是用4個位來表示數字0~9,一個byte表示兩個十進位制數,比如01111001表示89
科學計數法:這是科學的~~~~具體含義查查初中還是小學的數學課本 D:)
浮點運算使用三種不同的資料:
1)整數(Integer),又分為字,短整數(Short Integer)和長整數(Long Integer)
2)實數(Real)分單精度(Single Real)和雙精度(Double Real)
3)壓縮的二十進位制數(BCD)
下面是其位數(bits)和能表示的大致範圍和
Type
Length Range
-----------------------------------------------
Word Integer 16 bit
-32768 to 32768
Short Integer
32 bit -2.14e9 to 2.14e9
Long Integer 64 bit
-9.22e18 to 9.22e18
Single Real
32 bit 1.18e-38 to 3.40e38
Double Real 64 bit
2.23e-308 to 1.79e308
extended Real 80
bit 3.37e-1932 to 1.18e4932
Packed BCD 80 bit
-1e18 to 1e18
雙精度數和擴充套件精度數表示範圍對一般應用來說已經足夠大了!
1)整數,以補碼形式儲存,正數的補碼是其本身,負數補碼是其絕對值的各位變反後加1,下面是實際儲存的例子:
0024
var1 dw 24
FFFE
var2 dw -2
000004D2
var3 dd 1234
FFFFFF85
var4 dd -123
0000000000002694var5 dq 9876
FFFFFFFFFFFFFEBFvar6 dq -321
2)BCD數
在FPU中用80位表示正好是浮點堆暫存器的寬度,在其格式如下儲存:
Bit
79___72_71________________________________________0
符號 ---18個二十進位制數--------
看下面的例子:
00000000000000012345
var1 dt 12345
80000000000000000100 var2 dt -100
3)浮點數,這個複雜點,有三種格式
單精度:_31_30________23_22___________0
符號 指數
有效數
雙精度:_63_62__________52_51__________________0
符號 指數
有效數
擴充套件精度數:
_79_78____________64_63___________________0
符號 指數
有效數
例子:
C377999A
var1 dd -247.6
40000000
var2 dd 2.0
486F4200
var3 real4
2.45e+5
4059100000000000
var4 dq 100.25
3F543BF727136A40 var5
real8 0.00123
C377999A
var1 dd
-247.6
40000000
var2 dd 2.0
486F4200
var3 real4 2.45e+5
4059100000000000 var4
dq 100.25
3F543BF727136A40
var5 real8 0.001235
400487F34D6A161E4F76 var6
real10 33.9876
DD和real4都可以在asm中來定義單精度浮點數,4 bytes
DQ和real8都可以在asm中來定義雙精度浮點數,8
bytes
DT和real10都可以在asm中來定義擴充套件精度浮點數,10 bytes
(二)浮點部件
FPU從功能上分為兩個部分:控制單元和運算單元,控制單元主要面向CPU,而算數單元負責具體算數運算.
FPU即浮點部件包括8個通用暫存器,5個錯誤指標暫存器和三個控制暫存器.
1)8個通用暫存器每個80 bit,形成一個暫存器堆疊,所有的計算結果都儲存在暫存器堆疊中,其中資料全部是80位的擴充套件精度格式,即使是BCD,整數,單精度和雙精度等在裝入暫存器的時候都要被FPU自動轉化為80位的擴充套件精度格式,注意棧頂通常表示為ST(0),然後是ST(1)...ST(i),ST(i)是相對於棧頂而言的.
和堆疊很相似,只不過寬度為80bit,映像如下:
_______________________
| ST(0)
|
|_______________________|
|
ST(1) |
|_______________________|
| ...... |
| ......
|
| ST(i) |
|_______________________|
2)控制暫存器,FPU有三個控制暫存器:狀態暫存器,控制暫存器和標記暫存器
狀態暫存器->SW
_M_____D________10___9____8___7_________5_________________________0__
| B | C3| TOP| C2 | C1 | C0 | ES |
| PE | UE | OE | ZE | DE | IE |
|____|____|____|____|____|____|____|____|____|____|____|____|____|____|
B: 浮點部件正忙
C0-C3 指示浮點運算的結果,不同指令有不同含義
TOP
指示棧頂,通常是0
ES 以下任何位置位 (pe, ue, oe, ze, de, or ie) 則置位
PE 精度故障
UE 數字太小無法表示溢位
OE 現有精度無法表示,數字太大溢位
ZE 除0錯
DE 指示至少有一個運算元未規格化
IE 無效錯誤,指示堆疊上溢或下溢,無效運算元等
控制暫存器:
_15____________10___9____8___7_________5______________________0__
| |IC
| RC | PC | | PM | UM | OM | ZM | DM | IM |
|____|____|____|___|__|_|__|__|____|____|____|____|____|____|____|
IC 無窮大控制,對486,已經無效
RC 舍入控制
00 = 朝最接近或者偶數舍入
01 = 朝負無窮大方向舍入
10 = 朝正無窮大方向舍入
11 = 超0方向截斷
PC 精度控制
00 = 單精度
01 = 保留
10 = 雙精度
11 = 擴充套件精度
PM~IM 遮蔽狀態暫存器低5位指示的錯誤.為1則遮蔽.
標記暫存器:
每2 bit表示一個對應堆疊暫存器的狀態,具體含義如下:
15________________________________________3_____0
|Tag7 |...................................|tag1|
|_____|___________________________________|____|
含義:
00 = 有效
01 = 零
10 = 無效或無窮大
11 = 為空
(三)浮點指令系統及MASM下浮點程式設計
事實上最重要和比較難於找到資料在(一)和(二)部分中已經介紹,下面是為了完整性的考慮,如果你是第一次接觸浮點指令,看看下面的摘要也無妨.另外本文未涉及到的一個方面是關於浮點處理異常的情況,因為涉及到保護模式和中斷、任務切換以及SEH等較多內容,我相信介紹之後只會令人更加迷惑,況且我現在似乎也無法把這幾個問題完全說清除,一般我們幾乎不需要知道這些.讓我們先來看主要內容.
關於浮點程式設計是一個大的話題,我只是提綱挈領地簡述Masm32V7(/V6)中的設計方法,因為486以上的CPU內建了浮點部件所以可以在程式裡直接使用浮點指令.下面是一個小例子:
__MASMSTD equ 1
.386p
.model flat, stdcall
option casemap :none ; case sensitive
include c:\hd\hd.h
include c:\hd\mac.h
;;--------------
.DATA
num1 dq 12345
num2 dq 98765
res dd 0
.DATA?
buf db 200 dup(?)
;;-----------------------------------------
.CODE
__Start:
finit ;初始化浮點部件
fild num1 ;裝入num1
fild num2 ;裝入num2
fmul ;執行乘法
fist res ;儲存
invoke wsprintf,addr buf,CTEXT("the result is: %ld"),res
invoke StdOut,addr buf ;顯示,注意是控制檯顯示,編譯用/SUBSYSTEM:CONSOLE
invoke StdIn,addr buf,20
invoke ExitProcess,0
END __Start
具體你要怎樣運用指令,那就得看你自己所要進行的操作和要執行的演算法了.注意在fpu內部暫存器總是以擴充套件精度數來表示數值的,因此進行整數運算最後要用fist來儲存,這樣才能得到正確的結果,這些轉換是由fpu自動完成的.
浮點指令系統分為五類:資料傳送類、算術運算類、超越函式類、比較類、環境及系統控制類.
我並不想列出所有函式的引數以及用法,因為這會是勞動力的浪費.我打字用拼音的!:D)具體參考資料見文章最後,別的我就幫不上你了.
1)資料傳送類,主要包括
這類指令主要是從記憶體裝入浮點暫存器堆資料,一般目的地址總是棧頂ST(0),用偵錯程式你可以清除的看到這一點.注意帶P結尾的操作,是在前面操作完成之後出棧,也就是原來ST(1)的內容現在成了ST(0)的內容,注意到這一點,你可以方便地設計出靈活多變的程式.
裝入:
FLD Push real onto stack
FILD Convert two's complement integer to real and push
FBLD Convert BCD to real and push to stack
儲存:
FST Store floating-point number from stack
FSTP Convert top of stack to integer
FIST
FISTP Convert top of stack to integer
FBSTP Store BCD to integer and pop stack
交換:
FXCH Exchange top two stack elements
常數裝載:
FLD1 裝入常數1.0
FLDZ 裝入常數0.0
FLDPI 裝入常數pi (=3.1415926....精度足夠,放心使用)
FLDL2E 裝入常數log(2)e
FLDL2T 裝入常數log(2)10
FLDLG2 裝入常數log(10)2
FLDLN2 裝入常數Log(e)2
我逼併不想列出所有的浮點指令的詳細格式,因為沒有必要!很多資料都有這些指令格式的介紹,浮點指令均以F開頭,LD表示Load,ILD表示整數的Load,BLD是二十進位制數的Load,這樣記起來就很容易了,很多指令功能都可以根據指令一眼看出來.
2)算術運算類
加法:
FADD/FADDP Add/add and pop
FIADD Integer add
減法:
FSUB/FSUBP Subtract/subtract and pop
FSUBR/FSUBRP Subtract/subtract and pop with reversed operands
FISUB Integer subtract
FISUBR Integer subtract/subtract with reversed operands
乘法:
FMUL/FMULP Multiply/multiply and pop
FIMUL Integer multiply
除法:
FDIV/FDIVP Divide/divide and pop
FIDIV Integer divide
FDIVR/FDIVRP Divide/divide and pop with reversed operands
FIDIVR integer divide with reversed operands
其他:
FABS Calculate absolute value
FCHS Change sign
FRNDINT Round to integer
FSQRT Calculate square root
FSCALE Scale top of stack by power of 2
FXTRACT Separate exponent and mantissa
FPREM Calculate partial remainder
FPREM1 Calculate partial remainder in IEEE format
如果指令後面未帶運算元,其預設的運算元為ST(0)和ST(1),關於帶R字尾的指令是正常運算元的順序變反,比如fsub執行的是x-y,fsubr執行的就是y-x.
3)超越函式類
三角函式
FSIN Calculate sine
FCOS Calculate cosine
FSINCOS Calculate quick sine and cosine
FPTAN Calculate partial tangent
FPATAN Calculate partial arctangent
Log類
FYL2X Calculate y times log base 2 of x
FYL2XP1 Calculate y times log base 2 of (x+1)
F2XM1 Calculate (2^x)-1
4)比較類
FCOM Compare
FCOMP Compare and pop
FICOM Integer compare
FTST Integer compare and pop
FUCOM Unordered compare
FUCOMP Unordered compare and pop
FXAM Set condition code bits for value at top of stack
FSTSW Store status word
會根據結果設定,C0~C3,在上面並未就C0~C3進行具體介紹,C1是用來判斷上溢或者下溢的,C0相當於EFLAGS裡面的CF,作用也基本一致,C2相當於PF,C3相當於ZF,你可能會看到如下指令
FSTSW ax
SAHF
JZ label
為什麼如此呢,因為用如上指令將狀態字存入EFLAGS,C0正好置於CF位,C3正好置於ZF位.
5)環境及系統控制類
FLDCW Load control word
FSTCW Store control word
FSTSW Store status word
FLDENV Load environment block
FSTENV Store environment block
FSAVE Save coprocessor state
FRSTOR Restore coprocessor state
FINIT Initialize coprocessor
FCLEX Clear exception flags
FINCSTP Increment stack pointer
FDECSTP Decrement stack pointer
FFREE Mark element as free
FNOP No operation
FWAIT Wait until floating-point instruction complete
我實在不想羅嗦了,因為這些指令的格式以及用法在Masm32V7的help目錄下面的fphelp.hlp檔案中有詳細的說明,當然也還有很多其他的指令格式列表,我之所以列出來是為了完整性.這裡還有一個比較困難的問題就是浮點數的顯示,windows沒有現成的函式呼叫,wsprintf只能顯示整數,但有好多庫支援,比如LYB主頁上的浮點開發包,當然等你搞熟了這些東西,也可以自己寫.
關於浮點程式的除錯,建議使用Softice,因為Trw不支援浮點堆疊的顯示,現在網上有一個fpu外掛,可以部分解決問題,不過不夠好用.一切看你自己的選擇了.
相關文章
- 浮點運算簡介 (轉)2007-08-15
- 浮點運算:程式碼管理器 (28千字)2015-11-15
- 計算機中的浮點運算2015-11-30計算機
- 深入理解浮點數的運算2024-10-18
- JavaScript解決浮點數算數運算精度問題2018-07-03JavaScript
- python中精確的浮點數運算2019-02-16Python
- Python做浮點數(float)運算要小心2018-12-27Python
- 有關 PHP 和 js 浮點運算的坑2017-10-12PHPJS
- 比特幣浮點運算速度64百億億次!2013-12-01比特幣
- 浮點數的加減乘除運算細節2024-08-17
- linux shell 實現 四則運算(整數及浮點) 簡單方法2015-04-26Linux
- Linux Shell 實現四則運算(整數及浮點)簡單方法2015-10-04Linux
- 浮點數在計算機底層的表示及運算2020-07-07計算機
- javascript浮點數計算精度問題介紹2017-04-12JavaScript
- 全面總結 JS 中浮點數運算問題2019-10-19JS
- JavaScript 浮點數及運算精度調整總結2015-12-02JavaScript
- javascript除法運算簡單介紹2017-04-03JavaScript
- js短路運算簡單介紹2017-04-17JS
- 計組之資料運算:9、浮點數的表示2020-09-23
- 【轉】JS浮點數運算Bug的解決辦法2017-03-27JS
- 為什麼php的浮點數運算不準確2017-02-09PHP
- 圖解計算機中的數值範圍和浮點運算2021-01-28圖解計算機
- javascript求餘運算簡單介紹2017-04-01JavaScript
- javascript取模運算簡單介紹2017-04-01JavaScript
- Java浮點數計算2012-06-14Java
- php 處理 浮點數 精度運算 數字處理等2021-05-12PHP
- javascript將浮點數數變為整數簡單介紹2017-04-14JavaScript
- GPU的並行運算與CUDA的簡介2019-01-26GPU並行
- java浮點型別案例介紹2018-06-18Java型別
- Python浮點數(小數)運算誤差的原因和解決辦法2019-07-09Python
- js中浮點數計算常用方法2018-11-23JS
- js精確計算浮點數相加2024-06-14JS
- 浮點數線上轉hex計算工具2024-11-09
- javascript表示式中的運算順序簡單介紹2017-04-06JavaScript
- 浮點運算為什麼不準?有人為0.30000000000000004建了個網站2020-04-06網站
- FastDFS簡介,運用2020-09-27AST
- ES6 簡介2017-04-23
- ECMAScript6簡介2017-12-18