這樣給小白講原碼、反碼、補碼,幫她徹底解決困擾了三天的問題

bigsai發表於2021-06-25

前言

補碼是給機器看的,原碼是給人看的,反碼是二者的橋樑,原碼反碼補碼雖然是簡單問題,但確實很多人很長時間沒有搞明白和深入思考,這篇把自己學習和理解過程記錄下來,剛好一個學妹問到這個問題。本篇只講原碼、反碼、補碼,位運算相關可以看這篇。

故事是一個真實的故事,前兩天要被一位小學妹折磨死,原碼、反碼、補碼不懂就算了,講了一遍還不懂。
在這裡插入圖片描述

我搞不懂是二進位制太難還是我太難了呢?你們不信?立圖為證:

image-20210523234535918

她這問的給我直接問懵逼了,二進位制符號位不參與運算?我怎麼聽得給我都聽糊塗了,哈哈哈,後來我就給他說了要參加運算,再後來又一個問題:
image-20210524094638871
她這麼確定的眼神給我搞得都有點懵逼,都嚇得我打一段程式碼去驗證一下結果沒毛病,又巴拉巴拉給她講了一通。

我覺得應該可以了吧,結果在凌晨1.30的時候……
image-20210523234917806

算了,算了,這孩子沒得救了,不管了,得讓她靜靜……我也得靜靜,梳理一下自己曾在原碼、反碼、補碼上的困惑。

  • 記得剛學c++的時候:這啥玩意程式碼不要求,不學
  • 剛學作業系統、組成原理的時候:emumm,跳過跳過。
  • 考研時候:會而不深刻。

所以以前的我也一直沒能搞懂二進位制,並且很排斥二進位制,總感覺它沒用還又燒腦。

但事實上二進位制這個知識是無論如何也避免不了的知識點。想著要拯救更多苦於二進位制或者說原碼反碼補碼的小學弟小學妹們,我得站出來做點什麼,學妹直呼內行!

二進位制數字

什麼是二進位制?

二進位制(binary)在數學和數位電路中指以2為基數的記數系統,以2為基數代表系統是二進位制的。這一系統中,通常用兩個不同的符號0(代表零)和1(代表一)來表示 [1] 。數位電子電路中,邏輯閘的實現直接應用了二進位制,因此現代的計算機和依賴計算機的裝置裡都用到二進位制。每個數字稱為一個位元(Bit,Binary digit的縮寫)

其實二進位制的01就是對應數位電路中的關開,所以在整個計算機中所有的東西都是二進位制科學,但我們只需要研究數字型別的二進位制其規則原理的,數字本身最直接的就是二進位制。

如果說不談啥原碼、反碼、補碼,光光看二進位制跟十進位制的關係,也不考慮位數,我想大部分人可以搞得懂。

比如2的二進位制:10,3的二進位制:11,4的二進位制:100,5的二進位制:101.

負數的二進位制怎麼搞?

-2二進位制-10?-3二進位制-11?這樣不太妥吧,怎麼跟著這麼一個負數?

另外,這種不確定長度的二進位制如果是一個陣列我該怎麼在計算機記憶體中找的到 ?

以一個可能不太恰當的圖展示一下:
在這裡插入圖片描述
大家一看直呼這樣不行,所以在計算機數值型別設計之初就明確表示:計算機基本資料是定長的,並且有兩部分組成:符號位(一位)和數值位(若干位),其中符號位的0或者1分別表示正和負數,而數值位就是表示資料的大小。

你可能直呼:到底多少位表示一個數字呢?如果太長位資料如果很小(前面都是0)就會造成浪費,造成記憶體浪費,而位數太短又會導致裝不下,網友們直呼真難。

偉大的設計者們當然考慮了這個問題,他們將數值二進位制的長度分為不同長度供你使用,在Java中有這8種基本資料型別(1byte=8bit):

基本型別 長度(byte) 包裝型別 取值範圍
byte 1 Byte -128~127
short 2 Short -32768 ~ 32767
int 4 Integer -2147483648~2147483647
long 8 Long -9223372036854774808~9223372036854774807
float 4 Float 3.402823e+38~1.401298e-45(e+38 表示乘以10的38次方,而e-45 表示乘以10的負45次方)
double 8 Double 1.797693e+308~4.9000000e-324
char 2 Character
boolean 官方未確定 Boolean true false

比如說你byte a=1,他在記憶體中就是這樣的:

0000 0001

如果你 int b=1;因為int是32位,那麼他在記憶體中是這樣存的:

00000000 00000000 00000000 00000001

你可能會問為啥沒講負數?別急慢慢來,下面原碼、反碼、補碼講著呢。另外需要注意的是,二進位制進行加法如果溢位,溢位部分不會記錄,只會儲存有效部分,所以選用什麼資料型別也要掂量目標資料的大小範圍。

原碼

上面既然初步知道了二進位制數字的一些規律,那麼就讓它來的更猛烈一些吧。原碼是什麼意思呢?

原碼就是二進位制的初始表示符號位,即最高位為符號位:正數該位為0,負數該位為1(0有兩種表示:+0和-0),其餘位表示數值的大小。

在這裡插入圖片描述
是不是很直接明瞭的展示一個值?原碼的優勢就是比較明顯的表示一個值。能夠清楚的知道這個二進位制數表示是多少,簡單直觀

但我們是否就可以使用原碼暢通無阻了呢?

當然不可以,原碼雖然可以很容易的表示一個正負數,但是我們觀察它的加法:

在這裡插入圖片描述

正數相加沒問題,但是負數的加法就出問題了:負數的加法只考慮絕對值數值的增加而未考慮負數的特性。而負數加負數的絕對值相反,所以在原碼上負數的加法就成了一個難題,走不通。

反碼

負數的原碼無法實現加法,因為原碼如果進行加法實現的是與符號無關數值絕對值的加法。所以這點和負數的加法規則矛盾,並且計算機也只會加法。我們們只能另從它計。

此時,有些偉大的大佬就發現了反碼這個東西,而反碼的定義是這樣的:正數的反碼與其原碼相同;負數的反碼是對正數逐位取反,符號位保持為1. 因為負數原碼的加法是相反的(即加一變成減一的操作),我們想著如果給負數原碼中的數字01顛倒那麼這個數字就會有比較有趣的事情。

原碼中本來比較大的數字(-1,-2等)在這樣轉換後看起來變得很小。原本很小的數字經過這樣的轉換後看起來很大。(也就無法直觀一下看出這個數字是多少)
image-20210523235553007

轉換後的數字進行加法(正數)運算,在進行01互換之後可以進行正常加法的邏輯
image-20210523235816834

負數相加好像看起來也沒問題。

但是真的就可以了嘛?正數負數用反碼錶示可以暢通無阻了?no no no。我們們記得原碼中有+0,-0.但是不影響操作吧。看看反碼中+0,-0的情況:
image-20210523235926726

你看看,反碼它也不行啊,what should I do?看下面的補碼分析。

補碼

反碼為啥會出現這個問題呢?主要是正負0佔了兩個坑:
image-20210524000700925
也就是如果你用反碼錶示這個數,用它進行加法運算,正數範圍內玩沒問題,負數範圍內玩也沒問題,但是當你從負數邁到正數的時候會經過兩個0(-0,+0)兩個零重複表示了。

這該如何表示呢?我們看看這些數字反碼的規律:

-3的反碼: 1111 1100
-2的反碼: 1111 1101
-1的反碼: 1111 1110
-0的反碼: 1111 1111

+0的反碼:0000 0000

這些負數的反碼,如果都能加個1,那麼這樣正負0的矛盾不久不存在了嘛?!!這就是所謂的補碼:符號位不變,正數的補碼為和原碼、反碼一致,負數的補碼為其反碼加1.

在這裡插入圖片描述

這樣我們就解決了所有難題,叱吒風雲的進行計算了,其實我們在計算機中二進位制也是用補碼錶示所有數值。

對於補碼,你確實無法直接看出它是多少,負數或許理解起來可能還有那麼一點點抽象,我們該如何理解補碼呢?
我是這麼理解的:二進位制數把資料分為正負兩個部分,分別表示兩個區間:

image-20210524000911217
什麼意思呢?這個也就是說你可以把負數看成一部分,正數看成一部分。而每個部分的數值也是相同的:無論負數還是正數出去符號位,都是從 000 0000~111 1111(byte為例)分佈。如果前面符號位為1就是表示負數,負數的最小到最大(-128 ~ -1)共128個,如果是0就是正數的最小和最大(0 ~ 127)共128個。這樣理解是不是容易很多呢!

測試

上面講了那麼多道理,我們們測試一下吧,用以下程式碼驗證上述結果

//微信公眾號:bigsai
public class Main {
	public static void main(String[] args) {
		int a =-1;//11111111 11111111 11111111 11111111
		int b=1;  //00000000 00000000 00000000 00000001
		System.out.println(Integer.toBinaryString(a));//輸出-1的二進位制
		System.out.println(Integer.toBinaryString(b));//前面的0會省略
		
		/*
		 * 127 + 1:
		 *  0111 1111
		 * +0000 0001
		 * =1000 0000 = -128
		 */
		byte c=127;
		byte d=(byte)(c+1);
		System.out.println(d);
		
		/*
		 *  -1+1
		 *   1111 1111
		 * + 0000 0001
		 * =10000 0000(理論上) = 0000 0000(只有8位有效位) =0
		 */
		byte e=-1;
		byte f=(byte)(e+1);
		System.out.println(f);
	}
}

輸出結果:
image-20210524005426645
這段程式碼意會鞏固以下就好了。

總結

到此,是不是對原碼、反碼、補碼理解更透徹一點了呢?不管你懂沒懂,反正問她懂了嗎她是這麼說的:

image-20210524003300071

總結一下:

原碼,能夠直接的顯示數值的大小狀況。結構為符號位+數值部分。符號位0代表正,1代表負。

反碼,是一個過渡碼,其實就是在求補碼或者原碼補碼轉換過程中需要用到。其規則是正數反碼等於原碼,負數反碼符號位不變,數值位0變成1,1變成0.

補碼,計算機中數值都是以補碼的形式進行計算的,它有效的解決負數加法問題,也可以使符號位直接參與運算。並且原碼、反碼、補碼轉換很簡單。

好了,本篇已經結束了,希望有收穫後點個贊、收藏、關注,持續分享。

關於作者
江科大本,南理研一,普通草根程式設計師,同名公眾號:[bigsai],致力於將基礎資料結構與演算法、Java等相關知識搞懂。歡迎交流學習、考研、選擇等技術問題。

image

相關文章