您好,歡迎進入深圳市穎特新科技有限公司官方網站!
在數學中,數字有正負之分。在C語言中也是一樣,short、int、long 都可以帶上正負號,例如:
//負數 short a1 = -10; short a2 = -0x2dc9; //十六進制 //正數 int b1 = +10; int b2 = +0174; //八進制 int b3 = 22910; //負數和正數相加 long c = (-9) + (+12);
如果不帶正負號,默認就是正數。
符號也是數字的一部分,也要在內存中體現(xiàn)出來。符號只有正負兩種情況,用1位(Bit)就足以表示;C語言規(guī)定,把內存的最高位作為符號位。以 int 為例,它占用 32 位的內存,0~30 位表示數值,31 位表示正負號。如下圖所示:
在編程語言中,計數往往是從0開始,例如字符串 "abc123",我們稱第 0 個字符是 a,第 1 個字符是 b,第 5 個字符是 3。這和我們平時從 1 開始計數的習慣不一樣,大家要慢慢適應,培養(yǎng)編程思維。
C語言規(guī)定,在符號位中,用 0 表示正數,用 1 表示負數。例如 int 類型的 -10 和 +16 在內存中的表示如下:
short、int 和 long 類型默認都是帶符號位的,符號位以外的內存才是數值位。如果只考慮正數,那么各種類型能表示的數值范圍(取值范圍)就比原來小了一半。
但是在很多情況下,我們非常確定某個數字只能是正數,比如班級學生的人數、字符串的長度、內存地址等,這個時候符號位就是多余的了,就不如刪掉符號位,把所有的位都用來存儲數值,這樣能表示的數值范圍更大(大一倍)。
C語言允許我們這樣做,如果不希望設置符號位,可以在數據類型前面加上 unsigned 關鍵字,例如:
unsigned short a = 12; unsigned int b = 1002; unsigned long c = 9892320;
這樣,short、int、long 中就沒有符號位了,所有的位都用來表示數值,正數的取值范圍更大了。這也意味著,使用了 unsigned 后只能表示正數,不能再表示負數了。
如果將一個數字分為符號和數值兩部分,那么不加 unsigned 的數字稱為有符號數,能表示正數和負數,加了 unsigned 的數字稱為無符號數,只能表示正數。
請讀者注意一個小細節(jié),如果是unsigned int
類型,那么可以省略 int ,只寫 unsigned,例如:
unsigned n = 100;
它等價于:
unsigned int n = 100;
無符號數可以以八進制、十進制和十六進制的形式輸出,它們對應的格式控制符分別為:
unsigned short | unsigned int | unsigned long | |
---|---|---|---|
八進制 | %ho | %o | %lo |
十進制 | %hu | %u | %lu |
十六進制 | %hx 或者 %hX | %x 或者 %X | %lx 或者 %lX |
上節(jié)我們也講到了不同進制形式的輸出,但是上節(jié)我們還沒有講到正負數,所以也沒有關心這一點,只是“籠統(tǒng)”地介紹了一遍。現(xiàn)在本節(jié)已經講到了正負數,那我們就再深入地說一下。
嚴格來說,格式控制符和整數的符號是緊密相關的,具體就是:
那么,如何以八進制和十六進制形式輸出有符號數呢?很遺憾,printf 并不支持,也沒有對應的格式控制符。在實際開發(fā)中,也基本沒有“輸出負的八進制數或者十六進制數”這樣的需求,我想可能正是因為這一點,printf 才沒有提供對應的格式控制符。
下表全面地總結了不同類型的整數,以不同進制的形式輸出時對應的格式控制符(--
表示沒有對應的格式控制符)。
short | int | long | unsigned short | unsigned int | unsigned long | |
---|---|---|---|---|---|---|
八進制 | -- | -- | -- | %ho | %o | %lo |
十進制 | %hd | %d | %ld | %hu | %u | %lu |
十六進制 | -- | -- | -- | %hx 或者 %hX | %x 或者 %X | %lx 或者 %lX |
有讀者可能會問,上節(jié)我們也使用 %o 和 %x 來輸出有符號數了,為什么沒有發(fā)生錯誤呢?這是因為:
對于一個有符號的正數,它的符號位是 0,當按照無符號數的形式讀取時,符號位就變成了數值位,但是該位恰好是 0 而不是 1,所以對數值不會產生影響,這就好比在一個數字前面加 0,有多少個 0 都不會影響數字的值。
如果對一個有符號的負數使用 %o 或者 %x 輸出,那么結果就會大相徑庭,讀者可以親試。
可以說,“有符號正數的最高位是 0”這個巧合才使得 %o 和 %x 輸出有符號數時不會出錯。
再次強調,不管是以 %o、%u、%x 輸出有符號數,還是以 %d 輸出無符號數,編譯器都不會報錯,只是對內存的解釋不同了。%o、%d、%u、%x 這些格式控制符不會關心數字在定義時到底是有符號的還是無符號的:
說得再直接一些,我管你在定義時是有符號數還是無符號數呢,我只關心內存,有符號數也可以按照無符號數輸出,無符號數也可以按照有符號數輸出,至于輸出結果對不對,那我就不管了,你自己承擔風險。
下面的代碼進行了全面的演示:
運行結果:
a=0100, b=0xffffffff, c=720
m=-1, n=-2147483648, p=100
對于絕大多數初學者來說,b、m、n 的輸出結果看起來非常奇怪,甚至不能理解。按照一般的推理,b、m、n 這三個整數在內存中的存儲形式分別是:
當以 %x 輸出 b 時,結果應該是 0x80000001;當以 %hd、%d 輸出 m、n 時,結果應該分別是 -7fff、-0。但是實際的輸出結果和我們推理的結果卻大相徑庭,這是為什么呢?
注意,-7fff 是十六進制形式。%d 本來應該輸出十進制,這里只是為了看起來方便,才改為十六進制。
其實這跟整數在內存中的存儲形式以及讀取方式有關。b 是一個有符號的負數,它在內存中并不是像上圖演示的那樣存儲,而是要經過一定的轉換才能寫入內存;m、n 的內存雖然沒有錯誤,但是當以 %d 輸出時,并不是原樣輸出,而是有一個逆向的轉換過程(和存儲時的轉換過程恰好相反)。
也就是說,整數在寫入內存之前可能會發(fā)生轉換,在讀取時也可能會發(fā)生轉換,而我們沒有考慮這種轉換,所以才會導致推理錯誤。
上一篇:N76E003之SPI
下一篇:N76E003之IAP