前言
對於程式語言來說,經常看到有因為各自支援的語言陣營而互懟的,其實根本沒那個必要,都只是一種工具而已。當多數主流語言都會使用時也許你就不會有偏見了,本質不過都是用來描述計算機的一個任務,只是每門語言設計時考慮的側重點不一樣而已。大家最好不要停留在語言層面去爭執,不如把時間花在計算機實現原理和結構的本質上,這樣更能理解程式語言每一行描述的東西在計算機是幹什麼的。本系列將總結現在IT領域主流的那些程式語言的相關知識。
關於C語言
C語言是最經典的語言,很多其他語言的執行環境也是用C來寫的,對於寫程式的人則能不懂C語言呢!提到C首先必然會讓人關聯到指標,當年在大學讓你困惑的指標卻是C語言威力無窮的基礎。C語言可能從更高層面的設計和編寫效率上有所欠缺,但卻足夠經典且容易操控底層。指標雖然風險不小,但卻十分強大。此外ANSI C也增強了C程式在不同作業系統的遷移性,下面列一些C語言的一些基礎知識。
翻譯階段
編寫好的C程式需要先編譯成可執行的機器指令才能執行,這便是翻譯工作。翻譯的主要步驟是編譯和連結,編譯就是原始碼到目的碼,而連結是將各個目標檔案連結起來從而形成一個可執行的程式,當然連結器也會引入被程式所用到的所有標準C函式庫的函式。有時編譯過程還會將預處理作為一個階段,它主要是對原始檔進行一些處理,比如將#define替換成實際值、將#include指定的檔案內容填充進來。下面是使用gcc來編譯並連結的例子,經過編譯和連結後得到可執行程式,這兩個步驟通過gcc來完成,命令為gcc hello.c -o hello
,最終執行./hello會輸出“hello world”。
#include<stdio.h>
int main()
{
printf("hello world");
}
複製程式碼
假如我們編寫了多個c檔案,則編譯器會分別編譯成多個obj目標檔案,然後再通過連結器將所有目標檔案連結起來生成可執行檔案。
關於副檔名
注意windows系統的目標副檔名為obj,一般連結完成後也不會被刪除。而unix-like系統的目標副檔名為o,一般在連結完成後會被刪除。windows系統的可執行副檔名為exe,而unix-like系統的可執行檔名可以任意命名。此外,C語言原始檔一般字尾為c,而標頭檔案字尾為h,雖然沒有強制規定但大家都會去遵守這個約定。
關於編譯器
翻譯階段需要將C語言程式碼變為可執行程式,這些工作由C編譯器完成。C編譯器也有很多,常見的如下:
- GCC,GCC即(GNU Compiler Collection,GNU編譯器套件),由GNU開發的GPL許可的編譯器自由軟體。剛開始只作為C語言編譯器,但後來發展成多種語言編譯器,比如C、C++、Java、Android、Objective-C和Fortran等等。現在很多unix-like作業系統自帶GCC,將其作為標準編譯器。
- MS C,與微軟的Visual Studio一起整合釋出,由微軟提供的一套完整的整合開發環境,編譯後能在微軟的所有作業系統上執行。比如VS一般會使用CL編譯器。
- Clang,它是一個基於LLVM的C/C++/Objective-C輕量級編譯器,常用於Mac系統下。
- Turbo C,這是一個比較流行的C編譯器,小巧快速。
- cc,即C Compiler,這是一個unix系統古老的編譯器,很多經典書籍會看到這個編譯器。為保持相容,現在的linux系統會將cc作為一個符號連線指向gcc,即/usr/bin/cc -> gcc。
gcc編譯例子
以linux系統的gcc為例,看幾個編譯例子。假如hello.c的程式碼如下,
#include<stdio.h>
int main()
{
printf("hello world");
}
複製程式碼
我們直接使用如下的gcc命令對其進行編譯,而且不帶任何引數,此時將生成一個名為out.a的可執行檔案,通過./a.out
能夠輸出“hello world”。
gcc hello.c
複製程式碼
假如新增name.h/name.c和adder.h/adder.c兩對標頭檔案和原始檔,而且將hello.c稍作修改,三個檔案程式碼分別如下。
//name.h
char* get_name();
//name.c
char* get_name() {
char* name = "seaboat : ";
return name;
}
複製程式碼
//adder.h
int add(int a, int b);
//adder.c
int add(int a, int b) {
return (a + b);
}
複製程式碼
//hello.c
#include <stdio.h>
#include <stdlib.h>
#include <string.h>
#include"adder.h"
#include"name.h"
int main()
{
char* name = get_name();
char* hello = "hello world";
char* output = (char*)malloc(strlen(hello) + strlen(name));
sprintf(output, "%s%s", name, hello);
printf("%s\n", output);
int a = 1;
int b = 3;
printf("a + b = %d\n", add(a, b));
}
複製程式碼
則通過如下的命令可以對多個原始檔進行編譯和連結,最終生成一個名為a.out的可執行檔案。當我們通過./a.out執行可執行檔案時,它將輸出“seaboat : hello world a + b = 4”。
gcc name.c adder.c hello.c
複製程式碼
我們還可以通過下面兩個命令對name.c和adder.c兩個檔案編譯生成目標檔案,分別為adder.o和name.o。然後再通過下面第三行命令來編譯hello.c原始檔,編譯完後它會自動與name.o和adder.o兩個目標檔案進行連線。
gcc -c adder.c
gcc -c name.c
gcc name.o adder.o hello.c
複製程式碼
此外,還能夠通過下面的命令來給多個原始檔進行編譯並生成各自對應的目標檔案,這意味著不對它們進行連結。
gcc -c name.c adder.c hello.c
複製程式碼
對於多個目標檔案,如果要將他們連結可以通過下面的命令,便能夠生成可執行檔案。
gcc name.o adder.o hello.o
複製程式碼
如果我們想對生成的可執行檔案進行命名,那麼可以通過下面第一行命令來實現,將生成一個名為hello的可執行檔案。類似地,也可以對多個目標檔案進行連線時指定可執行檔名,如下面第二行命令,將生成一個名為hello2的可執行檔案。
gcc name.c adder.c hello.c -o hello
gcc name.o adder.o hello.o -o hello2
複製程式碼
關於字符集
編寫C語言時原始碼可以包括如下字符集:
- 英語大寫小寫字母
A B C D E F G H I J K L M N O P Q R S T U V W X Y Z
a b c d e f g h i j k l m n o p q r s t u v w x y z
複製程式碼
- 十進位制的阿拉伯數字
0 1 2 3 4 5 6 7 8 9
複製程式碼
- 其它符號
! " # % & ' () * + , - . / :
; < = > ? [ ] \ ^ _ { } | ~
複製程式碼
- 空白符
空格、水平製表符、垂直製表符、換行、換頁
複製程式碼
關於註釋
C語言提供的註釋方式有兩種:以/*
開始而以*/
結束來註釋多行程式碼,以//
開始來註釋單行程式碼。一般來說對原始碼中進行註釋則意味著編譯時會被前處理器清除掉,用空格來替代。
/*
第一種註釋方式
*/
//第二種註釋方式
複製程式碼
關於識別符號與關鍵詞
識別符號就是我們開發人員對變數、函式、型別、結構體、巨集等等的起名,C語言也要求我們要按照它的規定來取名。按照規定,識別符號可以由英文大小寫字母(A~Z, a~z)、阿拉伯數字(0~9)、和下劃線(_)組成。需要注意以下幾點:
- 要求不能以字母開頭。
- C語言對大小寫字母敏感。
- C語言不會對識別符號的長度進行限制,但標準允許編譯器忽略第31位以後的字元,具體擷取前多少位則由不同的編譯器來實現,當擷取的字串相同時則認為是同一個識別符號。
- 識別符號不應該亂取名,儘量要讓識別符號名字具有相應的意義。
當然C語言還保留了32個特殊的關鍵詞,我們命名的識別符號不能與它們相同,否則就會報錯。這32個關鍵詞如下:
關鍵字 | 說明 |
---|---|
auto | 宣告自動變數 |
break | 跳出當前迴圈 |
case | 開關語句分支 |
char | 宣告字元型變數或函式 |
const | 宣告只讀變數 |
continue | 結束當前迴圈,開始下一輪迴圈 |
default | 開關語句中的“預設”分支 |
do | 迴圈語句的迴圈體 |
double | 宣告雙精度變數或函式 |
else | 條件語句否定分支(與if連用) |
enum | 宣告列舉型別 |
extern | 宣告變數或函式是在其它檔案中宣告 |
float | 宣告浮點型變數或函式 |
for | 一種迴圈語句 |
goto | 無條件跳轉語句 |
if | 條件語句 |
int | 宣告整型變數或函式 |
long | 宣告長整型變數或函式 |
register | 宣告暫存器變數 |
return | 子程式返回語句(可以帶引數,也可不帶引數) |
short | 宣告短整型變數或函式 |
signed | 宣告有符號型別變數或函式 |
sizeof | 計算資料型別或變數長度(所佔位元組數) |
static | 宣告靜態變數 |
struct | 宣告結構體變數或函式 |
switch | 用於開關語句 |
typedef | 用以給資料型別取別名 |
unsigned | 宣告無符號型別變數或函式 |
union | 宣告共用體型別 |
void | 宣告函式無返回值或無引數,宣告無型別指標 |
volatile | 說明變數在程式執行中可被隱含地改變 |
while | 迴圈語句的迴圈條件 |
作者簡介:筆名seaboat,擅長人工智慧、電腦科學、數學原理、基礎演算法。書籍:《Tomcat核心設計剖析》、《圖解資料結構與演算法》、《人工智慧原理科普》。
專注於人工智慧、讀書與感想、聊聊數學、電腦科學、分散式、機器學習、深度學習、自然語言處理、演算法與資料結構、Java深度、Tomcat核心等。