獲取C/C++字串、字元陣列長度

蝸牛me發表於2018-03-26

在C/C++中常用的獲取字串長度或者字串陣列長度的函式有

sizeof()

length()

strlen()

size()

其中strlen(str)和str.length()和str.size()都可以用來求字串的長度
str.length()和str.size()是用於求string類物件的成員函式
strlen(str) 是用於求字串陣列的長度,其引數是char*

辨析strlen() 與 sizeof() 的區別

strlen(char*)

函式求是字串的實際長度,它可以用來獲取動態實際字元陣列的長度,是從開始到遇到第一個“\0”,如果只是定義沒有賦予初始值,這個結果是不確定的,它會從陣列的首地址開始一直找下去,直到遇到“\0”停止查詢。

sizeof()

求所佔總空間的位元組數,靜態的,跟初始狀態字元陣列的大小有關係,大小等於初始時字元陣列的大小或者等於初始時字元陣列的大小+1
在C++中,如果定義的是字串陣列的話,那麼如果想獲取陣列的長度,只能用sizeof(陣列名),而不能用strlen(str)

example

char str[20]="0123456789"; 
int   a=strlen(str); /*a=10;strlen 計算字串的長度,以\0'為字串結束標記。 
int   b=sizeof(str); /*b=20;sizeof 計算的則是分配的陣列str[20] 所佔的記憶體空間的大小,不受裡面儲存的內容影響
char *str1="absde";
char str2[]="absde";
char str3[8]={'a',};
char ss[] = "0123456789";

輸出:

sizeof(str1)=4;
sizeof(str2)=6;
sizeof(str3)=8;
sizeof(ss)=11

首先說明一點,char型別佔一個位元組,所以sizeof(char)是1,這點要理解

str1是一個指標,只是指向了字串”absde”而已。所以sizeof(str1)不是字串佔的空間也不是字元陣列佔的空間,而是一個字元型指標佔的空間。所以sizeof(str1)=sizeof(char*)=4,在C/C++中一個指標佔4個位元組

str2是一個字元型陣列。C/C++規定,對於一個陣列,返回這個陣列佔的總空間,所以sizeof(str2)取得的是字串”absde”佔的總空間。”absde”中,共有a b s d e \0六個字元,所以str2陣列的長度是6,所以sizeof(str2)=6*sizeof(char)=6

str3已經定義成了長度是8的陣列,所以sizeof(str3)為8

str4和str2類似,’0’ ‘1’ … ‘9’加上’\0’共11個字元,所以ss佔的空間是8

總之,對於指標,sizeof操作符返回這個指標佔的空間,一般是4個位元組;而對於一個陣列,sizeof返回這個陣列所有元素佔的總空間。char*與char[]容易混淆,一定要分清,而且char*=”aaa”的寫法現在不被提倡,應予以避免

而strlen不區分是陣列還是指標,就讀到\0為止返回長度。而且strlen是不把\0計入字串的長度的。


一、sizeof

sizeof(...)是運算子,在標頭檔案中typedef為unsigned int,其值在編譯時即計算好了,引數可以是陣列、指標、型別、物件、函式等。
它的功能是:獲得保證能容納實現所建立的最大物件的位元組大小。
由於在編譯時計算,因此sizeof不能用來返回動態分配的記憶體空間的大小。實際上,用sizeof來返回型別以及靜態分配的物件、結構或陣列所佔的空間,返回值跟物件、結構、陣列所儲存的內容沒有關係。
具體而言,當引數分別如下時,sizeof返回的值表示的含義如下:
陣列——編譯時分配的陣列空間大小;
指標——儲存該指標所用的空間大小(儲存該指標的地址的長度,是長整型,應該為4);
型別——該型別所佔的空間大小;
物件——物件的實際佔用空間大小;
函式——函式的返回型別所佔的空間大小。函式的返回型別不能是void。

二、strlen

strlen(...)是函式,要在執行時才能計算。引數必須是字元型指標(char*)。當陣列名作為引數傳入時,實際上陣列就退化成指標了。
它的功能是:返回字串的長度。該字串可能是自己定義的,也可能是記憶體中隨機的,該函式實際完成的功能是從代表該字串的第一個地址開始遍歷,直到遇到結束符NULL。返回的長度大小不包括NULL。

三、舉例:

eg1、char arr[10] = "What?";
          int len_one = strlen(arr);
          int len_two = sizeof(arr); 
          cout << len_one << " and " << len_two << endl; 
輸出結果為:5 and 10
點評:sizeof返回定義arr陣列時,編譯器為其分配的陣列空間大小,不關心裡面存了多少資料。strlen只關心儲存的資料內容,不關心空間的大小和型別。

eg2、char * parr = new char[10];
          int len_one = strlen(parr);
          int len_two = sizeof(parr);
          int len_three = sizeof(*parr);
          cout << len_one << " and " << len_two << " and " << len_three << endl;
輸出結果:23 and 4 and 1
點評:第一個輸出結果23實際上每次執行可能不一樣,這取決於parr裡面存了什麼(從parr[0]開始知道遇到第一個NULL結束);第二個結果實際上本意是想計算parr所指向的動態記憶體空間的大小,但是事與願違,sizeof認為parr是個字元指標,因此返回的是該指標所佔的空間(指標的儲存用的是長整型,所以為4);第三個結果,由於*parr所代表的是parr所指的地址空間存放的字元,所以長度為1。

string 類的常見應用

可以參考該連結,獲取更為詳細的介紹
C++使用內建的資料型別string來處理字串會很方便,可以完全代替C語言中的char陣列和char指標。
使用string類需要包含標頭檔案string,同時string 型別的變數結尾沒有“\0”,其本質是一個string類,因此可以通過呼叫string類中成員函式length()函式,如:

string s = "hello world";
int len = s.lenght();
cout<<len<<endl;

執行結果為:11
由於string變數的末尾沒有“\0”字元,所以length()返回的是字串的真實長度,而不是長度+1


在C++中可以用string類來代替C中的char陣列形式的字串,但是有些情況下是需要轉換成C語言風格的,如以下程式碼:

#include <stdio.h>
#include <math.h>
#define MAX 51
int main(){
    char s1 [MAX];
    char s2 [MAX];

    scanf("%s%s",s1,s2);
    int len = strlen(s1);

    for (int i=0;i<len;i++){
        if(s1[i]==s2[i])
            printf("1");
        else
            printf("0");
    }
    printf("\n");
    return 0;
}

這裡需要一個個的訪問實際陣列中的元素,當時如果利用C++中的sizeof函式時,獲取的是陣列的固定空間,而不是實際的動態空間。所以這裡只能用strlen(str)來獲取char陣列的實際長度(也即是使用者輸入的字串的長度),如果用sizeof(str)所得到的長度大小為51。

string型別的字串轉換成char陣列字串

string filename = "test.txt";
ifstream in ;
in.open(filename.c_str());

為了使用檔案開啟函式,必須將string型別的變數轉換為字串陣列

#ifndef _ITERATOR_DEBUG_LEVEL
#define _ITERATOR_DEBUG_LEVEL 0
#else
#undef _ITERATOR_DEBUG_LEVEL
#define _ITERATOR_DEBUG_LEVEL 0
#endif

#include <iostream>
#include <string>

//string字串->c字串轉換
void main()
{
    //string -> char*
    string s1 = "far away";
    const char* c = s1.c_str();
    printf("%s\n",c);

    //
    string s2 = c;

    //string->char[]
    //從string中賦值字元到char[]
    char arr[50] = {0};
    s1.copy(arr,4,0);

    cout << arr << endl;

    system("pause");
}

輸出結果:
far away
far
請按任意鍵繼續…

string字串的輸入輸出

string類過載了輸入輸出的運算子,用”>>”進行輸入,用”<<”進行輸出

#include <iostream>
#include <string>
using namespace std;
int main(){
    string s;
    cin >> s;  //輸入字串
    cout << s << endl;  //輸出字串

    system("pause");
    return 0;
}

執行結果:
c plus
c
請按任意鍵繼續…
雖然我們輸入了兩個由空格隔開的”c plus’,但是隻輸出了一個,這是因為輸入的運算子“>>”預設會忽略空格,遇到空格就認為輸入結束,所以最後輸入的plus沒有被儲存到變數裡面。

訪問字串中得字元

string 字串也可以像字串陣列一樣按照下標來訪問其中的每一個字元。string 字串的起始下標仍是從 0 開始。請看下面的程式碼:

#include <string>
using namespace std;

//string遍歷
void main(){
    string s1 = "abcdefg";

    //1、陣列方式

    cout << "陣列方式:" << endl;
    for (int i = 0; i < s1.length(); i++){
        cout <<s1[i] << endl;

    }

    //2、迭代方式
    cout << "迭代方式:" << endl;
    for (string::iterator it = s1.begin(); it != s1.end(); it++){

        cout<<*it<< endl;

    }

    system("pause");
}

輸出結果:
陣列方式:
a
b
c
d
e
f
g
迭代方式:
a
b
c
d
e
f
g
請按任意鍵繼續…

字串的拼接

有了string 類,我們可以使用”+“ 或者”+=“運算子來直接拼接字串,非常方便,再也不需要使用C語言中的strcat(),strcopy(),malloc()等函式來拼接字串了,再也不用擔心空間不夠溢位了。
下面來看列子:

//字串拼接
void main()
{
    string s1 = "alan";
    string s2 = "xiho";

    //1.
    string s3 = s1 + s2;

    string s4 = " wahaha";

    //2.
    s3.append(s4);

    cout << s3 << endl;

    system("pause");
}

輸出結果為:
alanxiho wahaha
請按任意鍵繼續…


四、參考資料:

Sizeof與Strlen的區別與聯絡(轉)

1.sizeof操作符的結果型別是size_t,它在標頭檔案中typedef為unsigned int型別。
該型別保證能容納實現所建立的最大物件的位元組大小。

2.sizeof是算符,strlen是函式。

3.sizeof可以用型別做引數,strlen只能用char*做引數,且必須是以”\0”結尾的。
sizeof還可以用函式做引數,比如:
short f();
printf(“%d\n”, sizeof(f()));
輸出的結果是sizeof(short),即2。

4.陣列做sizeof的引數不退化,傳遞給strlen就退化為指標了。

5.大部分編譯程式 在編譯的時候就把sizeof計算過了 是型別或是變數的長度這就是sizeof(x)可以用來定義陣列維數的原因
char str[20]=”0123456789”;
int a=strlen(str); //a=10;
int b=sizeof(str); //而b=20;

6.strlen的結果要在執行的時候才能計算出來,時用來計算字串的長度,不是型別佔記憶體的大小。

7.sizeof後如果是型別必須加括弧,如果是變數名可以不加括弧。這是因為sizeof是個操作符不是個函式。

8.當適用了於一個結構型別時或變數, sizeof 返回實際的大小,
當適用一靜態地空間陣列, sizeof 歸還全部陣列的尺寸。
sizeof 操作符不能返回動態地被分派了的陣列或外部的陣列的尺寸

9.陣列作為引數傳給函式時傳的是指標而不是陣列,傳遞的是陣列的首地址,
如:
fun(char [8])
fun(char [])
都等價於 fun(char *)
在C++裡引數傳遞陣列永遠都是傳遞指向陣列首元素的指標,編譯器不知道陣列的大小
如果想在函式內知道陣列的大小, 需要這樣做:
進入函式後用memcpy拷貝出來,長度由另一個形參傳進去
fun(unsiged char *p1, int len)
{
unsigned char* buf = new unsigned char[len+1]
memcpy(buf, p1, len);
}

我們能常在用到 sizeof 和 strlen 的時候,通常是計算字串陣列的長度
看了上面的詳細解釋,發現兩者的使用還是有區別的,從這個例子可以看得很清楚:

char str[20]=”0123456789”;
int a=strlen(str); //a=10; >>>> strlen 計算字串的長度,以結束符 0x00 為字串結束。
int b=sizeof(str); //而b=20; >>>> sizeof 計算的則是分配的陣列 str[20] 所佔的記憶體空間的大小,不受裡面儲存的內容改變。

上面是對靜態陣列處理的結果,如果是對指標,結果就不一樣了

char* ss = “0123456789”;
sizeof(ss) 結果 4 ===》ss是指向字串常量的字元指標,sizeof 獲得的是一個指標的之所佔的空間,應該是

長整型的,所以是4
sizeof(*ss) 結果 1 ===》*ss是第一個字元 其實就是獲得了字串的第一位’0’ 所佔的記憶體空間,是char類

型的,佔了 1 位

strlen(ss)= 10 >>>> 如果要獲得這個字串的長度,則一定要使用 strlen

相關文章