MySQL中,常常會看到一些關於動態字串的處理,列如:DYNAMIC_STRING。
為了記錄動態字串的實際長度,緩衝區的最大長度,以及每次字串需要調整時,及時分配新的記憶體,以及調整長度。MySQL使用了DYNAMIC_STRING來儲存動態字串相關的資訊:
1 2 3 4 5 |
typedef struct st_dynamic_string { char *str; size_t length, max_length, alloc_increment; } DYNAMIC_STRING; |
在這個結構體中,str儲存實際字串的首地址,length記錄字串的實際長度,max_length記錄字串緩衝區最多可以存放多少字元,alloc_increment表示當字串需要分配記憶體時,每次分配多少記憶體。
下面看看這個結構體的初始化過程:
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 |
my_bool init_dynamic_string( DYNAMIC_STRING *str, const char *init_str, size_t init_alloc, size_t alloc_increment ) { size_t length; DBUG_ENTER( "init_dynamic_string" ); if ( !alloc_increment ) alloc_increment = 128; length = 1; if ( init_str && (length = strlen( init_str ) + 1) < init_alloc ) init_alloc = ( (length + alloc_increment - 1) / alloc_increment) * alloc_increment; if ( !init_alloc ) init_alloc = alloc_increment; if ( !(str->str = (char *) my_malloc( init_alloc, MYF( MY_WME ) ) ) ) DBUG_RETURN( TRUE ); str->length = length - 1; if ( init_str ) memcpy( str->str, init_str, length ); str->max_length = init_alloc; str->alloc_increment = alloc_increment; DBUG_RETURN( FALSE ); } |
從上述函式可以看到,初始化時,初始分配的字串緩衝區大小init_alloc會根據需要初始的字串來做判斷。在分配好該DYNAMIC_STRING空間之後,我們會根據緩衝區的大小,字串的實際長度,以及alloc_increment來初始化:
length:字串的實際長度
max_length:緩衝區的最大長度
alloc_increment:空間不夠時,下次分配記憶體的單元大小.
初始化這些內容之後,如果下次需要在該緩衝區新增更多字元,就可以根據這些值來判斷是否需要對該緩衝區擴容:
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 |
my_bool dynstr_append_mem( DYNAMIC_STRING *str, const char *append, size_t length ) { char *new_ptr; if ( str->length + length >= str->max_length ) /* 如果新增字串後,總長度超過緩衝區大小 */ { /* 需要分配多少個alloc_increment 大小的記憶體,才能存下新增後的字串 */ size_t new_length = (str->length + length + str->alloc_increment) / str->alloc_increment; new_length *= str->alloc_increment; if ( !(new_ptr = (char *) my_realloc( str->str, new_length, MYF( MY_WME ) ) ) ) return(TRUE); str->str = new_ptr; str->max_length = new_length; } /* 將新分配的內容,append到str之後 */ memcpy( str->str + str->length, append, length ); str->length += length; /* 擴容之後str新的長度 */ str->str[str->length] = 0; /* Safety for C programs */ /* 字串最後一個字元為’\0' */ return(FALSE); } |
從上述程式碼可以看到,在字串初始化化好之後,之後如果需要給該字串增加新的內容,只需要根據之前儲存的資訊來動態的realloc就好了。由於該結構體記錄了字串相關的完整內容,所以動態的擴容會非常方便處理。
當然,除了這些,還有比如字串截斷,字串初始設定,轉義OS的引號等等:
將字串偏移大於N之後的截斷。
1 2 3 4 5 6 |
my_bool dynstr_trunc( DYNAMIC_STRING *str, size_t n ) { str->length -= n; str->str[str->length] = '\0'; return(FALSE); } |
返回字串中第一次出現某個字元的地址。若沒有,則返回字串結尾的地址(指向’’)
1 2 3 4 5 6 7 8 9 10 |
char *strcend( register const char *s, register pchar c ) { for (;; ) { if ( *s == (char) c ) return( (char *) s); if ( !*s++ ) return( (char *) s - 1); } } |
字串內容擴容:
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 |
my_bool dynstr_realloc( DYNAMIC_STRING *str, size_t additional_size ) { DBUG_ENTER( "dynstr_realloc" ); if ( !additional_size ) DBUG_RETURN( FALSE ); if ( str->length + additional_size > str->max_length ) /* 如果新的字串內容超過緩衝區的最大長度 */ { str->max_length = ( (str->length + additional_size + str->alloc_increment - 1) / str->alloc_increment) * str->alloc_increment; if ( !(str->str = (char *) my_realloc( str->str, str->max_length, MYF( MY_WME ) ) ) ) DBUG_RETURN( TRUE ); } DBUG_RETURN( FALSE ); } |
對字串用引號括起來,對其中的單引號進行轉義,主要用於執行一些系統命令(system(cmd))。
比如:ls -al 會變成 ‘ls -al’
比如:ls -a’l會變成’ls -a\’l’
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 |
/* * Concatenates any number of strings, escapes any OS quote in the result then * surround the whole affair in another set of quotes which is finally appended * to specified DYNAMIC_STRING. This function is especially useful when * building strings to be executed with the system() function. * * @param str Dynamic String which will have addtional strings appended. * @param append String to be appended. * @param ... Optional. Additional string(s) to be appended. * * @ note The final argument in the list must be NullS even if no additional * options are passed. * * @return True = Success. */ my_bool dynstr_append_os_quoted( DYNAMIC_STRING *str, const char *append, ... ) { const char *quote_str = "\'"; const uint quote_len = 1; my_bool ret = TRUE; va_list dirty_text; ret &= dynstr_append_mem( str, quote_str, quote_len ); /* Leading quote */ va_start( dirty_text, append ); while ( append != NullS ) { const char *cur_pos = append; const char *next_pos = cur_pos; /* Search for quote in each string and replace with escaped quote */ while ( *(next_pos = strcend( cur_pos, quote_str[0] ) ) != '\0' ) { ret &= dynstr_append_mem( str, cur_pos, (uint) (next_pos - cur_pos) ); ret &= dynstr_append_mem( str, "\\", 1 ); ret &= dynstr_append_mem( str, quote_str, quote_len ); cur_pos = next_pos + 1; } ret &= dynstr_append_mem( str, cur_pos, (uint) (next_pos - cur_pos) ); append = va_arg( dirty_text, char * ); } va_end( dirty_text ); ret &= dynstr_append_mem( str, quote_str, quote_len ); /* Trailing quote */ return(ret); } |
通過定義動態字串的結構體資訊,每次分次進行字串新增更多字元,都會根據字串的當前的長度動態的擴容。而且每次擴容後,該結構體都記錄的當前字串的實際資訊(當前字串的長度,緩衝器可容納字串的長度,進行擴容的單元長度)。這樣,動態字串的處理操作就變得非常方便了。