PHP HASH表
在PHP中,所有的資料 無論變數,常量,類,屬性 都用Hash表來實現.
先要說說 HASH表
- typedef struct bucket {
- ulong h; /* Used for numeric indexing */
- uint nKeyLength; //key長度
- void *pData; //指向 Bucke儲存的資料 指標
- void *pDataPtr; //指標資料
- struct bucket *pListNext; //下一個元素指標
- struct bucket *pListLast;//上一個元素指標
- struct bucket *pNext;
- struct bucket *pLast;
- char arKey[1]; /* Must be last element */
- } Bucket;
- typedef struct _hashtable {
- uint nTableSize;//HashTable的大小
- uint nTableMask;//等於nTableSize-1
- uint nNumOfElements;//物件個數
- ulong nNextFreeElement;//指向下一個空元素位置 nTableSize+1
- Bucket *pInternalPointer; /* Used for element traversal *///儲存當前遍歷的指標
- Bucket *pListHead;//頭元素指標
- Bucket *pListTail;//尾元素指標
- Bucket **arBuckets;//儲存hash陣列資料
- dtor_func_t pDestructor;//類似於解構函式
- zend_bool persistent;//用哪種方法分配記憶體空間 PHP統一管理記憶體還是用普通的malloc
- unsigned char nApplyCount;//當前hash bucket被訪問的次數,是否遍歷過資料,防止無限遞迴迴圈
- zend_bool bApplyProtection;
- #if ZEND_DEBUG
- int inconsistent;
- #endif
- } HashTable;
我們結合 HASH表初始化函式來說
- ZEND_API int _zend_hash_init(HashTable *ht, uint nSize, hash_func_t pHashFunction, dtor_func_t pDestructor, zend_bool persistent ZEND_FILE_LINE_DC)
- {
- uint i = 3;
- Bucket **tmp;
- SET_INCONSISTENT(HT_OK);
- if (nSize >= 0x80000000) { //HASH表大小大於0x8則初始化為0x8
- /* prevent overflow */
- ht->nTableSize = 0x80000000;
- } else {
- while ((1U << i) < nSize) { //調整為 2的n次方 i++; } ht->nTableSize = 1 << i;//HASH bucket大小 為 2的i次方 i=3 ,nTableSize最小值為8
- }
- //為了提高計算效率,系統自動會將nTableSize調整到最小一個不小於nTableSize的2的整數次方。也就是說,如果在初始化HashTable時指定一個nTableSize不是2的整數次方,系統將會自動調整nTableSize的值 <!--EndFragment-->
- ht->nTableMask = ht->nTableSize - 1;
- ht->pDestructor = pDestructor;//一個函式指標,當HashTable發生增,刪,改時呼叫
- ht->arBuckets = NULL;
- ht->pListHead = NULL;
- ht->pListTail = NULL;
- ht->nNumOfElements = 0;
- ht->nNextFreeElement = 0;
- ht->pInternalPointer = NULL;
- ht->persistent = persistent;//如果persisient為TRUE,則使用作業系統本身的記憶體分配函式為Bucket分配記憶體,否則使用PHP的記憶體分配函式
- ht->nApplyCount = 0;
- ht->bApplyProtection = 1;
- /* Uses ecalloc() so that Bucket* == NULL */
- if (persistent) { //作業系統本身記憶體分配方式分配記憶體,calloc分配記憶體後自動初始化為0
- tmp = (Bucket **) calloc(ht->nTableSize, sizeof(Bucket *));
- if (!tmp) {
- return FAILURE;
- }
- ht->arBuckets = tmp;
- } else {//用PHP的記憶體管理機制分配記憶體
- tmp = (Bucket **) ecalloc_rel(ht->nTableSize, sizeof(Bucket *));
- if (tmp) {
- ht->arBuckets = tmp;
- }
- }
- //自動申請一塊記憶體給arBuckets,該記憶體大小等於 nTableSize
- return SUCCESS;
- }
在讀原始碼的時候 ,經常會看到 EG,PG,CG這樣的巨集
CG是 compile_global的簡寫
EG是excutor_global的簡寫
G就是全域性變數的意思
我們就以EG巨集為例
- #ifdef ZTS
- # define EG(v) TSRMG(executor_globals_id, zend_executor_globals *, v)
- #else
- # define EG(v) (executor_globals.v)
- extern ZEND_API zend_executor_globals executor_globals;
- #endif
很簡單 只是一個獲取全域性變數的巨集
那麼我們看看 zend_executor_globals這個結構體
在/Zend/zend.h裡面定義
typedef struct _zend_executor_globals zend_executor_globals;
是一個 _zend_executor_globals的別名
同一個檔案裡找到它
PHP的所有 區域性變數,全域性變數,函式,類的 Hash表 都在這裡定義了
- struct _zend_executor_globals {
- zval **return_value_ptr_ptr;
- zval uninitialized_zval;
- zval *uninitialized_zval_ptr;
- zval error_zval;
- zval *error_zval_ptr;
- zend_ptr_stack arg_types_stack;
- /* symbol table cache */
- HashTable *symtable_cache[SYMTABLE_CACHE_SIZE];
- HashTable **symtable_cache_limit;
- HashTable **symtable_cache_ptr;
- zend_op **opline_ptr;
- HashTable *active_symbol_table; //區域性變數
- HashTable symbol_table; /* main symbol table */ //全域性變數
- HashTable included_files; /* files already included */ //include的檔案
- JMP_BUF *bailout;
- int error_reporting;
- int orig_error_reporting;
- int exit_status;
- zend_op_array *active_op_array;
- HashTable *function_table; /* function symbol table */ //函式表
- HashTable *class_table; /* class table */ //類表
- HashTable *zend_constants; /* constants table */ //常量表
- zend_class_entry *scope;
- zend_class_entry *called_scope; /* Scope of the calling class */
- zval *This;
- long precision;
- int ticks_count;
- zend_bool in_execution;
- HashTable *in_autoload;
- zend_function *autoload_func;
- zend_bool full_tables_cleanup;
- /* for extended information support */
- zend_bool no_extensions;
- #ifdef ZEND_WIN32
- zend_bool timed_out;
- OSVERSIONINFOEX windows_version_info;
- #endif
- HashTable regular_list;
- HashTable persistent_list;
- zend_vm_stack argument_stack;
- int user_error_handler_error_reporting;
- zval *user_error_handler;
- zval *user_exception_handler;
- zend_stack user_error_handlers_error_reporting;
- zend_ptr_stack user_error_handlers;
- zend_ptr_stack user_exception_handlers;
- zend_error_handling_t error_handling;
- zend_class_entry *exception_class;
- /* timeout support */
- int timeout_seconds;
- int lambda_count;
- HashTable *ini_directives;
- HashTable *modified_ini_directives;
- zend_objects_store objects_store;
- zval *exception, *prev_exception;
- zend_op *opline_before_exception;
- zend_op exception_op[3];
- struct _zend_execute_data *current_execute_data;
- struct _zend_module_entry *current_module;
- zend_property_info std_property_info;
- zend_bool active;
- void *saved_fpu_cw;
- void *reserved[ZEND_MAX_RESERVED_RESOURCES];
- };
這裡先簡單看看,以後用到的時候再細說,
- PHP裡最基本的單元 變數:
在PHP裡 定義一個變數 再簡單不過了
如
- <?php
- $a=1;
- ?>
但是在核心中 它是用一個 zval結構體實現的
如上面定義變數 在核心中則執行了下面這些程式碼
- zval *val;
- MAKE_STD_ZVAL(val); //申請一塊記憶體
- ZVAL_STRING(val,"hello",1);//用ZVAL_STRING設定它的值為 "hello"
- ZEND_SET_SYMBOL(EG(active_symbol_table),"a",val));//將 val指標加入到符號表裡面去
巨集 MAKE_STD_ZVAL 定義如下
- #define MAKE_STD_ZVAL(zv)
- ALLOC_ZVAL(zv); //它歸根到底等於 (p) = (type *) emalloc(sizeof(type))
- INIT_PZVAL(zv);
INIT_PZVAL定義在
- #define INIT_PZVAL(z) 看得出它是初始化引數
- (z)->refcount__gc = 1;
- (z)->is_ref__gc = 0;
那麼 zval到底是什麼呢
在zend/zend.h裡面
typedef struct _zval_struct zval; //原來它是 _zval_struct 的別名
_zval_struct 定義如下
- typedef union _zvalue_value {
- long lval; //儲存long型別的資料
- double dval; //儲存 double型別的資料
- struct {
- char *val; //真正的值在這裡
- int len; //這裡返回長度
- } str;
- HashTable *ht;
- zend_object_value obj; //這是一個物件
- } zvalue_value;
- struct _zval_struct {
- zvalue_value value; //儲存的值
- zend_uint refcount__gc;//被引用的次數 如果為1 則只被自己使用如果大於1 則被其他變數以&的形式引用.
- zend_uchar type; //資料型別 這也是 為什麼 PHP是弱型別的原因
- zend_uchar is_ref__gc; //表示是否為引用
- };
如果還是不夠清楚..那麼我們實戰一下..用C來建立一個PHP變數
這裡需要一個擴充套件,PHP如果用C擴充套件模組 這裡就不說了
關鍵程式碼
- PHP_FUNCTION(test_siren){
- zval *value;
- char *s="create a php variable";
- value=(zval*)malloc(sizeof(zval));
- memset(value,0,sizeof(value));
- value->is_ref__gc=0; //非引用變數
- value->refcount__gc=1;//引用次數 只有自己
- value->type=IS_STRING;//型別為字串
- value->value.str.val=s;//值
- value->value.str.len=strlen(s);//長度
- ZEND_SET_SYMBOL(EG(active_symbol_table),"a",value);
- }
第三行和第四行的作用 與MAKE_STD_ZVAL的作用相同,給value分配記憶體空間
第5-9行 的作用與ZVAL_STRING的作用相同,
最後一行 是將value建立一個 在PHP裡叫$a的變數..並新增到區域性Hash表裡..
這樣 在PHP裡
- <?php
- test_siren(1);
- echo $a;
- ?>
就會輸出 “create a php variable”
OK,
大功告成
注意,我是為了讓大家看到PHP內部建立變數的流程 才採用C的形式建立變數,
絕對不推薦大家這樣做.
還是一定要用PHP內部的記憶體管理機制分配並處理記憶體。