C++中有很多中key-value形式的容器,map/hash_map/unordered_map/vector_map。下面講述各個map的使用及其區別。
首先,map的基本使用方法如下:
-
#include <iostream>
-
#include <map>
-
using namespace std;
-
-
typedef std::map<int, string> Map;
-
typedef Map::iterator MapIt;
-
-
int main()
-
{
-
Map *map = new Map();
-
int key;
-
string value;
-
while(cin>>key>>value)
-
{
-
map->insert(make_pair(key, value));
-
}
-
for(MapIt it = map->begin(); it != map->end(); ++it)
-
cout<<"key:"<<it->first<<" value:"<<it->second<<endl;
-
delete map;
-
return 0;
-
}
map使用紅黑樹實現。查詢時間在O(lg(n))-O(2*log(n))之間,構建map花費的時間比較長,因而,map使用於那種插入和查詢混合的情況。如果是先插入後查詢的情況,可以考慮使用vector_map.
vector_map在C++中沒有實現,想使用可以自己實現。其基本思想在於使用vector來儲存資料,插入完成後進行排序,然後使用而分查詢進行查詢。這樣在先插入後查詢的條件下,效能會比map好很多。原因主要在一下幾個方面。
- vector使用線性儲存,map是二叉樹形狀,所以vector的區域性性更好。
- vector可以一次分配很大的記憶體,而map需要每次分配一個節點,而且map中相對於vector有很多冗餘資料,比如指向子節點的指標。
- vector是插入完成後統一進行排序,而map每次insert都有一次查詢和樹的旋轉。
- vector_map是二分查詢,查詢時間穩定在O(lg(n)),而map的儲存結構是紅黑樹,查詢時間為O(lg(n))-O(2*log(n))。
map的key可以是自定義資料結構,但是需要過載<運算子。如下程式碼所示:
-
typedef struct _Key
-
{
-
_Key(int *p, int l)
-
{
-
len_ = l;
-
for(int i = 0; i < l; ++i)
-
p_[i] = p[i];
-
}
-
bool operator<(const _Key &rs) const
-
{
-
if(len_ == rs.len_)
-
{
-
for(int i = 0; i < len_; ++i)
-
return p_[i] < rs.p_[i];
-
return false;
-
}
-
else
-
return len_ < rs.len_;
-
}
-
int p_[MaxLen];
-
int len_;
-
}Key;
-
typedef std::map<Key, vector<int> *> MyMap;
需要注意的是,過載函式必須為const的。
當然,你也可以這麼做:
-
typedef struct _Key
-
{
-
_Key(int *p, int l)
-
{
-
len_ = l;
-
for(int i = 0; i < l; ++i)
-
p_[i] = p[i];
-
}
-
int p_[MaxLen];
-
int len_;
-
}Key;
-
typedef struct _KeyCmp
-
{
-
bool operator()(const Key &ls, const Key &rs)
-
{
-
if(ls.len_ == rs.len_)
-
{
-
for(int i = 0; i < ls.len_; ++i)
-
return ls.p_[i] < rs.p_[i];
-
return false;
-
}
-
else
-
return ls.len_ < rs.len_;
-
}
-
}KeyCmp;
-
typedef std::map<Key, vector<int> *, KeyCmp> MyMap;
與上面有相同的效果。
hash_map,STL中的實現叫做unordered_map,都是基於hash_table實現的。首先,分配一大片記憶體,形成很多桶。利用hash函式,將key對映到不同的桶中,當然,也有可能會有兩個不同的key對映到同一個桶中,這是,就需要判別函式來進行查詢了。所以,hash_map的key需要兩個條件,一個是hash函式,獲得對映到的桶的值,另外一個是equal_to函式,判定兩個key是否相等。顯然,當每個桶裡的元素個數比較平均且比較少的時候,查詢效能比較高。
使用樣例如下:
-
#include <string>
-
#include <iostream>
-
#include <ext/hash_map>
-
using namespace std;
-
using namespace __gnu_cxx;
-
-
struct str_hash
-
{
-
size_t operator()(const string &s) const
-
{
-
return __stl_hash_string(s.c_str());
-
}
-
};
-
-
struct str_compare
-
{
-
int operator()(const string &a, const string &b) const
-
{
-
return (a==b);
-
}
-
};
-
typedef hash_map<string, string, str_hash, str_compare> StrMap;
-
-
int main()
-
{
-
StrMap strMap;
-
string a,b;
-
cout<<"插入:"<<endl;
-
while(cin>>a>>b)
-
{
-
if(a.length() <= 1)
-
break;
-
strMap.insert(make_pair(a,b));
-
}
-
cout<<"查詢:"<<endl;
-
while(cin>>a)
-
{
-
if(a.length() <= 1)
-
break;
-
if(strMap.find(a) != strMap.end())
-
cout<<strMap[a]<<endl;
-
else
-
cout<<"not found"<<endl;
-
}
-
return 0;
-
}
在編譯的時候會遇到warning:
-
***@ubuntu:~/Maps$ g++ -o hm hash_map.cpp
-
In file included from /usr/include/c++/4.6/ext/hash_map:61:0,
-
from hash_map.cpp:3:
-
/usr/include/c++/4.6/backward/backward_warning.h:33:2: 警告: #warning This file includes at least one deprecated or antiquated header which may be removed without further notice at a future date. Please use a non-deprecated interface with equivalent functionality instead. For a listing of replacement headers and interfaces, consult the file backward_warning.h. To disable this warning use -Wno-deprecated. [-Wcpp]
按照提示,g++編譯時新增引數即可消除。
unordered_map和hash_map的使用方式差不多,如下所示:
-
#include <iostream>
-
#include <unordered_map>
-
#include <string>
-
using namespace std;
-
-
unsigned int JSHash(const char *str)
-
{
-
unsigned int hash = 1315423911;
-
while(*str)
-
{
-
hash ^= ((hash<< 5) + (*str++) + (hash>>2));
-
}
-
return (hash & 0x7FFFFFFF);
-
}
-
-
struct StrHash
-
{
-
size_t operator()(const string &s) const
-
{
-
return JSHash(s.c_str());
-
}
-
};
-
struct StrCompare
-
{
-
bool operator()(const string &a, const string &b) const
-
{
-
return a==b;
-
}
-
};
-
typedef unordered_map<string, string, StrHash, StrCompare> MyMap;
-
int main()
-
{
-
MyMap mymap;
-
string a,b;
-
while(cin>>a>>b)
-
{
-
mymap[a] = b;
-
}
-
for(MyMap::iterator it = mymap.begin(); it != mymap.end(); ++it)
-
cout<<it->first<<" "<<it->second<<endl;
-
return 0;
-
}
如果直接g++不帶其他引數編譯的話,會提示錯誤:
-
***@ubuntu:~/Maps$ g++ -o um unordered_map.cpp
-
In file included from /usr/include/c++/4.6/unordered_map:35:0,
-
from unordered_map.cpp:2:
-
/usr/include/c++/4.6/bits/c++0x_warning.h:32:2: 錯誤: #error This file requires compiler and library support for the upcoming ISO C++ standard, C++0x. This support is currently experimental, and must be enabled with the -std=c++0x or -std=gnu++0x compiler options.
-
unordered_map.cpp:30:9: 錯誤: ‘unordered_map’不是一個型別名
-
unordered_map.cpp: 在函式‘int main()’中:
-
unordered_map.cpp:33:2: 錯誤: ‘MyMap’在此作用域中尚未宣告
-
unordered_map.cpp:33:8: 錯誤: expected ‘;’ before ‘mymap’
-
unordered_map.cpp:37:3: 錯誤: ‘mymap’在此作用域中尚未宣告
-
unordered_map.cpp:39:6: 錯誤: ‘MyMap’既不是類也不是名稱空間
-
unordered_map.cpp:39:22: 錯誤: expected ‘;’ before ‘it’
-
unordered_map.cpp:39:42: 錯誤: ‘it’在此作用域中尚未宣告
-
unordered_map.cpp:39:48: 錯誤: ‘mymap’在此作用域中尚未宣告
需要在編譯時新增-std=c++0x引數即可。
總體來說,hash_map的查詢速度比map要快,因為hash_map的查詢速度與資料量大小無關,屬於常數級別。map的查詢速度是log(n)級別。但是hash_map每次查詢都需要執行hash函式,所以也比較耗時。而且,hash_map很多桶中可能都沒有元素,所以記憶體利用率不高。
所以,選擇map的時候,需要從三個方面考慮:應用場景/記憶體佔用/查詢速度。
本次總結到此完畢,如有不詳盡之處或錯誤,請多多指教。
參考連結:
http://www.cnblogs.com/Frandy/archive/2011/07/26/Hash_map_Unordered_map.html
http://yujiawei.iteye.com/blog/409774
http://www.189works.com/article-7126-1.html