unordered_map的底层数据结构
C++的unordered_map是基于开放寻址法或链地址法实现的哈希表结构
链地址法
unordered_map
通常采用链地址法解决哈希冲突。通过将哈希表的每个桶(bucket)设计为一个链表,所有哈希值相同的元素都被放置在同一个链表中。
开放地址法
开放寻址法不使用链表,而是通过在哈希表中寻找下一个可用的位置来插入冲突的元素。
下一个位置可能就是下一个bucket。当然,也有可能是使用第二个哈希函数,重新计算得到下一个位置。
当然,这只是最简单的两种哈希方式。这种在rehash的时候的开销非常大。所以还有其他一些常见的哈希方式。这些一般会在一些对数据读写有更高要求的应用中有需求。比如关系型数据库的哈希索引之类的。
可扩展哈希
如果发现某个bucket超过容量了,只会把一个bucket变成两个bucket。不会触发其他bucket的reash。(主要可以参看cmu15445 bustub实现的extendible hash)
cuckoo哈希(布谷鸟哈希)
Cuckoo Hashing保证了最坏情况下O(1)的查找时间。他主要使用了两个哈希函数,一个key会放置到其中某一个哈希函数空闲的bucket。如果两个bucket都满了,就会选择pop其中一个bucket。
遍历时删除
遍历时一般都会使用自带的迭代器。但是如果在迭代中有删除操作,不能使用迭代器++的方式。erase会返回下一个可用的迭代器。所以直接选用这一迭代器作为下一个即可。
1 | void correct_deletion_with_iterator() { |