關於c++ STL map 和 unordered_map 的效率的對比測試

本文採用在隨機讀取和插入的情況下測試map和unordered_map的效率

筆者的電腦是台渣機,現給出配置資訊

處理器 : Intel® Pentium(R) CPU G850 @ 2.90GHz × 2
記憶體 : 7.7GiB
作業系統 : Ubuntu 20.04.2 LTS 64位(Noi Linux 2.0)

由於在數據量小的情況下二者時間差異微乎其微,測試範圍從1e4開始到1e7,map unordered_map存儲為 int, int二元組,int三元組

單 int測試

插入範圍 查詢範圍 map插入時間 map查詢時間 unordered_map插入時間 unordered_map查詢時間
10000 10000 11.95ms 10.268ms 15.184ms 5.009ms
100000 100000 113.374ms 134.365ms 200.852ms 79.029ms
1000000 1000000 1606.66ms 1819.2ms 2603.46ms 862.877ms
10000000 10000000 21688.5ms 25461.7ms 33973.7ms 9484.45ms
#include <bits/stdc++.h>

using namespace std;

int main()
{
    for(int n = 1e4, m = 1e4; n <= 1e9, m <= 1e9; n *= 10,m *= 10)
    {
        cout << n << "|" << m ;
        srand(n);
        int t0 = clock();
        map <int ,int> M;
        for(int i = 1; i <= n; i++)
        {
            M[rand()] = i;
        }
        cout << "| " << (double)(clock() - t0) / 1000 << "ms ";
        unsigned sum = 0;
        t0 = clock();
        for(int i = 1; i <= m; i++)
        {
            sum += M[rand()];
        }
        cout << "| " << (double)(clock() - t0) / 1000 << "ms ";
        srand(n);
        unordered_map <int, int> U;
        for(int i = 1; i <= n; i++)
        {
            U[rand()] = i;
        }
        cout << "| " << (double)(clock() - t0) / 1000 << "ms ";
        sum = 0;
        t0 = clock();
        for(int i = 1; i <= m; i++)
        {
            sum += U[rand()];
        }
        cout << "| " << (double)(clock() - t0) / 1000 << "ms |" << endl;
    }
    return 0;
}

二元組測試

插入範圍 查詢範圍 map插入時間 map查詢時間 unordered_map插入時間 unordered_map查詢時間
10000 10000 10.617ms 11.523ms 16.301ms 5.14ms
100000 100000 122.489ms 141.413ms 195.278ms 70.122ms
1000000 1000000 1792.69ms 2173.48ms 2879.21ms 783.437ms
10000000 10000000 25017.8ms 28777.1ms 36499.8ms 8666.73ms
#include <bits/stdc++.h>

using namespace std;
struct PII
{
    int x, y;

    bool operator ==(const PII b) const
    {
        return x == b.x && y == b.y;
    }

    bool operator <(const PII b) const
    {
        return x != b.x ? x < b.x : y < b.y;
    }

};

struct hashPII
{
    size_t operator()(const PII &p) const
    {
        return hash<int>()(p.x) ^ hash<int>()(p.y);
    }
};

int main()
{
    for(int n = 1e4, m = 1e4; n <= 1e9, m <= 1e9; n *= 10,m *= 10)
    {
        cout << n << "|" << m ;
        srand(n);
        int t0 = clock();
        map <PII ,int> M;
        for(int i = 1; i <= n; i++)
        {
            M[{rand(), rand()}] = i;
        }
        cout << "| " << (double)(clock() - t0) / 1000 << "ms ";
        unsigned sum = 0;
        t0 = clock();
        for(int i = 1; i <= m; i++)
        {
            sum += M[{rand(), rand()}];
        }
        cout << "| " << (double)(clock() - t0) / 1000 << "ms ";
        srand(n);
        unordered_map <PII, int, hashPII> U;
        for(int i = 1; i <= n; i++)
        {
            U[{rand(), rand()}] = i;
        }
        cout << "| " << (double)(clock() - t0) / 1000 << "ms ";
        sum = 0;
        t0 = clock();
        for(int i = 1; i <= m; i++)
        {
            sum += U[{rand(), rand()}];
        }
        cout << "| " << (double)(clock() - t0) / 1000 << "ms |" << endl;
    }
    return 0;
}

三元組測試


插入範圍 查詢範圍 map插入時間 map查詢時間 unordered_map插入時間 unordered_map查詢時間
10000 10000 9.265ms 10.061ms 14.415ms 4.325ms
100000 100000 127.82ms 141.59ms 196.931ms 70.29ms
1000000 1000000 1700.73ms 1971.21ms 2685.96ms 782.957ms

O2

單 int測試

插入範圍 查詢範圍 map插入時間 map查詢時間 unordered_map插入時間 unordered_map查詢時間
10000 10000 2.103ms 2.617ms 3.775ms 1.261ms
100000 100000 46.243ms 67.461ms 86.591ms 34.024ms
1000000 1000000 822.828ms 1056.85ms 1412.39ms 422.122ms
10000000 10000000 13690.2ms 16854.1ms 20994.4ms 4903.84ms

二元組測試

插入範圍 查詢範圍 map插入時間 map查詢時間 unordered_map插入時間 unordered_map查詢時間
10000 10000 2.463ms 3.461ms 4.908ms 2.209ms
100000 100000 61.531ms 89.114ms 127.359ms 49.821ms
1000000 1000000 1301.74ms 1692.79ms 2184.67ms 585.508ms
10000000 10000000 21245.7ms 24632.5ms 30906.3ms 7312.4ms

理論複雜度

map<int, int> unordered_map<int, int>
插入 \(O(log( n ) )\) \(O(log(n / m)\) m = 桶數
讀取 \(O(log( n ) )\) \(O(1) ?\)

我們知道map的底層是一顆紅黑樹,插入和查複雜度均為$O(log n)而unordered_map是由hashstable + buckets實現的,當hashtab產生衝突時,數據量在8以內使用鏈表來實現桶,當數據量大於8 則自動轉換為紅黑樹 也就是map的實現結構

hash_map

可以發現隨著數據量的增大unordered_map在插入上由於衝突,性能是不及map的插入\(O(logn)\)的,但是其優秀的\(O(1) ?\)讀取具有很大的性能優勢,二者要看情況使用