Redis的8大数据类型用法和使用场景以及每种数据类型低层实现原理-NoSql-i可爱猫论坛-可爱猫小黑,致力于为易语言、PHP语言交流

Redis的8大数据类型用法和使用场景以及每种数据类型低层实现原理

admin 2024-10-07 17:57:26 4250 全屏阅读只看Ta

Redis 是一个高性能的键值存储，它支持多种丰富的数据类型。每种数据类型都有其特定的用途和底层实现。下面我将介绍 Redis 支持的主要数据类型及其背后的数据结构。
本人这里还有几篇详细的Redis用法文章，可以用来进阶康康！

1. 字符串 (String)

数据结构

字符串是 Redis 中最基本的数据类型，可以是文本、数字、二进制数据等。它在 Redis 内部是以动态字符串 (SDS, Simple Dynamic String) 实现的。SDS 除了字符串本身，还有额外的属性来缓存长度。

简单动态字符串 (SDS)：
length：当前已使用的字符串长度。
free：未使用的预分配空间长度。
buf：实际存储字符串的缓冲区。

用法示例

Jedis jedis = new Jedis("localhost");
jedis.set("key", "value");  // 设置键值对
String value = jedis.get("key");  // 获取值
System.out.println(value);
jedis.close();

2. 哈希 (Hash)

数据结构

哈希是键值对的集合，适合表示对象的属性。最常用的是用来存储对象。内部实现主要有两种：

压缩列表 (ziplist)：当哈希数量较少且每个键值对的长度较短时会使用。
哈希表 (hashtable)：当哈希数量增多或其中某个键或值变长后，自动转为哈希表。

用法示例

Jedis jedis = new Jedis("localhost");
jedis.hset("user:1000", "name", "John");
jedis.hset("user:1000", "age", "30");
String name = jedis.hget("user:1000", "name");
System.out.println(name);
jedis.close();

3. 列表 (List)

数据结构

列表是一组有序的字符串，可以从列表的头部或尾部添加或删除元素。内部实现有以下两种：

压缩列表 (ziplist)：元素数量较少且每个元素较短时使用。
双向链表 (linkedlist)：元素数量多时，会自动转为双向链表。

用法示例

Jedis jedis = new Jedis("localhost");
jedis.lpush("tasks", "Task1");  // 从头部插入
jedis.rpush("tasks", "Task2");  // 从尾部插入
String task = jedis.lpop("tasks");  // 从头部弹出
System.out.println(task);
jedis.close();

4. 集合 (Set)

数据结构

集合是无序且唯一的字符串集合。内部采用哈希表 (hashtable) 实现，哈希表的键是集合的值，值是 null。

用法示例

Jedis jedis = new Jedis("localhost");
jedis.sadd("tags", "java");
jedis.sadd("tags", "redis");
jedis.sadd("tags", "java");  // 不会重复添加
Set<String> tags = jedis.smembers("tags");
System.out.println(tags);
jedis.close();

5. 有序集合 (Sorted Set)

数据结构

有序集合类似集合，但每个元素都会关联一个分数（score），元素按分数排序。内部使用一种结构：跳表 (skiplist) 和哈希表 (hashtable) 结合。

跳表 (skiplist)：快速实现范围查询和排序。
哈希表 (hashtable)：快速定位元素。

用法示例

Jedis jedis = new Jedis("localhost");
jedis.zadd("leaderboard", 100, "Player1");
jedis.zadd("leaderboard", 200, "Player2");
Set<String> topPlayers = jedis.zrange("leaderboard", 0, -1);  // 按分数排序获取元素
System.out.println(topPlayers);
jedis.close();

6. 位图 (Bitmap)

数据结构

位图将字符串值视为一个位数组，可以进行位操作。内部存储采用字符串，最大长度可达 512 MB。

字节数组 (byte array)：实际存储位图数据的结构，是一个连续的内存区域。

用法示例

Jedis jedis = new Jedis("localhost");
jedis.setbit("user:active", 1, true);  // 设置第2位为1
boolean isActive = jedis.getbit("user:active", 1);
System.out.println(isActive);
jedis.close();

7. HyperLogLog

数据结构

HyperLogLog 是基数估算数据结构，用于估算不重复元素的数量。利用概率算法实现，误差率约 0.81%。用于大规模数据去重计数。

稀疏矩阵 (Sparse Representation)：当元素少时，用压缩方法存储。
密集矩阵 (Dense Representation)：当元素多到一定程度时，转为密集表示。

用法示例

Jedis jedis = new Jedis("localhost");
jedis.pfadd("unique_visitors", "user1");
jedis.pfadd("unique_visitors", "user2");
jedis.pfadd("unique_visitors", "user1");
long uvCount = jedis.pfcount("unique_visitors");
System.out.println(uvCount);
jedis.close();

8. 地理空间 (Geospatial)

数据结构

Redis 的地理空间扩展允许存储地理坐标，并提供地理范围查询、距离计算等功能。内部使用有序集合 (Sorted Set) 数据类型实现，利用 GeoHash 编码。

GeoHash 编码 (geohash)：将地理坐标编码为字符串，保证地理位置靠近的两个编码也是靠近的。
跳表 (skiplist) 和哈希表 (hashtable)：与有序集合共享的实现，支持半径查询和排序。

用法示例

Jedis jedis = new Jedis("localhost");
jedis.geoadd("locations", 13.361389, 38.115556, "Palermo");
jedis.geoadd("locations", 15.087269, 37.502669, "Catania");

List<GeoCoordinate> coordinates = jedis.geopos("locations", "Palermo");
System.out.println(coordinates);

double distance = jedis.geodist("locations", "Palermo", "Catania", GeoUnit.KM);
System.out.println(distance);
jedis.close();

Redis 提供了丰富的数据结构，每种数据结构都有其特定的应用场景和优势。在实践中，可以根据具体需求选择合适的数据类型，提高系统性能与效率。了解这些数据结构的底层实现有助于更好地理解和使用 Redis，优化数据存储和操作。

这里着重说下跳表，面试可能会加分。
跳表（SkipList）是一种用于有序集合的高效数据结构，支持快速的插入、删除和查找操作。它的时间复杂度为 O(log N)，接近于平衡二叉树，但实现相对简单。跳表是 Redis 中 Sorted Set（有序集合）数据类型的主要底层实现之一。

跳表的数据结构

跳表由多层有序链表组成，下层链表包含所有元素，每一层链表是其下一层链表的抽样。跳表的最底层是一条完整的有序链表，从头到尾包含所有的元素。每一层往上减少一部分元素，通过跳过一些元素使操作更高效。

Level 0：包含所有节点，构成最底层链表。
Level 1：包含部分节点，跳过一些元素，形成较高层次的链表。
Level k：最高层链表，包含最少的元素。

跳表的节点

每个节点包含多个指针，每个指针指向该层中的下一个节点。节点结构如下：

score：用于排序的分数。
member：实际存储的值。
forward pointers：指向各层下一个节点的指针数组。

跳表的操作

跳表支持插入、删除和查找操作，具体步骤如下：

插入操作

从最高层开始，找到要插入的位置。
随机生成节点的高度（层数）。
将新节点插入到对应的每一层链表中。

删除操作

从最高层开始，找到要删除的节点。
更新指针，跳过该节点。
逐层删除该节点。

查找操作

从最高层开始，根据分数找到目标位置。
如果当前层找不到，降到下一层继续查找。
直到找到目标节点或确认节点不存在。

跳表在 Redis 中的实现

以下是 Redis 跳表的数据结构和主要操作的实现：

节点结构

typedef struct zskiplistNode {
    struct zrobj *obj; // 存储成员对象（value）
    double score;      // 分数，用于排序
    struct zskiplistNode *backward; // 后退指针
    struct zskiplistLevel {
        struct zskiplistNode *forward; // 前进指针
        unsigned int span;             // 跨度
    } level[]; // 层指针数组
} zskiplistNode;

跳表结构

typedef struct zskiplist {
    struct zskiplistNode *header, *tail; // 头尾指针
    unsigned long length;                // 节点数量
    int level;                           // 当前最大层数
} zskiplist;

插入操作

zskiplistNode *zslInsert(zskiplist *zsl, double score, robj *obj) {
    // 临时存储每一层的前一个节点
    zskiplistNode *update[ZSKIPLIST_MAXLEVEL];
    zskiplistNode *x;
    int i, level;
    
    x = zsl->header;
    for (i = zsl->level-1; i >= 0; i--) {
        while (x->level[i].forward && 
               (x->level[i].forward->score < score ||
               (x->level[i].forward->score == score &&
                compareStringObjects(x->level[i].forward->obj, obj) < 0))) {
            x = x->level[i].forward;
        }
        update[i] = x;
    }
    
    level = zslRandomLevel(); // 随机生成节点层数
    if (level > zsl->level) {
        for (i = zsl->level; i < level; i++) {
            update[i] = zsl->header;
        }
        zsl->level = level;
    }

    x = zslCreateNode(level, score, obj); // 创建新节点
    for (i = 0; i < level; i++) {
        x->level[i].forward = update[i]->level[i].forward;
        update[i]->level[i].forward = x;
    }
    x->backward = (update[0] == zsl->header ? NULL : update[0]);
    if (x->level[0].forward)
        x->level[0].forward->backward = x;
    else
        zsl->tail = x;
    zsl->length++;
    return x;
}

删除操作

int zslDelete(zskiplist *zsl, double score, robj *obj) {
    zskiplistNode *update[ZSKIPLIST_MAXLEVEL], *x;
    int i;
    
    x = zsl->header;
    for (i = zsl->level-1; i >= 0; i--) {
        while (x->level[i].forward && 
               (x->level[i].forward->score < score ||
               (x->level[i].forward->score == score &&
                compareStringObjects(x->level[i].forward->obj, obj) < 0))) {
            x = x->level[i].forward;
        }
        update[i] = x;
    }

    x = x->level[0].forward;
    if (x && score == x->score && compareStringObjects(x->obj, obj) == 0) {
        for (i = 0; i < zsl->level; i++) {
            if (update[i]->level[i].forward == x) {
                update[i]->level[i].forward = x->level[i].forward;
            }
        }
        if (x->level[0].forward) {
            x->level[0].forward->backward = x->backward;
        } else {
            zsl->tail = x->backward;
        }
        while (zsl->level > 1 && zsl->header->level[zsl->level-1].forward == NULL) {
            zsl->level--;
        }
        zsl->length--;
        zslFreeNode(x);
        return 1;
    }
    return 0;
}

查找操作

zskiplistNode *zslFind(zskiplist *zsl, double score, robj *obj) {
    zskiplistNode *x = zsl->header;
    int i;

    for (i = zsl->level-1; i >= 0; i--) {
        while (x->level[i].forward && 
               (x->level[i].forward->score < score ||
               (x->level[i].forward->score == score &&
                compareStringObjects(x->level[i].forward->obj, obj) < 0))) {
            x = x->level[i].forward;
        }
    }
    x = x->level[0].forward;
    if (x && score == x->score && compareStringObjects(x->obj, obj) == 0) {
        return x;
    }
    return NULL;
}