关于 redis 的储存问题。

› Redis

This topic created in 3012 days ago, the information mentioned may be changed or developed.

有很大量用户信息，需要放进缓存中。

	方法 1：每个用户一个 key，单独存放。
	
	方法 2：所有用户存入一个 key，类型为 hash。使用时取出此 hash，再操作。

目前有点拿不准该用哪一种效率高一些，资源利用率高一些。

	讨论：数据量 N 大于何值时，方法效率最高。

	讨论：何种场景，使用方法 1/2 比较合适。

对 redis 理解不深，求大佬们解疑。

Supplement 1 · Apr 8, 2018

感谢各位的解惑。我在这总结一下：
总体来说，方法 1 更优。
方法 1：
优点：1. 粒度更细；
2. 避免很多后期优化问题，一步到位；
3. 避免很多方法 2 存在的问题（不重复罗列）。
缺点：1. 做好 key 的回收机制；
2. 内存使用率略低于方法 2 ；
3. 同类型数据的 key 在 redis 中非常分散

方法 2：
优点：1. 内存使用率高（当 value 为 int 会被压缩，甚至可以压缩到 1/10 ） from #21
2. 相对而言较适合长期储存用户
3. 千级数据以下优势较明显
缺点：1. 所有数据保存在一个 key 中，单 key 长度不可控，在集群中优化困难；
2. 方法 1 中不同用户可以被存在集群不同机器内；
3. 单个 key 安全性差，崩了就全完了；
4. 单 key 数据过大，传输耗时也存在问题；

从时间性能以及安全性来看，都是方法 1 比较好。
另感谢#5 给出的链接 http://carlosfu.iteye.com/blog/2254572
里面是美团的解决方案

方法 3：
将所有用户进行分段（ all/100 ），然后利用方法 2 储存。
分段方法就不赘述了，可以通过 userid 等。内存利用率非常可观。

26 replies • 2018-04-09 01:40:51 +08:00

Immortal

Apr 8, 2018

具体没测试过，单纯从以前看过的 redis 的优化文章来看
方法 2 资源（内存）利用率高很多，方法 1 中虽然是 kv 结构，但是就算是最简单的 kv，对于 redis 的数据结构也有很多额外数据

undefinedMe

Apr 8, 2018

方法一

defunct9

Apr 8, 2018

方法二

rrfeng

Apr 8, 2018 via Android

任何情况下都应该用 1
单 key 太大是一个非常大的隐患

micean

Apr 8, 2018

http://carlosfu.iteye.com/blog/2254572

lastpass

Apr 8, 2018 via Android

方法一吧。毕竟你这是不是大量用户，而是很大量用户。
用方法二，取所有用户这个数据，仅仅是数据传输都要一定的时间。

jelinet

Apr 8, 2018

方法 1 吧。

lastpass

Apr 8, 2018 via Android

而且，用方法二，你对用户信息的增删改等操作也很麻烦。容易出错。而且方法二将所有鸡蛋放在同一个篮子里。一旦这个数据发生点意外情况。你所有用户数据全部 gg。

xomix

Apr 8, 2018

数据量在千级以下的时候方法 2 都是比较优秀的，当数据量超过千的级别，你获取全部用户信息的 value 传输都是个大问题。

千级别以下我觉得基本上也用不上这些缓存了，你随便写个文本库都可以对应，所以你就不要想方法 2 了。

nowgoo

Apr 8, 2018

方案一。
1. 可制定细粒度的缓存过期策略，更灵活。
2. 用 mget/mset 读写。
3. 如果每个 value 的长度都差不多，内存利用率应该还可以的。实在不行启用压缩嘛。

myyou

Apr 8, 2018

方法二效率最高，可用在长期缓存用户信息（只在用户更新用户信息时更新 hash field 的 value ）
方法一虽然内存使用率低，但是可以设置过期时间，对比不常登录用户可以避免占用内存

方法一和二除了能对每个用户设置过期时间，其实没什么区别

myyou

Apr 8, 2018

@myyou 说错了，方法一内存占用更高

Immortal

Apr 8, 2018

再多说一句具体还得看你的 value 大小这个也比较关键

yang2yang

Apr 8, 2018

用方法一吧，方法二导致 value 变大，会导致速度变慢的，内存利用率不是关键吧，一般都考虑时间吧？

tusj

Apr 8, 2018

方法 1 吧。

R18

Apr 8, 2018 via Android

自己做下测试？

tusj

Apr 8, 2018

方法一好。
因为如果以后要上 redis 集群的话，这些 key 可以分散到不同的主机以分摊压力。
如果用方法二，所有数据都在一个 key 下，出现单点性能问题的话，就算上 redis 集群也没用。

R18

Apr 8, 2018 via Android

如果使用方案一，如果用户真的很大，请设置 key 的自动过期或者回收机制

hustlibraco

Apr 8, 2018

方法 1 可用，方法 2 数据量上来了不可控。
在少量数据规模的时候方法二确实利用更高效，但是一般情况下不需要这么节省 redis 资源，方法一的扩展性更好，控制粒度也更细，一开始就用方法一没有后顾之忧

catinred

Apr 8, 2018

要单独对部分用户设置过期时间那就方法 1
要是单个用户的数据量比较小例如几 K，那就方法 2
主要还是看业务场景
无论哪种方法，都尽量避免取所有用户数据。

monsterxx03

Apr 8, 2018

从业务上看，用方法一.

hash 的确能减少内存使用, 但有些前提. 因为 size 小于阈值的 hash 内部会用 ziplist 实现，如果 value 是 int，还会用特殊算法进行压缩,极端情况下内存占用可以减少到 1/10, 相关配置: hash-max-ziplist-entries, hash-max-ziplist-value

https://redis.io/topics/memory-optimization

banksiae

Apr 8, 2018

方法 1, 但是 key 的规则要定义清除，以免滥用
单 key 值过大的话，如果要导入到 codis 集群，会遇到大小限制问题

WinMain

Apr 8, 2018

还有折中的方法，对用户 id 取模后作为 key 来分桶，哈哈，个人之见，没试过。
生产线上用的还是一个用户 id 一个 key，因为即使是有几十个亿的用户量，也不是把所有 id 的相关信息放入 redis，要不然就失去了作为缓存这个出发点了，每天最多也就是亿级的活跃用户，这个对于 redis 集群来说，都是小 ks。

MeteorCat

Apr 8, 2018 via Android

看存储之后是否要频繁更新，我们游戏架构是 MYSQL 存储基本充值数额等外部信息，NoSQL 做游戏库，人物角色信息用 Hash 表保存便于读写和单独取出；但是如果仅仅做缓存，根据 key 找到用户信息不做大修改，我感觉直接 key-value 就行了

wplct

Apr 8, 2018

方法 1.未来可以直接上集群。

qi1070445109

Apr 9, 2018 via Android

请教一下，如果用来做布隆过滤器呢？大家怎么选择？目前是方法二。