赞
踩
Jedis虽然使用起来比较简单,但是如果不能根据使用场景设置合理的参数(例如连接池参数),不合理的使用一些功能(例如Lua和事务)也会产生很多问题,本文对这些问题逐个说明:
(1) 连接池参数blockWhenExhausted = true(默认)
如果连接池没有可用Jedis连接,会等待maxWaitMillis(毫秒),依然没有获取到可用Jedis连接,会抛出如下异常:
- redis.clients.jedis.exceptions.JedisConnectionException: Could not get a resource from the pool
- …
- Caused by: java.util.NoSuchElementException: Timeout waiting for idle object
- at org.apache.commons.pool2.impl.GenericObjectPool.borrowObject(GenericObjectPool.java:449)
(2) 连接池参数blockWhenExhausted = false
设置如果连接池没有可用Jedis连接,立即抛出异常:
- redis.clients.jedis.exceptions.JedisConnectionException: Could not get a resource from the pool
- …
- Caused by: java.util.NoSuchElementException: Pool exhausted
- at org.apache.commons.pool2.impl.GenericObjectPool.borrowObject(GenericObjectPool.java:464)
上述异常是客户端没有从连接池(最大maxTotal个)拿到可用Jedis连接造成的,具体可能有如下原因:
(1) 连接泄露 (较为常见)
JedisPool默认的maxTotal=8,下面的代码从JedisPool中借了8次Jedis,但是没有归还,当第9次(jedisPool.getResource().ping())
- GenericObjectPoolConfig poolConfig = new GenericObjectPoolConfig();
- JedisPool jedisPool = new JedisPool(poolConfig, "127.0.0.1", 6379);
- //向JedisPool借用8次连接,但是没有执行归还操作。
- for (int i = 0; i < 8; i++) {
- Jedis jedis = null;
- try {
- jedis = jedisPool.getResource();
- jedis.ping();
- } catch (Exception e) {
- logger.error(e.getMessage(), e);
- }
- }
- jedisPool.getResource().ping();
所以推荐使用的代码规范是:
- 执行命令如下:
- Jedis jedis = null;
- try {
- jedis = jedisPool.getResource();
- //具体的命令
- jedis.executeCommand()
- } catch (Exception e) {
- //如果命令有key最好把key也在错误日志打印出来,对于集群版来说通过key可以帮助定位到具体节点。
- logger.error(e.getMessage(), e);
- } finally {
- //注意这里不是关闭连接,在JedisPool模式下,Jedis会被归还给资源池。
- if (jedis != null)
- jedis.close();
- }
(2) 业务并发量大,maxTotal确实设置小了。
举个例子:
那么理论上需要的资源池大小是50000 / 1000 = 50个,实际maxTotal可以根据理论值进行微调。
(3) Jedis连接还的太慢
例如Redis发生了阻塞(例如慢查询等原因),所有连接在超时时间范围内等待,并发量较大时,会造成连接池资源不足。
(4) 其他问题
例如丢包、DNS、客户端TCP参数配置,具体可以参考:Jedis介绍及常见问题分析
可以看到这个问题稍微复杂一些,不要被异常的表象所迷惑,简单地认为连接池不够就盲目加大maxTotal,要具体问题具体分析。
连接池参数优化可以参考:JedisPool资源池优化
客户先确认,如解决不了,需要借助工单解决
还有一种情况是:从池子里拿连接,由于没有空闲连接,需要重新生成一个Jedis连接,但是连接被拒绝:
- redis.clients.jedis.exceptions.JedisConnectionException: Could not get a resource from the pool
- at redis.clients.util.Pool.getResource(Pool.java:50)
- at redis.clients.jedis.JedisPool.getResource(JedisPool.java:99)
- at TestAdmin.main(TestAdmin.java:14)
- Caused by: redis.clients.jedis.exceptions.JedisConnectionException: java.net.ConnectException: Connection refused
- at redis.clients.jedis.Connection.connect(Connection.java:164)
- at redis.clients.jedis.BinaryClient.connect(BinaryClient.java:80)
- at redis.clients.jedis.BinaryJedis.connect(BinaryJedis.java:1676)
- at redis.clients.jedis.JedisFactory.makeObject(JedisFactory.java:87)
- at org.apache.commons.pool2.impl.GenericObjectPool.create(GenericObjectPool.java:861)
- at org.apache.commons.pool2.impl.GenericObjectPool.borrowObject(GenericObjectPool.java:435)
- at org.apache.commons.pool2.impl.GenericObjectPool.borrowObject(GenericObjectPool.java:363)
- at redis.clients.util.Pool.getResource(Pool.java:48)
- ... 2 more
- Caused by: java.net.ConnectException: Connection refused
- at java.net.PlainSocketImpl.socketConnect(Native Method)
- at java.net.AbstractPlainSocketImpl.doConnect(AbstractPlainSocketImpl.java:339)
- at java.net.AbstractPlainSocketImpl.connectToAddress(AbstractPlainSocketImpl.java:200)
- at java.net.AbstractPlainSocketImpl.connect(AbstractPlainSocketImpl.java:182)
- at java.net.SocksSocketImpl.connect(SocksSocketImpl.java:392)
- at java.net.Socket.connect(Socket.java:579)
- at redis.clients.jedis.Connection.connect(Connection.java:158)
- ... 9 more
可以从at redis.clients.jedis.Connection.connect(Connection.java:158)看到实际是一个Socket连接:
- socket.setSoLinger(true, 0); // Control calls close () method,
- // the underlying socket is closed
- // immediately
- // <-@wjw_add
-
- 158: socket.connect(new InetSocketAddress(host, port), connectionTimeout);
一般这种需要检查Redis的域名配置是否正确,排查该段时间网络是否正常
- redis.clients.jedis.exceptions.JedisConnectionException: Unexpected end of stream.
- at redis.clients.util.RedisInputStream.ensureFill(RedisInputStream.java:199)
- at redis.clients.util.RedisInputStream.readByte(RedisInputStream.java:40)
- at redis.clients.jedis.Protocol.process(Protocol.java:151)
- ......
这个异常是客户端缓冲区异常,产生这个问题可能有三个原因:
(1) 常见原因:多个线程使用一个Jedis连接,正常的情况是一个线程使用一个Jedis连接,可以使用JedisPool管理Jedis连接,实现线程安全,防止出现这种情况,例如下面代码中两个线程用了一个Jedis连接:
- new Thread(new Runnable() {
-
- public void run() {
- for (int i = 0; i < 100; i++) {
- jedis.get("hello");
- }
- }
- }).start();
-
- new Thread(new Runnable() {
-
- public void run() {
- for (int i = 0; i < 100; i++) {
- jedis.hget("haskey", "f");
- }
- }
- }).start();
(2) 客户端缓冲区满了
Redis有三种客户端缓冲区:
Redis的客户端缓冲区配置具体格式是:
client-output-buffer-limit <class> <hard limit> <soft limit> <soft seconds>
(a) class: 客户端类型:(a) normal、(b) slave、(c) pubsub
(b) hard limit: 如果客户端使用的输出缓冲区大于hard limit,客户端会被立即关闭。
(c) soft limit和soft seconds: 如果客户端使用的输出缓冲区超过了soft limit并且持续了soft limit秒,客户端会被立即关闭
例如下面是一份Redis缓冲区的配置,所以当条件满足时,客户端连接会被关闭,就会出现Unexpected end of stream。
- redis> config get client-output-buffer-limit
- 1) "client-output-buffer-limit"
- 2) "normal 524288000 0 0 slave 2147483648 536870912 480 pubsub 33554432 8388608 60"
(3) 长时间闲置连接被服务端主动断开,可以查询timeout配置的设置以及自身连接池配置是否需要做空闲检测。
客户:排查自身代码是否使用JedisPool管理Jedis连接,是否存在并发操作Jedis的情况。
工单: 排查(2)(3),阿里云Redis中timeout=0,也就是不会主动关闭空闲连接,缓冲区设置为0 0 0 也就是不会对客户端缓冲区进行限制,一般不会有问题
- Caused by: redis.clients.jedis.exceptions.JedisDataException: ERR illegal address
- at redis.clients.jedis.Protocol.processError(Protocol.java:117)
- at redis.clients.jedis.Protocol.process(Protocol.java:151)
- at redis.clients.jedis.Protocol.read(Protocol.java:205)
- ......
Redis实例配置了白名单,但当前访问Redis的客户端(IP)不在白名单中。
添加该客户端(IP)的白名单
客户或者工单都可以
redis.clients.jedis.exceptions.JedisDataException: ERR max number of clients reached
如果客户端连接数超过了Redis实例配置的最大maxclients
提工单帮助临时调大最大连接数,并让客户找到连接数暴涨的原因(因为上述调整只是临时调整),
redis.clients.jedis.exceptions.JedisConnectionException: java.net.SocketTimeoutException: Read timed out
该问题原因可能有如下几种:
(1) 读写超时设置的过短。
(2) 有慢查询或者Redis发生阻塞。
(3) 网络不稳定。
客户提供读写超时时间,提交工单定位相关原因
工单。
Redis设置了密码,客户端请求没传密码:
- Exception in thread "main" redis.clients.jedis.exceptions.JedisDataException: NOAUTH Authentication required.
- at redis.clients.jedis.Protocol.processError(Protocol.java:127)
- at redis.clients.jedis.Protocol.process(Protocol.java:161)
- at redis.clients.jedis.Protocol.read(Protocol.java:215)
Redis没有设置密码,客户端传了密码:
- Exception in thread "main" redis.clients.jedis.exceptions.JedisDataException: ERR Client sent AUTH, but no password is set
- at redis.clients.jedis.Protocol.processError(Protocol.java:127)
- at redis.clients.jedis.Protocol.process(Protocol.java:161)
- at redis.clients.jedis.Protocol.read(Protocol.java:215)
客户端传了错误的密码:
- redis.clients.jedis.exceptions.JedisDataException: ERR invalid password
- at redis.clients.jedis.Protocol.processError(Protocol.java:117)
- at redis.clients.jedis.Protocol.process(Protocol.java:151)
- at redis.clients.jedis.Protocol.read(Protocol.java:205)
redis.clients.jedis.exceptions.JedisDataException: EXECABORT Transaction discarded because of previous errors
这个是Redis的事务异常:事务中包含了错误的命令,例如如下sett是个不存在的命令。
- 127.0.0.1:6379> multi
- OK
- 127.0.0.1:6379> sett key world
- (error) ERR unknown command 'sett'
- 127.0.0.1:6379> incr counter
- QUEUED
- 127.0.0.1:6379> exec
- (error) EXECABORT Transaction discarded because of previous errors.
客户修复自身代码错误。
- java.lang.ClassCastException: java.lang.Long cannot be cast to java.util.List
- at redis.clients.jedis.Connection.getBinaryMultiBulkReply(Connection.java:199)
- at redis.clients.jedis.Jedis.hgetAll(Jedis.java:851)
- at redis.clients.jedis.ShardedJedis.hgetAll(ShardedJedis.java:198)
- java.lang.ClassCastException: java.util.ArrayList cannot be cast to [B
- at redis.clients.jedis.Connection.getBinaryBulkReply(Connection.java:182)
- at redis.clients.jedis.Connection.getBulkReply(Connection.java:171)
- at redis.clients.jedis.Jedis.rpop(Jedis.java:1109)
- at redis.clients.jedis.ShardedJedis.rpop(ShardedJedis.java:258)
- .......
Jedis正确的使用方法是:一个线程操作一个Jedis,通常来讲产生该错误是由于没有使用JedisPool造成的,例如如下代码在两个线程并发使用了一个Jedis。(get、hgetAll返回类型也是不一样的)
-
- new Thread(new Runnable() {
-
- public void run() {
- for (int i = 0; i < 100; i++) {
- jedis.set("hello", "world");
- jedis.get("hello");
- }
- }
- }).start();
-
- new Thread(new Runnable() {
-
- public void run() {
- for (int i = 0; i < 100; i++) {
- jedis.hset("hashkey", "f", "v");
- jedis.hgetAll("hashkey");
- }
- }
- }).start();
客户排查自身代码是否存在上述问题
- Exception in thread "main" redis.clients.jedis.exceptions.JedisDataException: WRONGTYPE Operation against a key holding the wrong kind of value
- at redis.clients.jedis.Protocol.processError(Protocol.java:127)
- at redis.clients.jedis.Protocol.process(Protocol.java:161)
- at redis.clients.jedis.Protocol.read(Protocol.java:215)
- .....
例如key="hello"是字符串类型的键,而hgetAll是哈希类型的键,所以出现了错误。
- jedis.set("hello","world");
- jedis.hgetAll("hello");
请客户修改自身代码错误。
redis.clients.jedis.exceptions.JedisDataException: OOM command not allowed when used memory > 'maxmemory'.
Redis节点(如果是集群,则是其中一个节点)使用大于该实例的内存规格(maxmemory配置)。
原因可能有以下几个:
紧急处理,可以临时提工单帮助临时调整maxmeory,后续咨询用户是否升配或者调整配置。
redis.clients.jedis.exceptions.JedisDataException: LOADING Redis is loading the dataset in memory
Jedis调用Redis时,如果Redis正在加载持久化文件,无法进行正常的读写。
正常情况下,阿里云Redis不会出现这种情况,如果出现,则提交工单处理。
工单。
redis.clients.jedis.exceptions.JedisDataException: BUSY Redis is busy running a script. You can only call SCRIPT KILL or SHUTDOWN NOSAVE.
如果Redis当前正在执行Lua脚本,并且超过了lua-time-limit,此时Jedis调用Redis时,会收到下面的异常
按照异常提示:You can only call SCRIPT KILL or SHUTDOWN NOSAVE. (使用script kill:kill掉Lua脚本)
最好客户自己处理,如果解决不了,值班人员可以协助操作。
redis.clients.jedis.exceptions.JedisConnectionException: java.net.SocketTimeoutException: connect timed out
可能产生的原因:
客户提供连接超时时间,提交工单定位相关原因。
工单。
(error) UNKILLABLE Sorry the script already executed write commands against the dataset. You can either wait the script termination or kill the server in a hard way using the SHUTDOWN NOSAVE command.
如果Redis当前正在执行Lua脚本,并且超过了lua-time-limit,并且已经执行过写命令,此时Jedis调用Redis时,会收到上面的异常
提交工单做紧急处理,管理员要做重启或者切换Redis节点。
工单。
例如找不到类和方法:
- Exception in thread "commons-pool-EvictionTimer" java.lang.NoClassDefFoundError: redis/clients/util/IOUtils
- at redis.clients.jedis.Connection.disconnect(Connection.java:226)
- at redis.clients.jedis.BinaryClient.disconnect(BinaryClient.java:941)
- at redis.clients.jedis.BinaryJedis.disconnect(BinaryJedis.java:1771)
- at redis.clients.jedis.JedisFactory.destroyObject(JedisFactory.java:91)
- at org.apache.commons.pool2.impl.GenericObjectPool.destroy(GenericObjectPool.java:897)
- at org.apache.commons.pool2.impl.GenericObjectPool.evict(GenericObjectPool.java:793)
- at org.apache.commons.pool2.impl.BaseGenericObjectPool$Evictor.run(BaseGenericObjectPool.java:1036)
- at java.util.TimerThread.mainLoop(Timer.java:555)
- at java.util.TimerThread.run(Timer.java:505)
- Caused by: java.lang.ClassNotFoundException: redis.clients.util.IOUtils
- ......
运行时,Jedis执行命令,抛出异常:某个类找不到。一般此类问题都是由于加载多个jedis版本(例如jedis 2.9.0和jedis 2.6),在编译期代码未出现问题,但类加载器在运行时加载了低版本的Jedis,造成运行时找不到类。
通常此类问题,可以将重复的jedis排除掉,例如利用maven的依赖树,把无用的依赖去掉或者exclusion掉。
客户排查自身代码
例如客户端执行了geoadd命令,但是服务端返回不支持此命令
redis.clients.jedis.exceptions.JedisDataException: ERR unknown command 'GEOADD'
该命令不能被Redis端识别,有可能有两个原因:
咨询是否有Redis版本支持该命令,如支持可以让客户做小版本升级。
redis.clients.jedis.exceptions.JedisDataException: Please close pipeline or multi block before calling this method.
在pipeline.sync()执行之前,通过response.get()获取值,在pipeline.sync()执行前,命令没有执行(可以通过monitor做验证),下面代码就会引起上述异常
- Jedis jedis = new Jedis("127.0.0.1", 6379);
- Pipeline pipeline = jedis.pipelined();
- pipeline.set("hello", "world");
- pipeline.set("java", "jedis");
-
- Response<String> pipeString = pipeline.get("java");
- //这个get必须在sync之后,如果是批量获取值建议直接用List<Object> objectList = pipeline.syncAndReturnAll();
- System.out.println(pipeString.get());
- //命令此时真正执行
- pipeline.sync();
Jedis中Reponse中get()方法,有个判断:如果set=false就会报错,而response中的set初始化为false.
- public T get() {
- // if response has dependency response and dependency is not built,
- // build it first and no more!!
- if (dependency != null && dependency.set && !dependency.built) {
- dependency.build();
- }
- if (!set) {
- throw new JedisDataException(
- "Please close pipeline or multi block before calling this method.");
- }
- if (!built) {
- build();
- }
- if (exception != null) {
- throw exception;
- }
- return response;
- }
pipeline.sync()会每个结果设置set=true。
- public void sync() {
- if (getPipelinedResponseLength() > 0) {
- List<Object> unformatted = client.getAll();
- for (Object o : unformatted) {
- generateResponse(o);
- }
- }
- }
其中generateResponse(o):
- protected Response<?> generateResponse(Object data) {
- Response<?> response = pipelinedResponses.poll();
- if (response != null) {
- response.set(data);
- }
- return response;
- }
其中response.set(data);
- public void set(Object data) {
- this.data = data;
- set = true;
- }
实际上对于批量结果的解析,建议使用pipeline.syncAndReturnAll()来实现,下面操作模拟了批量hgetAll
-
- /**
- * pipeline模拟批量hgetAll
- * @param keyList
- * @return
- */
- public Map<String, Map<String, String>> mHgetAll(List<String> keyList) {
- // 1.生成pipeline对象
- Pipeline pipeline = jedis.pipelined();
- // 2.pipeline执行命令,注意此时命令并未真正执行
- for (String key : keyList) {
- pipeline.hgetAll(key);
- }
- // 3.执行命令 syncAndReturnAll()返回结果
- List<Object> objectList = pipeline.syncAndReturnAll();
- if (objectList == null || objectList.isEmpty()) {
- return Collections.emptyMap();
- }
-
- // 4.解析结果
- Map<String,Map<String, String>> resultMap = new HashMap<String, Map<String,String>>();
- for (int i = 0; i < objectList.size(); i++) {
- Object object = objectList.get(i);
- Map<String, String> map = (Map<String, String>) object;
- String key = keyList.get(i);
- resultMap.put(key, map);
- }
- return resultMap;
- }
修改业务代码。
命令role不能被普通用户执行,可以参考暂未开放的Redis命令
redis.clients.jedis.exceptions.JedisDataException: ERR command role not support for normal user
改命令尚未开放
不能使用该命令,如果有需求或者疑问可以联系值班人员。
从文档中确认该命令是否开放
原则上选择最新的release版本,但最好选择release一段时间后的版本,因为jedis历史上出现过一次问题较大的release版本,目前来说2.9.0比较稳定。
- <dependency>
- <groupId>redis.clients</groupId>
- <artifactId>jedis</artifactId>
- <version>2.9.0</version>
- <type>jar</type>
- <scope>compile</scope>
- </dependency>
答:不是,使用阿里云集群版的客户端,直接使用Jedis和JedisPool即可。因为官方集群和阿里云Redis集群是不同的架构,具体参考:redis4.0、codis、阿里云redis 3种redis集群对比分析
附赠连接池参数
序号 | 参数名 | 含义 | 默认值 | 使用建议 |
---|---|---|---|---|
1 | maxTotal | 资源池中最大连接数 | 8 | 设置建议见下节 |
2 | maxIdle | 资源池允许最大空闲的连接数 | 8 | 设置建议见下节 |
3 | minIdle | 资源池确保最少空闲的连接数 | 0 | 设置建议见下节 |
4 | blockWhenExhausted | 当资源池用尽后,调用者是否要等待。只有当为true时,下面的maxWaitMillis才会生效 | true | 建议使用默认值 |
5 | maxWaitMillis | 当资源池连接用尽后,调用者的最大等待时间(单位为毫秒) | -1:表示永不超时 | 不建议使用默认值 |
6 | testOnBorrow | 向资源池借用连接时是否做连接有效性检测(ping),无效连接会被移除 | false | 业务量很大时候建议设置为false(多一次ping的开销)。 |
7 | testOnReturn | 向资源池归还连接时是否做连接有效性检测(ping),无效连接会被移除 | false | 业务量很大时候建议设置为false(多一次ping的开销)。 |
8 | jmxEnabled | 是否开启jmx监控,可用于监控 | true | 建议开启,但应用本身也要开启 |
空闲Jedis对象检测,下面四个参数组合来完成,testWhileIdle是该功能的开关。
序号 | 参数名 | 含义 | 默认值 | 使用建议 |
---|---|---|---|---|
1 | testWhileIdle | 是否开启空闲资源监测 | false | true |
2 | timeBetweenEvictionRunsMillis | 空闲资源的检测周期(单位为毫秒) | -1:不检测 | 建议设置,周期自行选择,也可以默认也可以使用下面JedisPoolConfig中的配置 |
3 | minEvictableIdleTimeMillis | 资源池中资源最小空闲时间(单位为毫秒),达到此值后空闲资源将被移除 | 1000 60 30 = 30分钟 | 可根据自身业务决定,大部分默认值即可,也可以考虑使用下面JeidsPoolConfig中的配置 |
4 | numTestsPerEvictionRun | 做空闲资源检测时,每次的采样数 | 3 | 可根据自身应用连接数进行微调,如果设置为-1,就是对所有连接做空闲监测 |
Copyright © 2003-2013 www.wpsshop.cn 版权所有,并保留所有权利。