一、问题引入

如果服务提供者响应非常缓慢,那么消费者对提供者的请求就会被强制等待,直到提供者响应或超时。在高负载场景下,如果不作任何处理,此类问题可能会导致服务消费者的资源耗尽甚至整个系统的崩溃。

1.1、雪崩效应

微服务架构的应用系统通常包含多个服务层。微服务之间通过网络进行通信,从而支撑起整个应用系统,因此,微服务之间难免存在依赖关系。任何微服务都并非100%可用,网络往往也很脆弱,因此难免有些请求会失败。

我们通常把“基础服务故障”导致“级联故障”的现象称为雪崩效应。雪崩效应描述的是提供者不可用导致消费者不可用,并将不可用逐渐放大的过程。

1.2、如何容错

要想防止雪崩效应,必须有一个强大的容错机制。该容错机制需要实现以下两点:

a、为网络请求设置超时:为每个网络请求设置超时,让资源尽快释放。

b、使用断路器模式

我们可通过以上两点机制保护应用,从而防止雪崩效应并提升应用的可用性。

1.3、断路器模式简介

断路器可理解为对容易导致错误的操作的代理。这种代理能够统计一段时间内调用失败的次数,并决定是正常请求依赖的服务还是直接返回。

断路器可以实现快速失败,如果它在一段时间内检测到许多类似的错误(例如超时),就会在之后的一段时间内,强迫对改服务的调用快速失败,即不再请求所依赖的服务。这样应用程序就无须再浪费CPU时间去等待长时间的超时。

断路器也可自动诊断依赖的服务是否已经恢复正常,如果发现依赖的服务已经恢复正常,那么就会恢复请求该服务,使用这种方式,就可以实现微服务的“自我修复”。

当依赖的服务不正常时打开断路器时快速失败,从而防止雪崩效应;当发现依赖的服务恢复正常时,又会恢复请求。

断路器状态转换图,如下:

 wKioL1ltflPyBbzUAAHdXsFZ2q0584.png

说明:

 1、正常情况下,断路器关闭,可正常请求依赖的服务。

 2、当一段时间内,请求失败率达到一定阔值(如错误率达到50%,或100次/分钟等),断路器就会打开。此时,不会再去请求依赖的服务。

 3、断路器打开一段时间后,会自动进入“半开”状态。此时,断路器可允许一个请求访问依赖的服务。如果该请求能够成功调用,则关闭断路器;否则继续保持打开状态。

二、Hystrix简介

hystrix是一个实现了超时机制和断路器模式的工具类库。

2.1、简介

hystrix是由Netflix开源的一个延迟和容错库,用于隔离访问远程系统、服务、或者第三方库,防止级联失败,从而提升系统的可用性与容错性。

hystrix主要通过以下几点实现容错和延迟:

包裹请求

 使用hystrixCommand(或hystrixObservableCommand)包裹对依赖的调用逻辑,每个命令在独立线程中执行。这使用到了设计模式中的“命令模式”。

跳闸机制

 当某服务的错误率超过一定阔值时,hystrix可以自动或手动跳闸,停止请求该服务一段时间。

资料隔离

 hystrix为每个依赖都维护了一个小型的线程池(或信号量)。如果该线程池已满,发往该依赖的请求就会被立即拒绝,而不是排队等待,从而加速失败判定。

监控

 hystrix可以近乎实时的监控运行指标和配置的变化,例如成功、失败、超时以及被拒绝的请求等

回退机制

 当请求失败、超时、被拒绝,或当断路器打开时,执行回退逻辑。回退逻辑可由开发人员自行提供,例如返回一个缺省值。

自我修复

 断路器打开一段时间后,会自动进入“半开”状态。

三、使用hystrix实现容错

3.1、通用方式整合Hystris

复制工程spring-ribbon-eureka-client,改名为spring-hystrix-consumer

3.1.1、添加依赖

<dependency>
    <groupId>org.springframework.cloud</groupId>
    <artifactId>spring-cloud-starter-hystrix</artifactId>
</dependency>

3.1.2、在启动类上加上注解@EnableHystrix

  1. package com.example.demo;
  2. import org.springframework.boot.SpringApplication;
  3. import org.springframework.boot.autoconfigure.SpringBootApplication;
  4. import org.springframework.cloud.client.loadbalancer.LoadBalanced;
  5. import org.springframework.cloud.netflix.eureka.EnableEurekaClient;
  6. import org.springframework.cloud.netflix.hystrix.EnableHystrix;
  7. import org.springframework.context.annotation.Bean;
  8. import org.springframework.web.client.RestTemplate;
  9. @EnableHystrix
  10. @EnableEurekaClient
  11. @SpringBootApplication
  12. public class SpringHystrixConsumerApplication {
  13.     @Bean
  14.   @LoadBalanced
  15.   public RestTemplate restTemplate(){
  16.       return new RestTemplate();
  17.   }
  18.   public static void main(String[] args) {
  19.       SpringApplication.run(SpringHystrixConsumerApplication.class, args);
  20.   }
  21. }

3.1.3、修改UserController.java

  1. package com.example.demo.controller;
  2. import com.example.demo.pojo.User;
  3. import com.netflix.hystrix.contrib.javanica.annotation.HystrixCommand;
  4. import org.springframework.beans.factory.annotation.Autowired;
  5. import org.springframework.cloud.client.ServiceInstance;
  6. import org.springframework.cloud.client.loadbalancer.LoadBalancerClient;
  7. import org.springframework.web.bind.annotation.GetMapping;
  8. import org.springframework.web.bind.annotation.PathVariable;
  9. import org.springframework.web.bind.annotation.RestController;
  10. import org.springframework.web.client.RestTemplate;
  11. /**
  12.  * 用户controller
  13.  *
  14.  * @Author: 我爱大金子
  15.  * @Description: 用户controller
  16.  * @Date: Create in 11:07 2017/7/10
  17.  */
  18. @RestController
  19. public class UserController {
  20.     @Autowired
  21.     private RestTemplate restTemplate;
  22.     @Autowired
  23.     private LoadBalancerClient loadBalancerClient;
  24.     @HystrixCommand(fallbackMethod = "findByIdFallback")    // 指定回退方法findByIdFallback
  25.     @GetMapping("/user/{id}")
  26.     public User findById(@PathVariable Long id) throws Exception {
  27.         ServiceInstance serviceInstance = this.loadBalancerClient.choose("spring-ribbon-eureka-client2");
  28.         // 打印当前选择的是哪个节点
  29.         System.out.println("serviceId : " + serviceInstance.getServiceId());
  30.         System.out.println("hoost : " + serviceInstance.getHost());
  31.         System.out.println("port : " + serviceInstance.getPort());
  32.         System.out.println("============================================================");
  33.         if (null == id) {
  34.             return null;
  35.         }
  36.         return this.restTemplate.getForObject(" + id, User.class);
  37.     }
  38.     /**回退方法*/
  39.   public User findByIdFallback(Long id) {
  40.       User user = new User();
  41.     user.setId(-1L);
  42.     user.setName("默认用户");
  43.     return user;
  44.   }
  45.   @GetMapping("/log-instance")
  46.   public void serviceInstance() throws Exception {
  47.         ServiceInstance serviceInstance = this.loadBalancerClient.choose("spring-ribbon-eureka-client2");
  48.     // 打印当前选择的是哪个节点
  49.     System.out.println("serviceId : " + serviceInstance.getServiceId());
  50.     System.out.println("hoost : " + serviceInstance.getHost());
  51.     System.out.println("port : " + serviceInstance.getPort());
  52.     System.out.println("============================================================");
  53.   }
  54. }

说明:为findById方法编写了一个回退方法findByIdFallback,该方法与findById方法具有相同的参数与返回值类型。

3.1.4、效果

访问:http://localhost:8086/user/1 

 wKioL1ltsvWDjU6SAABDYPCWPy4488.jpg

关闭spring-ribbon-eureka-client2服务,再次访问

 wKioL1lts0OAMlfgAAAVLusig6s529.jpg

3.1.5、@HystrixCommand注解说明

在findById方法上,使用注解@HystrixCommand的fallbackMethod属性,指定回退方法是findByIdFallback。注解@HystrixCommand由名为javanica的Hystrix contrib库提供。javanica是一个Hystrix的子项目,用于简化Hystrix的使用。Spring cloud自动将Spring bean与该注解封装在一个连接到Hystrix断路器的代理中。


@HystrixCommand的配置非常灵活,可使用注解@HystrixCommand的commandProperties属性来配置@HystrixProperty。如:

  1. @HystrixCommand(fallbackMethod = "findByIdFallback", commandProperties = {
  2.     @HystrixProperty(name = "execution.isolation.thread.timeoutInMilliseconds", value="5000"),      // 超时时间,默认1000ms
  3.   @HystrixProperty(name = "metrics.rollingStats.timeInMilliseconds", value="10000")           // 设置关于HystrixCommand执行需要的统计信息,默认10000毫秒
  4. } )    // 指定回退方法findByIdFallback
  5. @GetMapping("/user1/{id}")
  6. public User findById1(@PathVariable Long id) throws Exception {
  7.     ServiceInstance serviceInstance = this.loadBalancerClient.choose("spring-ribbon-eureka-client2");
  8.   // 打印当前选择的是哪个节点
  9.   System.out.println("serviceId : " + serviceInstance.getServiceId());
  10.   System.out.println("hoost : " + serviceInstance.getHost());
  11.   System.out.println("port : " + serviceInstance.getPort());
  12.   System.out.println("============================================================");
  13.   if (null == id) {
  14.       return null;
  15.   }
  16.   return this.restTemplate.getForObject(" + id, User.class);
  17. }

Hystrix配置属性详情请查看Hystrix Wiki: https://github.com/Netflix/Hystrix/wiki/Configuration 

@HystrixCommand注解详情请查看:https://github.com/Netflix/Hystrix/tree/master/hystrix-contrib/hystrix-javanica 


疑问:

 我们知道,请请求失败,被拒绝、超时或者断路器打开时,都会进入回退方法。但进入回退方法并不意味着断路器已经被打开。那么,如何才能明确了解短路器当前的状态呢?

3.2、Feign使用Hystrix

前面的都是使用注解@HystrixCommand的fallbackMethod属性实现回退的。然而,Feign是以接口的形式工作的,它没有方法体,显然前面的方式并不适用于Feign。那么feign如果整合Hystrix呢?

事实上,Spring Cloud默认已为Feign整合了Hystrix,只要Hystrix在项目的classpath中,Feign默认就会用断路器包裹所有的方法。

3.2.1、为feign添加回退

1、复制项目spring-feign-consumer,改名为spring-hystrix-feign。

2、修改Feign接口

  1. package com.example.demo.feign;
  2. import com.example.demo.pojo.User;
  3. import org.springframework.cloud.netflix.feign.FeignClient;
  4. import org.springframework.stereotype.Component;
  5. import org.springframework.web.bind.annotation.PathVariable;
  6. import org.springframework.web.bind.annotation.RequestMapping;
  7. import org.springframework.web.bind.annotation.RequestMethod;
  8. /**
  9.  * Feign接口
  10.  *
  11.  * @Author: 我爱大金子
  12.  * @Description: Feign接口
  13.  * @Date: Create in 10:14 2017/7/17
  14.  */
  15. @FeignClient(name = "spring-ribbon-eureka-client2", fallback = FeignClientFallback.class)
  16. public interface UserFeignClient {
  17.     @RequestMapping(value = "/{id}", method = RequestMethod.GET)
  18.   public User findById(@PathVariable("id") Long id) throws Exception;
  19. }
  20. /**
  21.  * 回退类FeignClientFallback需要实现Feign接口
  22.  * @Author: 我爱大金子
  23.  * @Description: 描述
  24.  * @Date: 17:40 2017/7/18
  25.  */
  26. @Component
  27. class FeignClientFallback implements UserFeignClient {
  28.     @Override
  29.   public User findById(Long id) throws Exception {
  30.       User user = new User();
  31.     user.setId(-1L);
  32.     user.setName("默认用户");
  33.     return user;
  34.   }
  35. }

注意:在新版中feign默认没有开启Hystrix的功能,开启配置如下:

feign:
    hystrix:
        enabled: true     # 开启Feign的Hystrix的功能


测试:

 1、启动spring-ribbon-eureka-client2服务,访问http://localhost:8086/user/1,结果正常,如下:

  wKioL1luyuCy1_tGAAAVvCbAZ_8746.png 

 2、关闭spring-ribbon-eureka-client2服务,访问http://localhost:8086/user/1,结果如下:

  wKioL1luzcuzt7sIAAAUwUZIrWE706.png

3.2.2、通过FallbackFactory检查回退原因

很多场景下,需要了解回退的原因,此时可使用注解@FeignClient的fallbackFactory属性。

1、复制上面工程,改名为spring-hystrix-feign-fallback-factory

2、修改feign接口

  1. package com.example.demo.feign;
  2. import com.example.demo.pojo.User;
  3. import feign.hystrix.FallbackFactory;
  4. import org.slf4j.Logger;
  5. import org.slf4j.LoggerFactory;
  6. import org.springframework.cloud.netflix.feign.FeignClient;
  7. import org.springframework.stereotype.Component;
  8. import org.springframework.web.bind.annotation.PathVariable;
  9. import org.springframework.web.bind.annotation.RequestMapping;
  10. import org.springframework.web.bind.annotation.RequestMethod;
  11. /**
  12.  * Feign接口
  13.  *
  14.  * @Author: 我爱大金子
  15.  * @Description: Feign接口
  16.  * @Date: Create in 10:14 2017/7/17
  17.  */
  18. @FeignClient(name = "spring-ribbon-eureka-client2", fallbackFactory = FeignClientFallbackFactory.class)
  19. public interface UserFeignClient {
  20.     @RequestMapping(value = "/{id}", method = RequestMethod.GET)
  21.   public User findById(@PathVariable("id") Long id) throws Exception;
  22. }
  23. /**
  24.  * 回退类FeignClientFallback需要实现Feign接口
  25.  * @Author: 我爱大金子
  26.  * @Description: 描述
  27.  * @Date: 17:40 2017/7/18
  28.  */
  29. @Component
  30. class FeignClientFallbackFactory implements FallbackFactory<UserFeignClient> {
  31.     private static final Logger log = LoggerFactory.getLogger(FeignClientFallbackFactory.class);
  32.   @Override
  33.   public UserFeignClient create(Throwable throwable) {
  34.       return new UserFeignClient(){
  35.             @Override
  36.       public User findById(Long id) throws Exception {
  37.           FeignClientFallbackFactory.log.info("fallback : ", throwable);
  38.         User user = new User();
  39.         user.setId(-1L);
  40.         user.setName("默认用户");
  41.         return user;
  42.       }
  43.     };
  44.   }
  45. }

3、测试

wKiom1lu2K_jxG_FAACO_ZdWZIo780.png

3.2.3、为Feign禁用Hystrix

在Spring cloud中,只要Hystrix在项目中的classpath中,Feign就会使用断路器包裹Feign客户端的所有方法。这样虽然方便,但有些场景下并不需要该功能。

为指定的Feign客户端禁用Hystrix

借助Feign的自定义配置,可轻松为指定名称的Feign客户端禁用Hystrix。如:

  1. @Configuration
  2. @ExcludeFromComponentScan
  3. public class FeignConfiguration {
  4.     @Bean
  5.   @Scope("prototype")
  6.   public Feign.Builder feignBuilder() {
  7.       return Feign.builder();
  8.   }
  9. }

想要禁用Hystrix的@FeignClient引用改配置即可,如:

  1. @FeignClient(name = "spring-ribbon-eureka-client2", configuration = FeignConfiguration.class)
  2. public interface UserFeignClient {
  3.     // ...
  4. }


全局禁用Hystrix

只须在application.yml中配置feign.hystrix.enabled=false即可。


四、深入理解Hystrix

4.1、Hystrix断路器的状态监控

记得我们以前为项目引入过Actuator:

<dependency>
    <groupId>org.springframework.boot</groupId>
  <artifactId>spring-boot-starter-actuator</artifactId>
</dependency>

断路器的状态也暴露在Actuator提供的/health端点中,这样就可以直观的了解断路器的状态

实验:

 1、启动spring-ribbon-eureka-client2服务,访问http://localhost:8086/user/1,可以正常获取结果 

 2、访问http://localhost:8086/manage/health,结果如下:

   wKiom1ltwT3QwMMAAAAViIZ95yo551.png

   可以看到此时,Hystrix的状态是UP,也就是一切正常,此时断路器时关闭的。

 3、关闭spring-ribbon-eureka-client2服务,访问http://localhost:8086/user/1,可以获取如下结果:

   wKiom1ltwjzTZYt4AAAUlKHrFqA824.png 

 4、访问http://localhost:8086/manage/health,结果如下:

   wKiom1ltwT3QwMMAAAAViIZ95yo551.png

  我们发现,尽管执行了回退逻辑,返回了默认用户,但此时Hystrix的状态依然是UP,这是因为我们的失败率还没有达到阔值(默认是5秒20次失败)。再次强调----执行回退逻辑并不代表断路器已经打开。请求失败、超时、被拒绝以及断路器打开时都会执行回退逻辑。

 5、持续快速的访问http://localhost:8086/user/1,知道http://localhost:8086/manage/health的结果如下:

  wKioL1ltw-qDs6V5AAAb5OD9I54234.png

  可以看到hystrix的状态是CIRCUIT_OPEN,说明短路器已经打开

4.2、Hystrix线程隔离策略与传播上下文

hystrix的隔离策略有两种:线程隔离和信号量隔离

线程隔离(THREAD):使用该方式,HystrixCommand将会在单独的线程上执行,并发请求受线程池中的线程数量的限制。

信号量隔离(SEMAPHORE):使用该方式,HystrixCommand将会在调用线程上执行,开销相对较小,并发请求受信号量个数的限制。


hystrix中默认并且推荐使用线程隔离,因为这种方式有一个除网络超时以外的额外保护层。


一般来说,只有当调用负载非常高时(如:每个实例每秒调用数百次)才需要使用信号量隔离,因为这种场景下使用线程隔离开销会比较大。信号量隔离一般仅适用于非网络调用的隔离。

可使用execution.isolation.strategy属性指定隔离策略。


设置信号量隔离策略:

  1. @HystrixCommand(fallbackMethod = "findByIdFallback", commandProperties = {
  2.     @HystrixProperty(name = "execution.isolation.strategy", value="SEMAPHORE"),      // 设置信号量隔离
  3. })
  4. @GetMapping("/user2/{id}")
  5. public User findById2(@PathVariable Long id) throws Exception {
  6.     // ...
  7. }


总结:

 1、hystrix的隔离策略有THREAD、SEMAPHORE两种,默认使用THREAD。

 2、正常情况下,保持默认即可。

 3、如果发生找不到上下文的运行时异常,可考虑将隔离级别设置为SEMAPHORE