就是现在,一般来说,互联网的面试,一般都会考察你,什么是分布式系统,高并发,简单的高可用问题。限流、熔断、降级,在分布式的系统架构中,微服务架构中,其实都是最常见、基础和简单的保障系统高可用的手法。dubbo去开发了,spring cloud去开发了,在这个系统的接口调用中,我们是用hystrix去实现一整套的高可用保障机制,基于hystrix去做了限流、熔断和降级。
hystrix是国外的netflix开源的,netflix是国外很大的视频网站,系统非常复杂,微服务架构,多达几千个服务,为自己的场景,经过大量的工业验证,线上生产环境的实践,产出和开源了高可用相关的一个框架,熔断框架,hystrix。
如何用hystrix做限流、熔断和降级。以及这些都是什么鬼?如何使用hystrix来在你的系统中做开发,加入高可用的保障机制?
hystrix未来会成为国内的高可用的限流、熔断和降级这一块的事实上的标准,spring cloud微服务框架,就是集成了hystrix来做微服务架构中的限流、降级和熔断的。
前半部分,专注在高并发这一块,缓存架构,承载高并发,在各种高并发导致的令人崩溃/异常的场景下,运行着
缓存架构,高可用性,在各种系统的各个地方有乱七八糟的异常和故障的情况下,整套缓存系统还能继续健康的run着
HA,HAProxy,主备服务间的切换,这就做到了高可用性,主备实例,多冗余实例,高可用最最基础的东西
什么样的情况下,可能会导致系统的崩溃,以及系统不可用,针对各种各样的一些情况,然后我们用什么技术,去保护整个系统处于高可用的一个情况下
netflix(国外最大的类似于,爱奇艺,优酷)视频网站,五六年前,也是,感觉自己的系统,整个网站,经常出故障,可用性不太高
有时候一些vip会员不能支付,有时候看视频就卡顿,看不了视频。。。
影响公司的收入。。。
五六年前,netflix,api team,提升高可用性,开发了一个框架,类似于spring,mybatis,hibernate,等等这种框架
高可用性的框架,hystrix
hystrix,框架,提供了高可用相关的各种各样的功能,然后确保说在hystrix的保护下,整个系统可以长期处于高可用的状态,100%,99.99999%
最理想的状况下,软件的故障,就不应该说导致整个系统的崩溃,服务器硬件的一些故障,服务的冗余
唯一有可能导致系统彻底崩溃,就是类似于之前,支付宝的那个事故,工人施工,挖断了电缆,导致几个机房都停电
不可用,和产生一些故障或者bug的区别
资源隔离、限流、熔断、降级、运维监控
让你的系统里,某一块东西,在故障的情况下,不会耗尽系统所有的资源,比如线程资源
我实际的项目中的一个case,有一块东西,是要用多线程做一些事情,小伙伴做项目的时候,没有太留神,资源隔离,那块代码,在遇到一些故障的情况下,每个线程在跑的时候,因为那个bug,直接就死循环了,导致那块东西启动了大量的线程,每个线程都死循环
最终导致我的系统资源耗尽,崩溃,不工作,不可用,废掉了
资源隔离那一块代码,最多最多就是用掉10个线程,不能再多了,就废掉了,限定好的一些资源
限流:高并发的流量涌入进来,比如说突然间一秒钟100万QPS,废掉了,10万QPS进入系统,其他90万QPS被拒绝了
系统后端的一些依赖,出了一些故障,比如说mysql挂掉了,每次请求都是报错的,熔断了,后续的请求过来直接不接收了,拒绝访问,10分钟之后再尝试去看看mysql恢复没有
mysql挂了,系统发现了,自动降级,从内存里存的少量数据中,去提取一些数据出来
监控+报警+优化,各种异常的情况,有问题就及时报警,优化一些系统的配置和参数,或者代码
版权说明 : 本文为转载文章, 版权归原作者所有 版权申明
原文链接 : https://blog.csdn.net/ZGL_cyy/article/details/111054708
内容来源于网络,如有侵权,请联系作者删除!