分布式系统中常见问题如何解决?

       分布式系统中涵盖了很多技术名词,如多副本、数据分区、一致性算法等等,这些技术在系统设计中非常重要。分布式系统中工作性能的而运行可靠性,是指在正常情况下的系统正常工作能力。理论上,系统发生任何异常,都能确保正常工作,即是符合可靠性要求。但实际应用中的突发异常情况很多,需要根据可能异常分析如何在发生时及时恢复。通常这种异常故障,主要分为硬件异常,软件异常两类。

分布式系统

分布式系统中常见问题如何解决?

1. 硬件异常

       硬件异常的情况很多,硬盘,电源等中包含的任意组件损坏,都是导致服务器无法正常运作的隐患,比起软件异常,这类故障通常难以避免。但可以利用技术手段修复硬件异常,不论是软件还是硬件恢复,基本的解决方法是与冗余有关。

       硬件方面,可通过单机冗余多份硬件,当其中某个硬件发生异常时,快速地用好的硬件替换掉故障的硬件,这种方式的硬件冗余对于数据中心级的故障是没有作用的。从软件角度来讲,可通过多副本(Replication)来实现快速恢复,当某台服务器硬件异常时,可以在软件层面将流量导入到新的副本上。

分布系统

2. 软件异常

       软件异常通常指的是系统的bug,这里面不仅包括自己写的系统的bug,也包括依赖的服务系统的bug。软件异常同样也是不能完全避免的。

       因此,在发生软件异常时,也需要有快速恢复的手段。解决方法包括,通过调整软件已有的配置参数,规避问题;重启软件或者依赖的服务,消除异常状态;直接修复bug,并升级版本

标签:分布式系统中常见问题如何解决?

网线、视频线、监控线批发采购、工程用线一站式平台http://www.choseal.net.cn
产品推荐系统用线
公司名称:武汉祥泰伟业商贸有限公司
联系电话:4000275771 
微信号:15307136715(同手机)