某服务不可以,怀疑服务器压力过高,从服务器资源监控结果分析,并没有超出阈值(见下图) 但在这个时间点确实存在服务请求超时导致的不可用性降低的情况(见下图),我们这块是有负载均衡机制来保证可用性的。 查看日志发现某服务连接超时,日志如下,翻遍了所有服务器的内外网ip地址均为找到日志中的ip,这个不速之客从何而来?
这块儿的服务我们是使用zookeeper提供服务管理,注册到dubbo中心进行调度管理的,但是在往dubbo进行注册服务的时候有一台服务生产者的ip地址不正确,见下图(网上查出现这种情况的原因:1、服务器多网卡绑定,导致服务起来后程序自己选择的ip不对。2、提供服务的机器开启了vpn。3、dubbo配置文件中写死了host,我分析我们的原因很可能是1或者2,具体没深入调查),所以消费者在消费这个服务的时候就因这个地址不存在而导致超时,这个时候负载就飘到了另一台机器,而另一台机器的服务恰出现了不可用的问题,就导致用户感觉变慢了。
当时的解决方法是在往dubbo注册服务的时候强制指定host,避免因云主机可能存在上面三个原因导致的注册ip地址有误的情况。这样多台机器负载,就可以尽可能的降低系统的不可用问题的发生。
遗留问题:服务不可用期间日志输出中断,原因待查
©️公众号:思考者文刀
- 上一篇: 「砥砺阅读」之24《做局》
- 下一篇: 「砥砺阅读」之25《正说鲁迅》
评论