这几天自己线上的乞丐服务器遇到一个问题,io会瞬间飙升到很高很高,造成内存使用飙升。但是实际上并发量并不大(网络连接数)。知道是哪个进程造成的,但是确实排查代码中没有是么地方会有这么大的读写。实在想不通。
部署的是一个socket服务。用测试脚本跑,同时100个socket连接毫无压力。也不知道对方到底发的什么数据导致这么大的内存占用。
之前也处理过类似的问题。麻烦之处在于很好的定位问题,重现实际的操作。没办法,只能针对socket服务特定的端口进行抓包。希望能够通过数据包复现这种情况。
服务器问题,无非就是资源不合理的使用,造成服务器内存,cpu,io,流量等相关资源出现非常不正常的波动,资源使用率飙升。对于服务器性能问题的排查,没有其他比较好的办法,只能是通过重现复盘去改进。特别是如果服务器上跑的东西比较多,一个个的排查相当痛苦。
出现问题,首先看日志。如果是线上的,先想办法恢复服务再排查。
看看登录日志,访问日志是否有异常,确定是否有人扫机器。
看性能监控图表,分析机器的状况,以及问题发生的规律。
看是否有服务被系统kill。一般系统日志都会记录kill之前的进程列表,可以很好的分析哪些进程资源占用多。
如果还是没找到原因,那就只能抓网络数据。通过记录的网络数据在测试环境中复现线上问题。
本文中的五个步骤有助于您掌握转型的总体需求,并有助于您处理一些真正重要的事...
即使你不是搞IT的,也或多或少听说过服务器这种东西,服务器和我们的生活息息相...
近日,国际知名标准性能评测机构SPEC的CPU2017最新测试结果显示,宁畅信息产业(...
本文转载自微信公众号「 学习Java的小姐姐」,作者学习Java的小姐姐0618。转载本...
想必大家都有听说过美国服务器,但是不管是什么服务器人们在选择的时候总要对它...
几种 I/O 模型 Blocking I/O I/O 多路复用 Reactor 设计模式 I/O 多路复用模块 ...
关于硬件架构 想要了解Linux操作系统的内核设备和驱动模型,***先了解一下现在计...
各种规模的企业都需要依靠服务器来支持其工作负载,小型企业也不例外。但是选购...
虽然新冠疫情还远未结束,但更大的麻烦可能会在不太遥远的将来突然出现。现在是I...
新零售无疑是当下最炙手可热的一个领域,互联网巨头的加持,传统行业的拥抱都在...