面试题：微服务架构下RPC常见故障及排查思路

常见故障场景及排查思路

响应延迟高
- 网络延迟：
  - 排查思路：使用ping命令检查服务间网络连通性，查看丢包率和往返时间（RTT）。若ping不通或丢包严重，需检查网络设备（如路由器、交换机）配置及网络线路是否正常。利用traceroute命令追踪数据包经过的路由节点，找出延迟较高的节点，判断是否是该节点设备性能瓶颈或网络拥塞导致。
- 服务负载高：
  - 排查思路：通过监控工具（如Prometheus + Grafana）查看服务的CPU、内存、磁盘I/O等资源使用情况。若CPU使用率过高，分析是否存在复杂计算或死循环代码。若内存使用接近上限，检查是否存在内存泄漏问题。对于磁盘I/O高，查看是否有频繁的文件读写操作。
- 序列化/反序列化耗时：
  - 排查思路：检查使用的序列化框架（如Protobuf、JSON等）。对比不同序列化框架在相同数据量下的序列化和反序列化时间。查看数据结构是否过于复杂，导致序列化/反序列化时间变长，可尝试优化数据结构，减少不必要的字段。
服务调用失败 - 网络连接失败
- 网络配置错误：
  - 排查思路：检查服务端和客户端的网络配置，包括IP地址、端口号是否正确配置。确认防火墙规则，确保服务端口没有被封禁。若使用容器化部署，检查容器网络配置，如Docker网桥设置是否正确。
- 服务未启动或端口未监听：
  - 排查思路：使用命令（如在Linux下使用netstat -anp | grep ）查看服务对应的端口是否处于监听状态。若未监听，检查服务启动脚本是否有错误，日志中是否有启动失败的相关信息，如依赖服务未启动等。
服务调用失败 - 业务逻辑异常
- 参数错误：
  - 排查思路：查看服务接口文档，确认调用方传入的参数是否符合接口定义，包括参数类型、长度、取值范围等。在服务端代码中添加参数校验逻辑，并在日志中记录参数值，以便定位问题。
- 依赖服务故障：
  - 排查思路：梳理服务的依赖关系，确认依赖的其他服务是否正常运行。通过监控工具查看依赖服务的健康状态。若依赖服务故障，按照上述排查思路对依赖服务进行故障排查。

面试题：微服务架构下RPC常见故障及排查思路

知识考点

面试题答案

常见故障场景及排查思路