面试题：复杂Bash脚本的故障排查与恢复策略

故障排查步骤

添加调试信息：在脚本开头添加 set -x，这会使脚本在执行时打印出每一条命令，便于观察执行流程和哪条命令失败。例如：

#!/bin/bash
set -x
# 脚本内容

检查环境变量：
- 使用 echo 命令打印出脚本中依赖的关键环境变量，确认其值是否正确。如：echo $MY_VARIABLE。
- 对于子脚本调用，检查子脚本执行时的环境变量是否与主脚本一致，可以在子脚本开头同样添加 set -x 查看。
子脚本排查：
- 检查子脚本的路径是否正确，确保主脚本能够正确找到子脚本。可以使用 which 命令确认子脚本是否在预期路径，如 which sub_script.sh。
- 查看子脚本本身是否有执行权限，若没有，使用 chmod +x sub_script.sh 添加权限。
- 对子脚本单独进行测试，在子脚本中添加 set -x 并直接运行，查看是否有报错。
文件系统操作检查：
- 确认对文件系统操作的路径是否存在且具有相应权限。例如，若脚本尝试写入文件，使用 ls -l 查看目标目录权限，确保用户对该目录有写权限。
- 对于不同类型文件系统（如 NFS、EXT4 等），检查其挂载状态。使用 mount 命令查看挂载信息，确保文件系统已正确挂载。

恢复策略

设置陷阱（trap）：在脚本中使用 trap 命令捕获异常信号（如 SIGTERM、SIGINT 等），当脚本接收到这些信号时，执行一些清理或恢复操作。例如：

#!/bin/bash
trap 'echo "脚本收到终止信号，进行清理操作"; cleanup_function' SIGTERM SIGINT

# 定义清理函数
cleanup_function() {
    # 这里可以进行一些文件关闭、资源释放等操作
    echo "清理工作完成"
}

# 脚本内容

记录执行状态：在脚本执行关键步骤时，记录其执行状态到日志文件。例如，在执行一个重要的子脚本前，写入日志：

echo "开始执行子脚本 sub_script.sh" >> execution_log.txt
./sub_script.sh
if [ $? -eq 0 ]; then
    echo "子脚本 sub_script.sh 执行成功" >> execution_log.txt
else
    echo "子脚本 sub_script.sh 执行失败" >> execution_log.txt
fi

这样在脚本失败后，可以根据日志文件确定执行到哪一步骤，以便从该步骤重新执行或进行针对性修复。

可能遇到的问题及解决方法

子脚本找不到：
- 问题：主脚本调用子脚本时提示找不到文件。
- 解决方法：检查子脚本路径是否正确，使用 which 命令确认子脚本位置。若路径错误，修改主脚本中的调用路径；若子脚本未在 PATH 中，可将其所在目录添加到 PATH 环境变量中，或使用绝对路径调用子脚本。
权限不足：
- 问题：脚本在进行文件系统操作（如写入文件、创建目录）时失败。
- 解决方法：使用 ls -l 查看文件或目录权限，若权限不足，根据需要使用 chmod 命令修改权限。例如，若要在某目录下创建文件，确保该目录对执行脚本的用户有写权限，可执行 chmod o+w target_directory（o 表示其他用户，若脚本以特定用户执行，可调整为该用户对应的权限设置）。
环境变量错误：
- 问题：子脚本依赖的环境变量在主脚本调用时未正确传递或值错误。
- 解决方法：在主脚本中明确设置子脚本所需环境变量，并在子脚本开头打印环境变量进行确认。例如，主脚本中 export MY_VARIABLE=value，子脚本中 echo $MY_VARIABLE 查看值是否正确。若值错误，检查主脚本中环境变量设置逻辑。

面试题：复杂Bash脚本的故障排查与恢复策略

知识考点

面试题答案

故障排查步骤

恢复策略

可能遇到的问题及解决方法