面试题：Bash 文本查找机制与系统集成优化

find 命令：适用于实时查找，因为它会在文件系统中实时遍历文件。语法为 find /path -type f -name "*.txt" -exec grep -i "特定内容" {} \;。这里 /path 是要查找的目录路径，-type f 表示只查找文件，-name "*.txt" 限定只查找文本文件，-exec grep -i "特定内容" {} \; 表示对找到的每个文件执行 grep 命令，-i 表示不区分大小写查找。
locate 命令：基于数据库查找，速度快，但数据库可能不是实时更新的。适合对实时性要求不高的场景。先执行 updatedb 更新数据库，然后使用 locate -i "*.txt" | xargs grep -i "特定内容"，locate -i "*.txt" 查找所有文本文件，xargs 将找到的文件列表作为参数传递给 grep 进行内容查找。由于本需求是实时查找，主要使用 find 命令。

SSH 密钥认证：在中央节点和各分布式节点间配置 SSH 密钥认证，实现无密码登录。在中央节点执行 ssh-keygen -t rsa 生成密钥对，然后使用 ssh-copy-id user@node_ip 将公钥复制到各节点，这样中央节点可通过 SSH 免密登录到各节点执行命令。
使用 ssh 执行命令：在中央节点编写脚本，例如 for node in node1_ip node2_ip node3_ip; do ssh user@$node 'find /path -type f -name "*.txt" -exec grep -i "特定内容" {} \; > /tmp/result_'"$node"'; done，该脚本在每个节点上执行查找命令，并将结果保存到各节点的 /tmp/result_节点名 文件中。

scp 命令：在中央节点获取各节点结果文件。在中央节点脚本中添加 for node in node1_ip node2_ip node3_ip; do scp user@$node:/tmp/result_$node /tmp/central_result_$node; done，将各节点的结果文件复制到中央节点的 /tmp 目录下。
数据合并：在中央节点使用 cat /tmp/central_result_* > /tmp/final_result 将所有节点的结果合并到一个文件 /tmp/final_result 以便进一步分析。

并行处理：使用 parallel-ssh 工具代替普通 ssh，实现并行执行命令，提高效率。先安装 parallel-ssh，然后使用 pssh -h hosts.txt -i 'find /path -type f -name "*.txt" -exec grep -i "特定内容" {} \; > /tmp/result_{%h}'，hosts.txt 包含各节点 IP 或主机名，{%h} 表示节点名，这样在各节点并行执行查找命令。
优化 find 查找路径：尽量缩小 find 命令的查找路径范围，只在包含文本文件的目录下查找，避免不必要的文件系统遍历。
减少数据传输：如果可能，在各节点上先对查找结果进行初步处理，例如统计行数等，只将处理后的汇总数据传输到中央节点，减少网络传输的数据量。

星途面试题库