面试题答案
一键面试实现思路
- 使用
cut
命令提取每行的第3个字段。 - 使用
tr
命令将提取出的字段内容转换为大写。 - 使用
sort
和uniq
命令去除重复项,同时利用uniq -c
统计不同内容的数量。 - 为了优化性能,利用Bash管道将这些命令连接起来,避免中间结果占用过多内存。
具体命令
cut -d ' ' -f 3 large_file.txt | tr '[:lower:]' '[:upper:]' | sort | uniq -c
解释:
cut -d ' ' -f 3 large_file.txt
:以空格为分隔符,提取large_file.txt
每行的第3个字段。tr '[:lower:]' '[:upper:]'
:将输入的内容中的小写字母转换为大写字母。sort
:对输入内容进行排序,为uniq
命令做准备,因为uniq
只能识别相邻的重复行。uniq -c
:去除重复行,并在每行前加上该行出现的次数。