首页
/ 正文

Linux comm命令（保姆级教程）

更新时间: 2025-03-31 18:52:24

💡一则或许对你有用的小广告

欢迎加入小哈的星球 ，你将获得：专属的项目实战(已更新的所有项目都能学习) / 1v1 提问 / Java 学习路线 / 学习打卡 / 每月赠书 / 社群讨论

新开坑项目:《Spring AI 项目实战》 正在持续爆肝中，基于 Spring AI + Spring Boot 3.x + JDK 21...， 点击查看 ;

《从零手撸：仿小红书（微服务架构）》 已完结，基于 Spring Cloud Alibaba + Spring Boot 3.x + JDK 17...，点击查看项目介绍 ;演示链接： http://116.62.199.48:7070 ;

《从零手撸：前后端分离博客项目（全栈开发）》 2 期已完结，演示链接： http://116.62.199.48/ ;

截止目前，星球内专栏累计输出 100w+ 字，讲解图 4013+ 张，还在持续爆肝中.. 后续还会上新更多项目，目标是将 Java 领域典型的项目都整一波，如秒杀系统, 在线商城, IM 即时通讯，权限管理，Spring Cloud Alibaba 微服务等等，已有 3700+ 小伙伴加入学习，欢迎点击围观

前言：为什么学习comm命令？

在Linux系统中，文本文件的比较是一个高频操作场景。无论是代码版本控制、日志分析，还是配置文件维护，开发者常常需要快速找出两个文件的差异。虽然diff命令是差异分析的经典工具，但comm命令以其独特的列式输出和简洁的操作逻辑，成为特定场景下的高效选择。对于编程初学者和中级开发者而言，掌握comm命令不仅能提升工作效率，更能深入理解Linux文本处理的底层逻辑。

基础概念：comm命令的核心功能

什么是comm命令？

comm（Compare）是Linux系统中用于逐行比较两个已排序文本文件的专用工具。它的输出结果以三列形式展示，直观呈现两个文件的差异。这个命令的设计灵感来源于图书馆的卡片目录比对——就像图书管理员同时查看两本目录，快速标记出新增、删除或共同存在的条目。

核心特点总结

依赖文件排序：必须先用sort命令对两个文件进行排序
三列输出格式：
- 第一列：仅出现在文件1的内容
- 第二列：仅出现在文件2的内容
- 第三列：同时存在于两个文件的内容
灵活的列控制：通过选项可选择性显示/隐藏任意列

基本语法与选项详解

基础语法结构

comm [选项] 文件1 文件2

选项解析（核心功能开关）

选项	功能描述	类比解释
-1	隐藏第一列（仅文件1的内容）	相当于蒙住左眼，只看右侧
-2	隐藏第二列（仅文件2的内容）	相当于蒙住右眼，只看左侧
-3	隐藏第三列（共同内容）	相当于过滤掉重叠部分
-12	只显示第三列（共同内容）	只关注双方都认可的部分
-23	只显示第一列（仅文件1内容）	筛选出"文件1独有"的条目

注意：选项可以组合使用，但需按顺序排列（如-12等同于-1 -2）

实战案例：从基础到进阶

案例1：基础用法演示

准备测试数据

echo -e "apple\nbanana\ngrape\nkiwi" > file1.txt
echo -e "banana\ngrape\nmango\norange" > file2.txt

执行比较

comm file1.txt file2.txt

输出结果解析

apple
        mango
        orange
            grape
            banana

第一列（左）：apple 是file1独有
第二列（中）：mango和orange 是file2独有
第三列（右）：grape和banana 是共同内容

案例2：隐藏特定列的输出

需求：只显示共同内容

comm -12 file1.txt file2.txt

结果：

grape
banana

需求：仅显示差异部分（非共同内容）

comm -3 file1.txt file2.txt

结果：

apple
mango
orange

进阶技巧：与管道命令的组合使用

技巧1：处理未排序的文件

当文件未排序时，需要先用sort命令处理：

comm <(sort file1.txt) <(sort file2.txt)

技巧2：结合grep过滤特定内容

需求：找出同时存在于两个文件的"水果"且长度>5字符

comm -12 file1.txt file2.txt | grep -E '^.{6,}'

技巧3：自定义分隔符处理

默认comm以空格分隔列，可通过重定向修改：

comm -z file1.txt file2.txt | tr '\0' ' '

常见问题与解决方案

Q1：文件未排序导致输出错误

现象：输出结果出现"comm: file1.txt is not in sorted order"
解决：强制排序后再比较：

comm <(sort file1.txt) <(sort file2.txt)

Q2：如何比较多列格式文件？

场景：比较CSV文件的某一列
方案：先提取目标列并排序：

comm <(cut -d',' -f1 file1.csv | sort) <(cut -d',' -f1 file2.csv | sort)

Q3：如何统计差异行数？

方法：结合wc命令计数：

comm -3 file1.txt file2.txt | wc -l  # 统计差异行数
comm -12 file1.txt file2.txt | wc -l # 统计共同行数

高级应用场景

场景1：代码版本差异分析

comm -13 <(git diff --name-only HEAD^ HEAD | sort) <(git diff --name-only HEAD HEAD~2 | sort)

场景2：服务器配置文件比对

comm -23 /etc/hosts /etc/hosts.bak > changed_entries.txt

场景3：日志文件异常检测

comm -13 yesterday.log today.log | grep "ERROR" > new_errors.txt

命令对比：comm vs diff vs grep

工具	适用场景	输出特点	排序要求
comm	需要三列对比的有序文件	列式差异展示	必须排序
diff	行级差异分析	上下文差异标注	无
grep	内容模式匹配	单行匹配结果	无

结论与建议

comm命令以其独特的三列对比机制，成为Linux系统中处理有序文本文件的高效工具。通过掌握其核心选项（-1/-2/-3）和灵活的管道组合，开发者可以快速定位文件差异、统计共同项或提取特定内容。建议在使用前养成先排序的习惯，并结合sort、grep等命令构建更复杂的文本处理工作流。对于需要快速对比配置文件、日志片段等场景，comm往往能提供比diff更直观的列式分析结果。通过本文的案例演练和技巧总结，读者应能熟练运用该命令解决实际开发中的文本比较需求。

附录：命令扩展学习路径

基础巩固：man comm 查看完整帮助文档
进阶学习：diff、cmp、sdiff命令对比
实践项目：用comm实现两个用户列表的去重合并
性能优化：结合time命令分析排序对性能的影响

通过持续练习和场景化应用，comm命令将成为你Linux开发工具箱中的又一把得力"瑞士军刀"。