十一.文本处理

        命令trcoljoinpaste结合管道来学习下。

1.tr命令

格式 tr [option]…SET1 [SET2] , 其中常用:

常用的选项有:

选项说明
-d删除和set1匹配的字符,注意不是全词匹配也不是按字符顺序匹配
-s去除set1指定的在输入文本中连续并重复的字符

例子如下:

2.colTab转成相等数量的空格

常用的选项有:

选项说明
-xTab转换为空格
-h将空格转换为Tab(默认选项)

3.join将两个文件中包含相同内容的那一行合并在一起

常用的选项有:

选项说明
-t指定分隔符,默认为空格
-i忽略大小写的差异
-1指明第一个文件要用哪个字段来对比,默认对比第一个字段
-2指明第二个文件要用哪个字段来对比,默认对比第一个字段

4.paste这个命令与join 命令类似,它是在不对比数据的情况下,简单地将多个文件合并一起,以Tab隔开

常用的选项有:

选项说明
-d指定合并的分隔符,默认为Tab
-s不合并到一行,每个文件为一行

 

发表回复

电子邮件地址不会被公开。 必填项已用*标注