“上一篇我们掌握了 sed 的基础替换,如同获得了第一把钥匙。目前,让我们更进一步,学习如何精准锁定目标行,如同拥有了导航地图,让每一次操作都直击要害!”
地址定位的四种维度
sed 的强劲,很大程度上源于其灵活多变的地址定位能力。它能从四个维度锁定你的目标:
- 行号定位:简单直接,如手术刀般准确。sed ‘10,20d’ file 意味着删除文件的第10到20行。对于结构固定的文件,这无疑是最快捷的方式。
- 正则匹配:模式的狩猎者。sed ‘/^ERROR/p’ app.log 会在 app.log 中搜寻以 “ERROR” 开头的行并打印出来。这是动态文本处理的利器。
- 范围组合:起始与终点的界定。sed ‘/START/,/END/s/foo/bar/’ 会在匹配到 “START” 的行开始,到匹配到 “END” 的行结束的这个范围内,将 “foo” 替换为 “bar”。处理日志块或特定配置节时尤为有效。
- 特殊符号:例如 $ 代表最后一行,1~2 代表从第一行开始,每隔一行匹配一次(奇数行)。
这些维度可以单独使用,也可巧妙组合,编织出复杂的定位逻辑。
AlmaLinux正则增强特性
在AlmaLinux(以及大多数现代Linux发行版)中,sed 的正则表达式能力得到了增强,主要体目前对POSIX扩展正则表达式(ERE)的支持上。
POSIX BRE vs ERE (PCRE-like):默认情况下,sed 使用基础正则表达式(BRE),其中像 ?, +, {}, |, () 等元字符需要转义 (?, +, {}, |, ())。通过 -r (或 –regexp-extended) 选项,可以启用扩展正则,使得这些元字符无需转义,书写更简洁,可读性更强,更接近Perl兼容正则表达式(PCRE)的风格。
换行符处理与多行合并:sed 默认是逐行处理的,换行符
在模式空间中一般是不可见的。但通过 N 指令,可以将下一行追加到模式空间,此时模式空间中就会包含
。例如,sed ‘N;s/\n//’ 可以将两行合并为一行。这是实现跨行匹配和替换的关键技巧。
分支跳转实战
sed 不仅仅是简单的查找替换,它还拥有初步的逻辑控制能力——分支与跳转。这让 sed 脚本有了“思考”的能力。看这个例子,我们将日志文件中的错误行升级为CRITICAL级别并打印,其他行则直接删除:
sed '{
/error/{
s/alert/CRITICAL/
p
}
d
}' logfile
这里的花括号 {} 将多条指令组合在一起,作用于匹配 /error/ 的行。第一执行替换 s/alert/CRITICAL/,然后打印 p,最后无论是否匹配,所有行都会经过 d 指令(除非被 p 后通过 q 或其他方式提前退出)。这个例子中,匹配的行被处理并打印,然后被 d 删除;不匹配的行直接被 d 删除。因此,只有处理过的错误行会被输出。
保持空间进阶用法
除了模式空间(Pattern Space,当前处理行的缓冲区),sed 还有一个神秘的“后备仓库”——保持空间(Hold Space)。通过 h, H, g, G, x 等指令,我们可以在这两个空间之间巧妙地腾挪数据,实现复杂的多行操作,例如跨行计算。
想象一下,我们要从 /var/log/messages 中提取AlmaLinux系统负载的峰值信息。这一般分布在连续的几行中。我们可以这样做:
sed -n '/Load avg/{h; n; H; x; s/\n/ /p}' /var/log/messages
解析: /Load avg/: 找到包含 “Load avg” 的行。 h: 将该行(模式空间内容)复制到保持空间(覆盖)。 n: 读取下一行到模式空间。 H: 将当前模式空间的内容追加到保持空间。 x: 交换模式空间和保持空间的内容。目前模式空间包含了之前两行的合并内容。 s/\n/ /p: 将模式空间中的换行符替换为空格,并打印结果。 这只是冰山一角,保持空间的灵活运用是 sed 高阶技巧的试金石。
“精准定位的地图已在手中,正则表达式的利剑也已出鞘。我们甚至窥见了 sed 逻辑控制与数据暂存的曙光。下一篇,我们将正式踏入 sed 的‘编程模式’,探索其流程控制的奥秘,解锁编写复杂 sed 脚本的终极能力!”
暂无评论内容