Q: 在 grep、sed 和 awk 中，正则语法有什么差异？

grep 默认使用 BRE（基础正则），括号和 + 等元字符需要反斜杠转义（ \+），加 -E 启用 ERE 才能不转义直接使用；加 -P 则启用 PCRE，支持 \d、(?:...) 等现代语法。awk 默认使用 ERE，sed 默认 BRE。常见陷阱：在 grep BRE 中写 [0-9]+ 时，+ 被当作字面量而非"一个或多次"，需改为 [0-9]\+ 或加 -E 标志。跨工具移植正则时，务必确认目标引擎的正则方言。

Question 1

什么是正则表达式？

Accepted Answer

正则表达式（regex 或 regexp）是由一系列字符组成的搜索模式定义。正则表达式几乎在所有编程语言中都用于字符串匹配、验证、搜索替换和数据提取。常见用例包括：验证邮箱、手机号 and 密码；解析日志文件；从文本中提取数据；Web 框架中的 URL 路由；以及在编辑器和 CLI 工具（如 grep、sed、awk）中进行文本转换。掌握正则表达式是开发人员、数据工程师和系统管理员的一项基础技能。

Question 2

如何使用这个正则测试器？

Accepted Answer

在顶部的表达式输入框中（两个 / 分隔符之间）输入您的正则模式。设置所需标志（g 全局匹配、m 多行匹配、i 忽略大小写）。在左侧文本区域输入或粘贴测试字符串。右侧面板会即时显示所有匹配项并以蓝色高亮标注。匹配计数徽章显示找到的总匹配数。您还可以点击"常用正则库"侧边栏中的预设模式来快速加载常见验证任务的正则表达式。

Question 3

正则标志是什么意思？

Accepted Answer

常用正则标志：g（全局）——查找所有匹配项而非仅第一个；i（不区分大小写）——匹配字母时忽略大小写；m（多行）——使 ^ 和 $ 匹配每行的开头/结尾而非整个字符串；s（dotAll）——使 . 匹配换行符；u（unicode）——启用完整 Unicode 匹配；y（sticky）——仅从 lastIndex 位置匹配。最常用的组合是 "gm"（全局 + 多行），可跨所有行查找所有匹配。

Question 4

正则有性能问题需要注意吗？

Accepted Answer

是的，编写不当的正则模式可能导致「灾难性回溯」，正则引擎处理某些输入时耗时呈指数增长，称为 ReDoS（正则表达式拒绝服务攻击）。避免方法：1) 量词要具体——用 {1,100} 替代无限制的 +；2) 避免嵌套量词如 (a+)+；3) 可用时使用原子组或占有量词；4) 用长字符串边界情况测试正则；5) 生产代码中设置超时限。本工具在浏览器中运行正则不会影响服务器，但部署到生产前务必优化模式。

Question 5

在 grep、sed 和 awk 中，正则语法有什么差异？

Accepted Answer

grep 默认使用 BRE（基础正则），括号和 + 等元字符需要反斜杠转义（ \+），加 -E 启用 ERE 才能不转义直接使用；加 -P 则启用 PCRE，支持 \d、(?:...) 等现代语法。awk 默认使用 ERE，sed 默认 BRE。常见陷阱：在 grep BRE 中写 [0-9]+ 时，+ 被当作字面量而非"一个或多次"，需改为 [0-9]\+ 或加 -E 标志。跨工具移植正则时，务必确认目标引擎的正则方言。

Question 6

贪婪匹配和懒惰匹配有什么区别？

Accepted Answer

贪婪量词（*、+）匹配尽可能多的字符，懒惰量词（*?、+?）匹配尽可能少的字符。典型示例：<.+> 对 "

text

" 贪婪匹配会返回整个字符串，而 <.+?> 只返回 "

"。但懒惰量词并不意味着性能更好——引擎仍需回溯，只是方向相反。真正高效的方案是否定字符类 <[^>]+>，明确告知引擎 > 不在匹配范围内，从而完全消除回溯试探。

Question 7

捕获组和非捕获组有什么区别？如何提取匹配子串？

Accepted Answer

圆括号 (...) 默认创建捕获组，引擎记录该组匹配的子串，可在替换中用 $1/$2（JavaScript/Python re.sub）或 \1/\2（sed/grep -P）反向引用。只需分组逻辑而无需回引时，使用 (?:...) 非捕获组可略微提升性能并简化索引编号。命名捕获组 (?<name>...) 让代码更可读：Python 中用 match.group("name")，JavaScript 中用 match.groups.name。本测试器的匹配结果面板显示 m[0]（完整匹配），若需查看捕获组内容，可在浏览器控制台用 matchAll 迭代器访问 m[1]、m[2] 等子组。

正则表达式测试器

正则表达式

匹配结果

语法速查

什么是正则表达式测试器？

如何使用此工具

典型 DevOps 使用场景

常见错误模式

常见问题