首页
/ 正文

正则表达式 – 修饰符（标记）（建议收藏）

更新时间: 2025-04-16 06:11:52

💡一则或许对你有用的小广告

欢迎加入小哈的星球 ，你将获得：专属的项目实战(已更新的所有项目都能学习) / 1v1 提问 / Java 学习路线 / 学习打卡 / 每月赠书 / 社群讨论

新开坑项目:《Spring AI 项目实战》 正在持续爆肝中，基于 Spring AI + Spring Boot 3.x + JDK 21...， 点击查看 ;

《从零手撸：仿小红书（微服务架构）》 已完结，基于 Spring Cloud Alibaba + Spring Boot 3.x + JDK 17...，点击查看项目介绍 ;演示链接： http://116.62.199.48:7070 ;

《从零手撸：前后端分离博客项目（全栈开发）》 2 期已完结，演示链接： http://116.62.199.48/ ;

截止目前，星球内专栏累计输出 100w+ 字，讲解图 4013+ 张，还在持续爆肝中.. 后续还会上新更多项目，目标是将 Java 领域典型的项目都整一波，如秒杀系统, 在线商城, IM 即时通讯，权限管理，Spring Cloud Alibaba 微服务等等，已有 3700+ 小伙伴加入学习，欢迎点击围观

前言：正则表达式修饰符（标记）的作用与重要性

在编程和文本处理领域，正则表达式（Regular Expression，简称 regex）如同一把多功能瑞士军刀，能够精准匹配、提取或替换文本中的复杂模式。而修饰符（Modifiers），又称标记（Flags），则是这把“刀”上最关键的调节旋钮——它们通过改变正则表达式的行为，赋予其更灵活的处理能力。无论是全局搜索、忽略大小写，还是处理多行文本，修饰符都能显著提升正则表达式的实用性。本文将深入解析常见修饰符的功能，并通过实际案例帮助读者掌握其应用场景。

修饰符的基本概念与作用

修饰符是附加在正则表达式末尾的字符，用于调整其匹配规则。它们如同“指令开关”，控制正则引擎如何解析和执行模式。例如，/pattern/g 中的 g 是全局修饰符，表示“匹配所有符合条件的子字符串”。

修饰符的使用方式因编程语言而异，但核心逻辑相似。在 JavaScript 中，修饰符写在正则字面量的斜杠后；在 Python 中，则通过 re 模块的函数参数传递。以下是常见修饰符的概览：

修饰符	名称	作用描述
`g`	全局匹配	搜索字符串中所有匹配项，而非仅第一个
`i`	忽略大小写	匹配时忽略大小写差异
`m`	多行模式	使 `^` 和 `$` 匹配每一行的开头和结尾
`s`	点任意模式	允许 `.` 匹配包括换行符在内的所有字符
`u`	Unicode 支持	启用对 Unicode 字符的正确处理
`y`	黏性修饰符	从上次匹配的结束位置继续精确匹配

全局修饰符（g）：开启“地毯式搜索”模式

功能：默认情况下，正则表达式仅匹配文本中第一个符合条件的子字符串。添加 g 修饰符后，引擎会持续扫描整个文本，直到所有匹配项都被找到。

比喻：想象你正在一本小说中寻找“苹果”这个关键词。如果没有 g，你只找到第一个出现的位置；而使用 g 就像让助手逐页翻阅整本书，记录所有出现的“苹果”。

代码示例（JavaScript）：

const text = "找到所有 apple：apple, Apple, apples";  
const regex = /apple/g;  
console.log(text.match(regex)); // 输出：["apple", "apple"]  
// 若无 `g`，输出仅第一个匹配项 ["apple"]

注意：g 修饰符会影响 exec() 和 test() 方法的行为，需在循环中配合使用。

忽略大小写修饰符（i）：隐形眼镜的魔法

功能：i 修饰符使匹配过程不区分字母的大小写。例如，/apple/i 将匹配 "Apple"、"APPLE"、"aPpLe" 等。

比喻：这就像为正则表达式戴上了一副“隐形眼镜”，让大小写差异在匹配时“隐形”。

代码示例（Python）：

import re  
text = "Hello, HELLO, hElLo"  
matches = re.findall(r"hello", text, flags=re.I)  
print(matches)  # 输出：['Hello', 'HELLO', 'hElLo']

场景应用：处理用户输入时，若需忽略大小写（如邮箱验证），i 修饰符能显著简化模式设计。

多行模式修饰符（m）：分页阅读的思维

功能：默认模式下，^ 匹配字符串开头，$ 匹配结尾。启用 m 后，^ 和 $ 会匹配每一行的起始与终止位置。

比喻：假设你有一份多行的账单文本，想查找每一行的开头是否有“支付”字样。m 修饰符就像逐行翻阅账单，而不是一次性扫描整页。

代码示例（PHP）：

$text = "第一行: 支付完成\n第二行: 收到款项";  
if (preg_match('/^支付/m', $text)) {  
    echo "找到匹配项！";  
} // 输出：找到匹配项

关键点：在处理多行日志或 CSV 文件时，m 能精准定位每行的特定位置。

点任意模式（s）：打破“点”的局限性

功能：默认情况下，. 无法匹配换行符 \n。添加 s 修饰符后，. 将匹配包括换行符在内的所有字符。

比喻：这如同给“点”（.）注射了一剂“万能匹配”药剂，让它不再对换行符“过敏”。

代码示例（JavaScript）：

const text = "多行文本\n包含换行符";  
// 默认模式  
console.log(/.*/.test(text)); // 输出：true（但只匹配到第一行）  
// 使用 `s` 模式  
const regex = /.*/s;  
console.log(regex.exec(text)[0]); // 输出完整文本，包含换行

场景：当需要匹配跨行的 HTML 标签或日志条目时，s 是关键工具。

Unicode 支持修饰符（u）：跨越字符编码的鸿沟

功能：u 修饰符启用对 Unicode 字符（如表情符号、多字节字符）的正确处理，确保正则表达式能识别非 ASCII 字符。

比喻：在国际化场景中，u 就像一座桥梁，让正则表达式能够“理解”不同语言和符号的复杂性。

代码示例（ES6+）：

const text = "😊 这是表情符号";  
// 默认模式  
console.log(/.\u{1F60A}/u.test(text)); // 输出：true（正确匹配表情符号）

注意：在处理非拉丁字符（如中文、阿拉伯语）时，u 是确保正确性的必要修饰符。

黏性修饰符（y）：精准续集的匹配

功能：y 修饰符强制正则表达式从上次匹配的结束位置继续匹配，且必须精确匹配当前位置。它常用于“粘连式”解析场景。

比喻：这如同在电影中强制续集播放，不允许跳过或倒带，必须从当前进度开始。

代码示例（JavaScript）：

const text = "123abc456";  
let regex = /\d+/y;  
let lastIndex = regex.lastIndex;  
console.log(regex.exec(text)); // 输出：["123"]  
regex.lastIndex = 4;  
console.log(regex.exec(text)); // 输出：["456"]（从索引4开始匹配）

场景：在解析固定格式的文本流（如二进制数据）时，y 能严格控制匹配流程。

其他语言中的修饰符实现与差异

不同编程语言对修饰符的支持略有差异：

Python：通过 re.compile() 的 flags 参数传递，如 re.IGNORECASE 等价于 i。
Java：修饰符通过 Pattern 类的静态常量指定，如 Pattern.CASE_INSENSITIVE。
C#：在正则字面量后通过 (?i) 等内联修饰符或 RegexOptions 枚举控制。

修饰符的组合与优先级

修饰符可以组合使用，例如 /pattern/gims 同时启用全局、忽略大小写、多行和点任意模式。优先级方面，组合顺序不影响效果，但需注意逻辑冲突（如 g 和 y 不能同时使用）。

避免修饰符的常见陷阱

遗忘全局模式：未添加 g 时，replace() 方法可能仅替换第一个匹配项。
多行模式误用：在单行文本中使用 m 可能导致意外结果。
Unicode 支持遗漏：处理非 ASCII 字符时忽略 u 可能引发匹配失败。

结论：修饰符是正则表达式的核心增强器

正则表达式 – 修饰符（标记）如同为工具箱中的每一把工具添加了“智能开关”，让开发者能够根据场景灵活调整匹配行为。从全局搜索到跨行匹配，从大小写兼容到 Unicode 支持，掌握修饰符的规则与组合逻辑，将大幅提升文本处理的效率与准确性。

建议读者通过实际项目练习，例如：

使用 g 和 i 统计文本中所有关键词的出现次数（不区分大小写）。
用 m 和 s 解析多行日志文件中的特定模式。
在国际化项目中结合 u 处理非拉丁字符的验证逻辑。

通过持续实践，修饰符将成为你手中不可或缺的“文本操控密钥”。

正则表达式 – 修饰符（标记）（建议收藏）

前言：正则表达式修饰符（标记）的作用与重要性

修饰符的基本概念与作用

全局修饰符（g）：开启“地毯式搜索”模式

忽略大小写修饰符（i）：隐形眼镜的魔法

多行模式修饰符（m）：分页阅读的思维

点任意模式（s）：打破“点”的局限性

Unicode 支持修饰符（u）：跨越字符编码的鸿沟

黏性修饰符（y）：精准续集的匹配

其他语言中的修饰符实现与差异

修饰符的组合与优先级

避免修饰符的常见陷阱

结论：修饰符是正则表达式的核心增强器

最新发布

Clion 2026.1.4 最新激活码，破解版安装教程（亲测至2099年）

RubyMine 2026.1.4 最新激活码，破解版安装教程（亲测至2099年）

Rider 2026.1.4 最新激活码，破解版安装教程（亲测至2099年）

GoLand 2026.1.4 最新激活码，破解版安装教程（亲测至2099年）

Pycharm 2026.1.4 最新激活码，破解版安装教程（亲测至2099年）

PhpStorm 2026.1.4 最新激活码，破解版安装教程（亲测至2099年）

Webstorm 2026.1.4 最新激活码，破解版安装教程（亲测至2099年）

IDEA 2026.1.4 最新激活码，破解版安装教程（亲测至2099年）

Pycharm 2026.1.3 最新激活码，破解版安装教程（亲测至2099年）

Rider 2026.1.3 最新激活码，破解版安装教程（亲测至2099年）