1.按边缘距离大小匹配单词,可以用原字符\b,可以把正则表达式写成\b+要匹配的字符+\b的形式,比如要匹配一个文本中的单词 hi ,就可以把正则表达式写成\bhi\b。 拆解:\b匹配指定的单词或字符。*元字符是正则表达式中具有特殊含义的符号,不要与字符本身混淆。比如,\b是某种位置,\d匹配数字,\w匹配字母、数字、空白符或标点(如_等)。因此要准确匹配单词Hi的位置,而不是文本中包含Hi的连续字母(比如this中的hi),就必须用\b界定边界。 进一步延伸,如果我们要匹配以“ing”结尾的单词,可以写成\\b\\w+ing\\b,这样既能保证单词开头,又能匹配到单词末尾的“ing”。同样,若尝试匹配行首或行尾,则会用到^和$这两个元字符。例如,^Hello匹配以Hello开头的字符串,而world$则匹配以world结尾的字符串。需要注意的是,在多行模式下,^和$作用于每一行的首尾而非整个文本。掌握这些元字值,能在实际任务中大幅缩短检索规则的长度和精确度。*2.匹配 IPv四地址的正则表达式。元字符可以用\d加中括号来表示匹配的位数。匹配 IPv4 地址的正则表达式可以写成:\\
```
\\b(25[0-5]|2[0-4]\\d|1\\d{2}|[1-9]?\\d)\\.(25[0-5]|2[0-4]\\d|1\\d{2}|[1-9]?\\d)\\.(25[0-5]|2[0-4]\\d|1\\d{2}|[1-9]?\\d)\\.(25[0-5]|2[0-4]\\d|1\\d{2}|[1-9]?\\d)\\b
拆解说明:每个字节范围是 0 到 255,实际匹配时可以分解为三种情况匹配:\\
- `25[0-5]` 匹配 250~255;\\
- `2[0-4]\\d` 匹配 200~249;\\
- `1\\d{2}` 匹配 100~199;\\
- `[1-9]?\\d` 匹配 0~99(包含0)。\\
每个字节之间用点号`.`连接,但由于点号在正则中有特殊意义(匹配任意字符),所以需要使用反斜杠转义 `\\.` 来匹配真正的点号。最外层加上 `\\b` 保证整个地址与其他文本分隔开,避免误匹配到内嵌的数字部分。这样写出的正则不仅精准限定了每个字节取值范围,还能在输入字符串中安全匹配标准的 IPv4 地址。3.匹配区号加连字符加八位本地号的正则表达式。这里要遇到一个运算符|,正则表达式写成```
3.match /^\\d{3,4}-\\d{8}$/
拆解:用^和$分别固定行首和行尾即占据整个字符串。前面的区号可匹配3位或4位任何数字\\d{3,4}(如010,0591);连字符 - 原样保留区分标识;八位固定\\d{8}后面直接跟上$以确保完整个数。
这种方法能够精准限制号为1位数,常用于匹配国内固定座机或其他编码场景操作难度简便的固定结构。
➡5.匹配邮箱地址时需用到 '@'分割的频繁写法——理解关键词就是字符分离加名称规则独立定长变量结合关键分隔符。
我们将邮箱简化为格式 pattern/^[a-zA-Z0-9_'’-]+@[a-zA-Z0-9-]+(\\.[a-zA-Z0-9]+)+$/确保完整性:
中括号内两个典型区块①用户名为任意字母数字序号下划线。’单撇四率简典格式常用之一;@既是字符本身标记;其后是域名每一段落长度组合点数可用[和]区块分批定义并用+保证若干二或三域名终点控制co/jp等保持可识性可用{}通过精确长度升级(更适特定企业用例):
最终该功能可将输入逐人剔除异常提交串非常实用。
到此读者可感知正则的真正分类级——每当文本规对点汇聚界词分段限制,皆可用定位+字节-运算符按需求精确捕获。
✦特别注意竖线运算符号英文管道'|'两边表达共同或的意思:例- 准备一段|两项前则中只要个别表前缀匹配就触发抓录而遇到'()'包围串联时位置优项决定链路走向进而避开误判;搭配非捕获团可预过滤匹配集中表达时间轴开销加快拟合准确性。
通过构建、字符分段管理捕获节点实操零散字符练习应用会加深经验层次快速驾驭该工具域值定义表现逻辑。用户可在终端把思维切片直接实施应用即可自信迈步极地匹配新世界。
目录
1.按边缘距离大小匹配单词,可以用原字符\b,可以把正则表达式写成\b+要匹配的字符+\b的形式,比如要匹配一个文本中的单词 hi ,就可以把正则表达式写成\bhi\b。 拆解:\b匹配指定的单词或字符。*元字符是正则表达式中具有特殊含义的符号,不要与字符本身混淆。比如,\b是某种位置,\d匹配数字,\w匹配字母、数字、空白符或标点(如_等)。因此要准确匹配单词Hi的位置,而不是文本中包含Hi的连续字母(比如this中的hi),就必须用\b界定边界。 进一步延伸,如果我们要匹配以“ing”结尾的单词,可以写成\\b\\w+ing\\b,这样既能保证单词开头,又能匹配到单词末尾的“ing”。同样,若尝试匹配行首或行尾,则会用到^和$这两个元字符。例如,^Hello匹配以Hello开头的字符串,而world$则匹配以world结尾的字符串。需要注意的是,在多行模式下,^和$作用于每一行的首尾而非整个文本。掌握这些元字值,能在实际任务中大幅缩短检索规则的长度和精确度。*2.匹配 IPv四地址的正则表达式。元字符可以用\d加中括号来表示匹配的位数。匹配 IPv4 地址的正则表达式可以写成:\\
```
\\b(25[0-5]|2[0-4]\\d|1\\d{2}|[1-9]?\\d)\\.(25[0-5]|2[0-4]\\d|1\\d{2}|[1-9]?\\d)\\.(25[0-5]|2[0-4]\\d|1\\d{2}|[1-9]?\\d)\\.(25[0-5]|2[0-4]\\d|1\\d{2}|[1-9]?\\d)\\b
```
拆解说明:每个字节范围是 0 到 255,实际匹配时可以分解为三种情况匹配:\\
- `25[0-5]` 匹配 250~255;\\
- `2[0-4]\\d` 匹配 200~249;\\
- `1\\d{2}` 匹配 100~199;\\
- `[1-9]?\\d` 匹配 0~99(包含0)。\\
每个字节之间用点号`.`连接,但由于点号在正则中有特殊意义(匹配任意字符),所以需要使用反斜杠转义 `\\.` 来匹配真正的点号。最外层加上 `\\b` 保证整个地址与其他文本分隔开,避免误匹配到内嵌的数字部分。这样写出的正则不仅精准限定了每个字节取值范围,还能在输入字符串中安全匹配标准的 IPv4 地址。3.匹配区号加连字符加八位本地号的正则表达式。这里要遇到一个运算符|,正则表达式写成```
3.match /^\\d{3,4}-\\d{8}$/
拆解:用^和$分别固定行首和行尾即占据整个字符串。前面的区号可匹配3位或4位任何数字\\d{3,4}(如010,0591);连字符 - 原样保留区分标识;八位固定\\d{8}后面直接跟上$以确保完整个数。
这种方法能够精准限制号为1位数,常用于匹配国内固定座机或其他编码场景操作难度简便的固定结构。
➡5.匹配邮箱地址时需用到 '@'分割的频繁写法——理解关键词就是字符分离加名称规则独立定长变量结合关键分隔符。
我们将邮箱简化为格式 pattern/^[a-zA-Z0-9_'’-]+@[a-zA-Z0-9-]+(\\.[a-zA-Z0-9]+)+$/确保完整性:
中括号内两个典型区块①用户名为任意字母数字序号下划线。’单撇四率简典格式常用之一;@既是字符本身标记;其后是域名每一段落长度组合点数可用[和]区块分批定义并用+保证若干二或三域名终点控制co/jp等保持可识性可用{}通过精确长度升级(更适特定企业用例):
最终该功能可将输入逐人剔除异常提交串非常实用。
到此读者可感知正则的真正分类级——每当文本规对点汇聚界词分段限制,皆可用定位+字节-运算符按需求精确捕获。
✦特别注意竖线运算符号英文管道'|'两边表达共同或的意思:例- 准备一段|两项前则中只要个别表前缀匹配就触发抓录而遇到'()'包围串联时位置优项决定链路走向进而避开误判;搭配非捕获团可预过滤匹配集中表达时间轴开销加快拟合准确性。
通过构建、字符分段管理捕获节点实操零散字符练习应用会加深经验层次快速驾驭该工具域值定义表现逻辑。用户可在终端把思维切片直接实施应用即可自信迈步极地匹配新世界。
```