宝哥软件园

55分钟学会正则表达式

编辑:宝哥软件园 来源:互联网 时间:2021-09-17

什么是常规?

正则表达式是用于描述一定数量文本的模式,用于匹配相同标准样式的文本。RegExp对象用于在JavaScript中表示正则表达式,这是字符串模式匹配的强大工具。

正则表达式是一种搜索和字符串替换操作。正则表达式广泛用于文本编辑器。例如,正则表达式用于:

检查文本是否包含指定的特征词,找出匹配特征词在文本中的位置,并从文本中提取信息。例如,字符串的子字符串修改文本类似于文本编辑器,几乎所有高级编程语言都支持正则表达式。在这个上下文中,“文本”只是一个字符串,所有可以执行的操作都是相似的。一些编程语言(如Perl和JavaScript)检查正则表达式的语法。

什么是正则表达式?

正则表达式只是一个字符串。没有长度限制,但是,这种正则表达式的长度通常很短。以下是正则表达式的一些示例:

我今天过了S天[A-Za-z0-9-_]{3,16} dddd-dd-dd v(d )()。d )* TotalMessages='(。*?)[]这些字符串实际上是微型计算机程序。正则表达式的语法实际上是一种轻量级的、简洁的、适用于特定领域的编程语言。记住这一点,那么你就可以很容易地理解下面的事情:

每个正则表达式都可以分解成一个指令序列,比如“先找到这个字符,再找到那个字符,然后从中找到一个字符。"每个正则表达式都有一个输入(文本)和一个输出(匹配规则的输出,有时是修改后的文本)。正则表达式中可能会出现语法错误。并非所有字符串都是正则表达式。正则表达式的语法很有个性,可以说是吓人。有时,可以编译它以使正则表达式执行得更快。在实现中,正则表达式具有其他特征。本文将重点介绍正则表达式的核心语法,几乎在所有正则表达式中都可以找到。

特别注意:正则表达式与文件通用语法无关,例如*.xml

正则表达式的基本语法。

性格;角色;字母

正则表达式包含一系列只能匹配自身的字符。有一些特殊的字符被称为“元字符”,可以匹配一些特殊的规则。

在下面的例子中,我用红色标记了元字符。

我今天过了S天[A-Za-z0-9-_]{3,16} dddd-dd-dd v(d )()。d )* TotalMessages='(。*?)'[] *大多数字符,包括所有字母和数字,都是普通字符。这意味着它们只能匹配自己,如下所示的正则表达式:

意味着只能匹配一个字符串,以“c”开头,后面是字符“a”,后面是字符“t”。

到目前为止,正则表达式的功能如下。

通用Find函数Java中的String.indexOf()函数PHP中的strpos()函数等。注意:除非另有说明,否则正则表达式区分大小写。然而,几乎所有正则表达式的实现都将提供一个标志来控制它们是否区分大小写。

单击“.”

我们将解释的第一个元字符是" "。这个符号意味着任何字符都可以匹配。下面显示的正则表达式:

c.t

意思是匹配一个以c开头,后跟任意字符,后跟字母t的字符串。

在文本中,这样的正则表达式可以用来查找像cat、cot和CZT这样的字符串,甚至是像c.t这样的组合,但是像ct或coot这样的字符串是找不到的。

使用反斜杠“”忽略元字符,以便元字符具有与普通字符相同的功能。正则表达式。

c。t

意思是“找到字母c,然后找到句号(”。"),后跟字母t "。

反斜杠本身也是一个元字符,这意味着反斜杠本身可以以类似的方式变回普通字符的用法。因此,正则表达式。

c\t

匹配以字符c开头,后跟反斜杠和字母t的字符串。

注意!在正则表达式的实现中。不能用于匹配换行符。“换行”的表示在不同的实现中是不同的。实际编程请参考相关文件。在这篇文章中,我认为。可以匹配任何字符。实现环境通常提供一个标志位来控制这一点。

性格类型

字符是方括号中的一组字符,这意味着它们中的任何一个都可以匹配。

正则表达式c[aeiou]t表示可以匹配的字符串是“以c开头,后跟aeiou中的任意字符,以t结尾”。在文本的实际应用中,这样的正则表达式可以匹配五个字符串:cat、cet、cit、cot和cut。正则表达式[0123456789]表示匹配任意整数。正则表达式[a]表示匹配单个字符a.忽略字符的示例。

[a]

表示匹配的字符串[a]

更多资讯
游戏推荐
更多+