正则表达式性能优化方法(高效正则表达式编写)

编辑：宝哥软件园来源：互联网时间：2021-10-28

新天龙八部

评分

这里提到的正则表达式优化主要是针对目前常用的NFA模式正则表达式。详见：正则表达式匹配解析过程讨论与分析(正则表达式匹配原理)。从上面的例子中，我们可以推断出NFA正则表达式(常用语言：GNU emacs、Java、ERGP、LESS、MORE、NET语言、PCRE Library、Perl、PHP、Python、Ruby、SED、VI)其实主要是它的“回溯”，减少了“回溯”的次数(减少了循环搜索同一个字符的次数)。让我们看一个例子：

来源：脚本类型=' text/JAVAScript ' adsfadfdafsdadsfssadfsa/script。

匹配需求，匹配脚本中的所有内容……/脚本标签，包括更改标签。

常见的写法(1)，因为字符、空格、特殊符号等。可能出现在脚本后面，各种js代码可能出现在标签内部。我们的简单方法是：

正则表达式：脚本。*?*?/script(测试工具使用：regexBuddy)。

一共走了115步，回溯了：48次。因为我们用“.”字符，默认情况下，它匹配除n以外的所有字符。方法(2)，我们分析了特征，发现在script…之后，除了“”之外的所有字符都应该可用，然后是script标签中的一对js内容。可以定义为""以外的。(我只是举个例子来说明优化方法。在实际网页的脚本标签中，字符“”经常出现。).

正则表达式：脚本[？][^]/脚本