当前位置：主页 > 查看内容

正则表达式性能优化方法（高效正则表达式书写）

发布时间：2021-05-06 00:00| 有位朋友查看

简介：这里说的正则表达式优化，主要是针对目前常用的NFA模式正则表达式，详细可以参考：正则表达式匹配解析过程探讨分析（正则表达式匹配原理）。从上面例子，我们可以推断出，影响NFA类正则表达式（常见语言：GNU Emacs,Java,ergp,less,more,.NET语言, PCRE li……

这里说的正则表达式优化，主要是针对目前常用的NFA模式正则表达式，详细可以参考：正则表达式匹配解析过程探讨分析（正则表达式匹配原理）。从上面例子，我们可以推断出，影响NFA类正则表达式（常见语言：GNU Emacs,Java,ergp,less,more,.NET语言,
PCRE library,Perl,PHP,Python,Ruby,sed,vi )其实主要是它的“回溯”，减少“回溯”次数（减少循环查找同一个字符次数），是提高性能的主要方法。我们来看个例子：

源字符串：<script type="text/javascript">adsfadfsdasfsdafdsfsadfsa</script>

匹配要求，匹配<script….>….</script>标签里面所有内容，包括改标签

常见写法(1)，因为<script后面可能出现字符、空白、特殊符号等，还有标签里面也可能出现各种js代码。我们简单方法是：

正则表达式：<script.*?>.*?</script> (测试工具使用了：regexBuddy)

总共花费115步，回溯了：48次。因为我们使用”.”字符，匹配默认情况下除了\n之外所有字符。
方法（2），我们分析特点发现，<script…>后面，应该是除了”>”之外都可以字符，然后一对<script>标签里面js内容。可以定义为除了”<”之外。（这里面我只是举例说明优化方法，实际网页中script标签里面，常见都会出现有”<”字符了）

正则表达式：<script[^?>]+>[^<]+</script>

19步，0次回溯！，步骤只有原先的15%左右，性能几倍的提升了！
从上面我们看到，不同正则表达式，对通用字符配平，性能相差会很大。减少“回溯”是最好的方法，减少回溯其中最主要的方法是：”用最小范围的元字符，尽量避免用过大的元字符！”。一般规律如下：

1、使用正确的边界匹配器（^、$、\b、\B等），限定搜索字符串位置
2、使用具体的元字符、字符类（\d、\w、\s等），少用”.”字符
3、使用正确的量词（+、*、?、{n,m}），如果能够限定长度，匹配最佳
4、使用非捕获组、原子组，减少没有必要的字匹配捕获用(?:)

如：我想匹配一些英文字母，它后面接的是数字。如：abc1234,我可以写 “\w+\d+”，也可以写”[a-zA-Z]+\d+” ，其中第一个\w+会先匹配所有abc1234，然后回溯，匹配满足\d+格式。一共4步，而后面这个只需要2步，步骤减少一半了！好了，今天就先到这里，欢迎大家讨论、交流！

原文链接：https://m.jb51.net/article/85895.htm
本站部分内容转载于网络，版权归原作者所有，转载之目的在于传播更多优秀技术内容，如有侵权请联系QQ/微信：153890879删除，谢谢！

上一篇：正则表达式、分组、子匹配（子模式）、非捕获子匹配（子模式） 下一篇：详解表单验证正则表达式实例(推荐)

推荐图文



腾讯云全面更新数据智能服务全景图！

网络编程

git丢弃本地修改的所有文件(新增、删除、修改)

网络编程

Ajax实现城市二级联动（三）

网络编程

IDEA中git撤回上一次push的方法（指定回到某个版本

网络编程

基于react hooks,zarm组件库配置开发h5表单页面 -

网络编程

数据结构之顺序表

网络编程

周排行

月排行

总排行

1 C语言的一些“小细节“(1)

2 如何把一个Excel文件放到ASP页面中去？

3 SQL Anywhere正则表达式语法与示例

4 AJAX分页效果简单实现

5 Redis面试一定要知道的3个问题！

6 导致MySQL索引失效的几种常见写法

7 数据库是咋工作的之一

8 SyntaxHighlighter 语法高亮插件的使用教

9 PHP中isset、empty的用法与区别示例详解

10 bower 强大的管理web包管理工具

1 基本命令学习之Linux压缩和解压缩命令

2 谷歌胜诉！10年Java版权案终结

3 YUV420转RGB888

4 详解Hibernate注解方式的二级缓存

5 解决spring mvc 返回json数据到ajax报错p

6 面试官问我Redis的数据类型，我回答了8种

7 Android 高频面试之必考Java基础

8 ajax实现上传图片保存到后台并读取的实例

9 分享一次排查CLOSE_WAIT过多的经验 - 踩

10 朋友说说大全：真正的朋友，了解你比你自

1 Element el-button 按钮组件的使用详解

2 PHP sdk实现在线打包代码示例

3 密室逃脱

4 Spring AOP代理详细介绍

5 KDE 桌面环境定制指南

6 HTML中的XML数据岛记录编辑与添加

7 鸿蒙第三方组件-图片裁剪组件

8 存量用户运营企业微信的“用户端小程序”

9 Android 微信文件传输助手文件夹

10 微软确认：Windows 10 下月全面放弃经典

随机推荐

PHP解密支付宝小程序的加密数据、手机号

1.小程序端代码示例 my.getPhoneNumber({ success: (res) = { let encryptedData...

如何巧用vimdiff来替代原始的svn diff和g

有许多命令行选手在linux下开发的时候会经常遇到一个问题，无论是svn还是git，提...

vscode修改默认浏览器的方法

vscode怎么浏览器打开html预览？这里大家可以通过安装open in browser插件解决。...

Java-HashMap-removeNode 源码分析

Java HashMap removeNode 方法分析源码分析仓库 https://github.com/HANXU2018...

基于PHP+Mysql简单实现了图书购物车系统

PHP+Mysql简单实现了图书购物车本文主要讲述如何通过PHP+HTML简单实现图书购物...

SQL 正则表达式及mybatis中使用正则表达

mysql提供的模式匹配的其他类型是使用扩展正则表达式。当你对这类模式进行匹配...

git 拉取远程分支到本地的方法步骤

步骤： 1、新建一个空文件，文件名为hhhh 2、初始化 git init 3、自己要与origin...

大意了，1次亿级数据分页优化搞了半夜！

图片来自 Pexels 突然电话响了起来，一看是我们的一个开发同学，顿时紧张了起来...

RT Thread之ADC电压读取

官网连接 https://docs.rt-thread.org/#/rt-thread-version/rt-thread-standard/...

Vue看了就会的8个小技巧

1. 始终在 `v-for` 中使用 `:key` 在需要操纵数据时，将key属性与v-for指令一起...

正则表达式性能优化方法（高效正则表达式书写）

推荐图文

随机推荐

关于我们