当前位置：主页 > 查看内容

C# 正则表达式，你会几个？

发布时间：2021-05-13 00:00| 有位朋友查看

简介：本文转载自微信公众号「CSharp编程大全」，作者 zls365 。转载本文请联系CSharp编程大全公众号。最近写爬虫时需要用到正则表达式，有段时间没有使用正则表达式现在渐渐感觉有些淡忘，现在使用还需要去查询一些资料。为了避免以后这样的情况，在此记录下正则……

本文转载自微信公众号「CSharp编程大全」，作者 zls365 。转载本文请联系CSharp编程大全公众号。

最近写爬虫时需要用到正则表达式，有段时间没有使用正则表达式现在渐渐感觉有些淡忘，现在使用还需要去查询一些资料。为了避免以后这样的情况，在此记录下正则表达式的一些基本使用方法附带小的实例。让以后在使用时能一目了然知道他的使用，为开发节约时间，同时也分享给大家。

正则元字符

在说正则表达式之前我们先来看看通配符，我想通配符大家都用过。通配符主要有星号(*)和问号(?)，用来模糊搜索文件。winodws中我们常会使用搜索来查找一些文件。如:*.jpg，XXX.docx的方式，来快速查找文件。其实正则表达式和我们通配符很相似也是通过特定的字符匹配我们所要查询的内容信息。已下代码都是区分大小写。

常用元字符

懒惰限定符

捕获分组

得到上面秘籍后我们可以小试牛刀...

小试牛刀

在C#中使用正则表达式主要是通过Regex类来实现。命名空间：using System.Text.RegularExpressions。

其中常用方法：

在使用正则表达式前我们先来看看“@”符号的使用。

学过C#的人都知道C# 中字符串常量可以以@ 开头声名，这样的优点是转义序列“不”被处理，按“原样”输出，即我们不需要对转义字符加上 \ (反斜扛)，就可以轻松coding。如:

string filePath = @"c:\Docs\Source\CK.txt" // rather than "c:\\Docs\\Source\\CK.txt"

如要在一个用 @ 引起来的字符串中包括一个双引号，就需要使用两对双引号了。这时候你不能使用 \ 来转义爽引号了，因为在这里 \ 的转义用途已经被 @ “屏蔽”掉了。如:

string str=@"""Ahoy!"" cried the captain."  // 输出为："Ahoy!" cried the captain.

字符串匹配：

在实际项目中我们常常需要对用户输入的信息进行验证。如：匹配用户输入的内容是否为数字，是否为有效的手机号码，邮箱是否合法....等。

实例代码：

string RegexStr = string.Empty; 
#region 字符串匹配 
 
RegexStr = "^[0-9]+$";  //匹配字符串的开始和结束是否为0-9的数字[定位字符] 
Console.WriteLine("判断'R1123'是否为数字:{0}", Regex.IsMatch("R1123", RegexStr)); 
Console.WriteLine("判断'1123'是否为数字:{0}", Regex.IsMatch("1123", RegexStr)); 
 
RegexStr = @"\d+";  //匹配字符串中间是否包含数字(这里没有从开始进行匹配噢,任意位子只要有一个数字即可) 
Console.WriteLine("'R1123'是否包含数字:{0}", Regex.IsMatch("R1123", RegexStr)); 
Console.WriteLine("'博客园'是否包含数字:{0}", Regex.IsMatch("博客园", RegexStr)); 
 
//感谢@zhoumy的提醒..已修改错误代码 
RegexStr = @"^Hello World[\w\W]*";  //已Hello World开头的任意字符(\w\W：组合可匹配任意字符) 
Console.WriteLine("'HeLLO WORLD xx hh xx'是否已Hello World开头:{0}", Regex.IsMatch("HeLLO WORLD xx hh xx", RegexStr, RegexOptions.IgnoreCase)); 
Console.WriteLine("'LLO WORLD xx hh xx'是否已Hello World开头:{0}", Regex.IsMatch("LLO WORLD xx hh xx", RegexStr,RegexOptions.IgnoreCase)); 
//RegexOptions.IgnoreCase：指定不区分大小写的匹配。 
 
#endregion

显示结果：

字符串查找：

实例代码：

string RegexStr = string.Empty;  
 
#region 字符串查找 
 
string LinkA = "<a href=\"http://www.baidu.com\" target=\"_blank\">百度</a>"; 
 
RegexStr = @"href=""[\S]+""";   // ""匹配" 
Match mt = Regex.Match(LinkA, RegexStr); 
 
Console.WriteLine("{0}。", LinkA); 
Console.WriteLine("获得href中的值：{0}。", mt.Value); 
 
RegexStr = @"<h[^23456]>[\S]+<h[1]>";    //<h[^23456]>:匹配h除了2,3,4,5,6之中的值,<h[1]>:h匹配包含括号内元素的字符 
Console.WriteLine("{0}。GetH1值：{1}", "<H1>标题<H1>", Regex.Match("<H1>标题<H1>", RegexStr, RegexOptions.IgnoreCase).Value); 
Console.WriteLine("{0}。GetH1值：{1}", "<h2>小标<h2>", Regex.Match("<h2>小标<h2>", RegexStr, RegexOptions.IgnoreCase).Value); 
//RegexOptions.IgnoreCase:指定不区分大小写的匹配。 
 
RegexStr = @"ab\w+|ij\w{1,}";   //匹配ab和字母 或 ij和字母 
Console.WriteLine("{0}。多选结构：{1}", "abcd", Regex.Match("abcd", RegexStr).Value); 
Console.WriteLine("{0}。多选结构：{1}", "efgh", Regex.Match("efgh", RegexStr).Value); 
Console.WriteLine("{0}。多选结构：{1}", "ijk", Regex.Match("ijk", RegexStr).Value); 
 
RegexStr = @"张三?丰";    //?匹配前面的子表达式零次或一次。 
Console.WriteLine("{0}。可选项元素：{1}", "张三丰", Regex.Match("张三丰", RegexStr).Value); 
Console.WriteLine("{0}。可选项元素：{1}", "张丰", Regex.Match("张丰", RegexStr).Value); 
Console.WriteLine("{0}。可选项元素：{1}", "张飞", Regex.Match("张飞", RegexStr).Value); 
 
/*  
 例如： 
July|Jul可缩短为July? 
4th|4   可缩短为4(th)? 
*/ 
 
//匹配特殊字符 
RegexStr = @"Asp\.net";    //匹配Asp.net字符，因为.是元字符他会匹配除换行符以外的任意字符。这里我们只需要他匹配.字符即可。所以需要转义\.这样表示匹配.字符 
Console.WriteLine("{0}。匹配Asp.net字符：{1}", "Java Asp.net SQLServer", Regex.Match("Java Asp.net SQLServer", RegexStr).Value); 
Console.WriteLine("{0}。匹配Asp.net字符：{1}", "C# Java", Regex.Match("C# Java", RegexStr).Value); 
 
#endregion

显示结果：

贪婪与懒惰

string f = "fooot";//贪婪匹配 
RegexStr = @"f[o]+"; 
Match m1 = Regex.Match(f, RegexStr); 
Console.WriteLine("{0}贪婪匹配(匹配尽可能多的字符)：{1}", f, m1.ToString()); 
 
//懒惰匹配 
RegexStr = @"f[o]+?"; 
Match m2 = Regex.Match(f, RegexStr); 
Console.WriteLine("{0}懒惰匹配(匹配尽可能少重复)：{1}", f, m2.ToString());

显示结果：

从上面的例子中我们不难看出贪婪与懒惰的区别，他们的名子取的都很形象。

贪婪匹配：匹配尽可能多的字符。

懒惰匹配：匹配尽可能少的字符。

(exp)分组

在做爬虫时我们经常获得A中一些有用信息。如href,title和显示内容等。

string TaobaoLink = "<a href=\"http://www.taobao.com\" title=\"淘宝网 - 淘！我喜欢\" target=\"_blank\">淘宝</a>"; 
RegexStr = @"<a[^>]+href=""(\S+)""[^>]+title=""([\s\S]+?)""[^>]+>(\S+)</a>"; 
Match mat = Regex.Match(TaobaoLink, RegexStr); 
for (int i = 0; i < mat.Groups.Count; i++) 
{ 
    Console.WriteLine("第"+i+"组："+mat.Groups[i].Value); 
}

显示结果：

在正则表达式里使用()包含的文本自动会命名为一个组。上面的表达式中共使用了4个()可以认为是分为了4组。

输出结果共分为：4组。

0组：为我们所匹配的字符串。

1组：是我们第一个括号[href=""(\S+)""]中(\S+)所匹配的网址信息。内容为：http://www.taobao.com。

2组：是第二个括号[title=""([\s\S]+?)""]中所匹配的内容信息。内容为：淘宝网 - 淘!我喜欢。

这里我们会看到+?懒惰限定符。title=""([\s\S]+?)"" 这里+?的下一个字符为"双引号，"双引号在匹配字符串后面还有三个。+?懒惰限定符会尽可能少重复，所他会匹配最前面那个"双引号。如果我们不使用+?懒惰限定符他会匹配到：淘宝网 - 淘!我喜欢" target= 会尽可能多重复匹配。

3组：是第三个括号[(\S+)]所匹配的内容信息。内容为：淘宝。

说明：反义元字符所对应的元字符都能组合匹配任意字符。如:[\w\W],[\s\S],[\d\D]..

(?<name>exp) 分组取名

当我们匹配分组信息过多后，在某种场合只需取当中某几组信息。这时我们可以对分组取名。通过分组名称来快速提取对应信息。

string Resume = "基本信息姓名:CK|求职意向:.NET软件工程师|性别:男|学历:本专|出生日期:1988-08-08|户籍:湖北.孝感|E - Mail:9245162@qq.com|手机:15000000000"; 
RegexStr = @"姓名:(?<name>[\S]+)\|\S+性别:(?<sex>[\S]{1})\|学历:(?<xueli>[\S]{1,10})\|出生日期:(?<Birth>[\S]{10})\|[\s\S]+手机:(?<phone>[\d]{11})"; 
Match matc = Regex.Match(Resume, RegexStr); 
Console.WriteLine("姓名：{0},手机号：{1}", matc.Groups["name"].ToString(), matc.Groups["phone"].ToString());

显示结果：

通过(?<name>exp)可以很轻易为分组取名。然后通过Groups["name"]取得分组值。

获得页面中A标签中href值

string PageInfo = @"<hteml> 
                        <div id=""div1""> 
                            <a href=""http://www.baidu.con"" target=""_blank"">百度</a> 
                            <a href=""http://www.taobao.con"" target=""_blank"">淘宝</a> 
                            <a href=""http://www.cnblogs.com"" target=""_blank"">博客园</a> 
                            <a href=""http://www.google.con"" target=""_blank"">google</a> 
                        </div> 
                        <div id=""div2""> 
                            <a href=""/zufang/"">整租</a> 
                            <a href=""/hezu/"">合租</a> 
                            <a href=""/qiuzu/"">求租</a> 
                            <a href=""/ershoufang/"">二手房</a> 
                            <a href=""/shangpucz/"">商铺出租</a> 
                        </div> 
                    </hteml>"; 
RegexStr = @"<a[^>]+href=""(?<href>[\S]+?)""[^>]*>(?<text>[\S]+?)</a>"; 
MatchCollection mc = Regex.Matches(PageInfo, RegexStr); 
foreach (Match item in mc) 
{ 
    Console.WriteLine("href:{0}--->text:{1}",item.Groups["href"].ToString(),item.Groups["text"].ToString()); 
}

显示结果：

Replace 替换字符串

用户在输入信息时偶尔会包含一些敏感词，这时我们需要替换这个敏感词。

string PageInputStr = "靠.TMMD,今天真不爽...."; 
RegexStr = @"靠|TMMD|妈的"; 
Regex rep_regex = new Regex(RegexStr); 
Console.WriteLine("用户输入信息：{0}", PageInputStr); 
Console.WriteLine("页面显示信息：{0}", rep_regex.Replace(PageInputStr, "***"));

显示结果：

对一些敏感词直接替换成***代替。

Split 拆分字符串

string SplitInputStr = "1xxxxx.2ooooo.3eeee.4kkkkkk."; 
RegexStr = @"\d"; 
Regex spl_regex = new Regex(RegexStr); 
string[] str = spl_regex.Split(SplitInputStr); 
foreach (string item in str) 
{ 
    Console.WriteLine(item); 
}

显示结果：

根据数字截取字符串。

本文转载自网络，原文链接：https://mp.weixin.qq.com/s/axUSqptFVBw8aolObuRgtw
本站部分内容转载于网络，版权归原作者所有，转载之目的在于传播更多优秀技术内容，如有侵权请联系QQ/微信：153890879删除，谢谢！

上一篇：前端基础知识整理汇总二 下一篇：我喜欢的 12 个VSCode 插件！

随机推荐

Java和大数据应该如何选？选对让你薪资翻

有很多人在听说大数据之后，会开始纠结JAVA与大数据的区别，甚至还在纠结Java和...
[leetcode/lintcode 题解] 阿里算法面试

描述你正在和你的朋友玩猜数字 (Bulls and Cows)游戏：你写下一个数字让你的朋...
北京慧达天下使用OOS提高发布效率

本文介绍了北京慧达天下如何使用运维编排OOS提高发布效率。公司介绍公司名称：...
基于Kafka+Flink平台化设计，实时数仓还

本文由网易云音乐实时计算平台研发工程师岳猛分享，主要从以下四个部分将为大家...
2021研发效能实践案例征集大赛

我们知道效能提升就是要应用系统方法实践和工具通过它们改进技术、工程能力和...
Windows云服务器登录方式概述_云耀云服务

约束与限制只有运行中的云服务器云主机才允许用户登录。 Windows操作系统用户名...
功夫贷获凯泰资本4000万融资！官网启用“

TOP云（west.cn）1月25日消息，近日，功夫贷宣布获得4000万人民币A轮融资，本轮...
hk域名哪里注册

hk 域名哪里注册？ .hk域名在国内是可以注册的，只要提供了.hk 域名注册服务...
[Snowflake核心技术解读系列三]云原生技

背景 2020年9月16日 Snowflake成功IPO 交易首日市场估值达到704亿美元募集资金3...
高德打车通用可编排订单状态机引擎设计

作者 | 亮言来源 | 阿里技术公众号一背景订单状态流转是交易系统的最为核心...

C# 正则表达式，你会几个？

推荐图文

5G与AI：现在和未来的互补技术

支持云审计的关键操作_弹性云服务器 ECS_用户指南_

2021年，每个数据科学家都应该阅读的5本书

应用场景_云手机 CPH_产品介绍

云计算专家如何弥补网络安全技能差距

英文域名怎么实名认证

随机推荐

Java和大数据应该如何选？选对让你薪资翻

[leetcode/lintcode 题解] 阿里算法面试

北京慧达天下使用OOS提高发布效率

基于Kafka+Flink平台化设计，实时数仓还

2021研发效能实践案例征集大赛

Windows云服务器登录方式概述_云耀云服务

功夫贷获凯泰资本4000万融资！官网启用“

hk域名哪里注册

[Snowflake核心技术解读系列三]云原生技

高德打车通用可编排订单状态机引擎设计

关于我们