正则表达式不包含某个字符串教程详解

发布时间:2020-09-13编辑:脚本学堂
本文介绍了正则表达式不包含某个字符串的用法,如何匹配一个不包含某个子串的子符串?需要的朋友参考下。

在使用正则表达式时,有时需要匹配一个不包含某个子串的子符串。
比如要从“eabcdfgh”得到"cd"之前的子串。
可能会写:
([^cd]*)
这种写法是彻底错误的,因为[]中的是集合,[^cd]表示不等于c或者d,而不是cd。

以下程序中没有cd,但eab还是被匹配出来了。
 

String s = "([^cd]*)";
Match m = Regex.Match("eabcfgh", s);
MessageBox.Show(m.Value);//eab
MessageBox.Show(m.Groups[1].Value);//eab
 

上面这种写法是错的比较离谱的,正常青年一般都可以避免这种错误。
在特殊情况下,正则表达式可以这么写,而且效率是比较高的。
([/s/S]*cd)
先说明下/s/S是表示匹配任何字符。所谓特殊情况,这个字符串中必有cd的存在。
假如,要求是匹配不包含cd的部分(为了描述方便,只匹配cd之前的部分),当cd不存在时,应该把整个字符串都取出来。
 

String s = "((.(?!cd))*.)";
//String s = "([/s/S]*cd)";
Match m = Regex.Match("eabcdfgh", s);
MessageBox.Show(m.Value);//eab
MessageBox.Show(m.Groups[1].Value);//eab
 

这种写法终于符合要求了。

不过值得一提的是,相较前一种而言,它的效率比较低。

相关的语法:
 

(?:子表达式)         定义非捕获组。
//定义非捕获组
String s = "e(?:ab)(.*)";
Match m = Regex.Match("eabcd", s);
MessageBox.Show(m.Value);//eabcd
MessageBox.Show(m.Groups[1].Value);//cd
ab是被匹配的,但是它所在的组没有被捕获,Group[1]是cd
(?=子表达式)       零宽度正预测先行断言。
//零宽度正预测先行断言
//String s = "b(cd|de)(.*)";
String s = "b(?=cd|de)(.*)";
Match m = Regex.Match("eabcdfg", s);
MessageBox.Show(m.Value);
MessageBox.Show(m.Groups[1].Value);//区别 cd  cdfg
 

这种写法和注释掉的写法是有区别的,区别就是“零宽度”,这种写法会被捕获,也就是不占一个Group。
(?!子表达式)       零宽度负预测先行断言。
!表示非,就是不包含,同样是零宽度,不会被捕获。
 
(?<=子表达式)    零宽度正回顾后发断言。

例子:
 

(?<=19)d{2}b
“1851 1999 1950 1905 2003”中的“99”、“50”和“05”
(?<!子表达式)     零宽度负回顾后发断言。

例子:
 

(?<!19)d{2}b
“1851 1999 1950 1905 2003”中的“51”和“03”
 

参考文章: http://msdn.microsoft.com/zh-cn/library/az24scfc.aspx