最通俗易懂的php正则表达式教程(上)

   2016-10-17 0
核心提示:基础知识 字符集 POSIX 扩展正则表达式函数Perl 兼容正则表达式函数从邮件验证说起邮件的格式:tenssun@163.com其中tenssun是用户名,163.com是服务器名用户名只能由英文字母a~z(不区分大小写)、数字0~9、下划线组成。用户名的起始字符必须是英文字母.如:net

最通俗易懂的php正则表达式教程(上)

基础知识

  • 字符集
  • POSIX 扩展正则表达式函数
  • Perl 兼容正则表达式函数

从邮件验证说起

邮件的格式:

tenssun@163.com

其中tenssun是用户名,163.com是服务器名

用户名只能由英文字母a~z(不区分大小写)、数字0~9、下划线组成。

用户名的起始字符必须是英文字母.如:netease_2005

用户名长度为5~20个字符。

服务器名只能由英文字母a~z(不区分大小写)、数字0~9、下划线及点组成,@后点前面长度限制为1-10个字符,点后面的限制为com,cn,com.cn,net。

示例:

<?php
	$email='wjj7r8y6@jj.net';
	if(ereg ("^[a-zA-Z][0-9a-zA-Z_]{4,19}@[0-9a-zA-Z_]{1,10}(\.)(com|cn|com.cn|net)$",$email)) {
		echo 'email格式正确';
	}
?>
^  和  $

看到前面的邮件验证大部分人可能会感到头痛,别急下面我们慢慢分解。

还是得说说 ^  和  $  他们是分别用来匹配字符串的开始和结束,下面法举例说明:

"^The": 开头一定要有"The"字符串;

"of despair$":  结尾一定要有"of despair" 的字符串; 那么,

"^abc$": 就是要求以abc开头和以abc结尾的字符串,实际上是只有abc匹配

"notice": 匹配包含notice的字符串 你可以看见如果你没有用我们提到的两个字符(最后一个例子),就是说 模式(正则表达式) 可以出现在被检验字符串的任何地方,你没有把他锁定到两边 (开始或结束)

'*', '+',和 '?',

接着,说说 '*', '+',和 '?', 他们用来表示一个字符可以出现的次数或者顺序. 他们分别表示:

* 表示出现0次或1次或多次 相当于{0,},

+ 表示出现1次或多次  相当于{1,},

? 表示出现0次或1次 相当于{0,1},  这里是一些例子:

  • "ab*":  和ab{0,}同义,匹配以a开头,后面可以接0个或者N个b组成的字符串("a", "ab", "abbb", 等);
  • "ab+": 和ab{1,}同义,同上条一样,但最少要有一个b存在 ("ab", "abbb", 等.);
  • "ab?":和ab{0,1}同义,可以没有或者只有一个b;
  • "a?b+$": 匹配以一个或者0个a再加上一个以上的b结尾的字符串.

要点:'*', '+',和 '?'只管它前面那个字符.

{ }

你也可以在大括号里面限制字符出现的个数,比如

  • "ah{2}": 要求a后面一定要跟两个h(一个也不能少)("ahh");
  • "ah{2,}": 要求a后面一定要有两个或者两个以上h(如"ahh", "ahhhh", 等.);
  • "ah{3,5}": 要求a后面可以有3-5个h("ahhh", "ahhhh", or "ahhhhh").

() {}

现在我们把一定要的几个字符放到小括号里,比如:

  • “a(bc)*”: 匹配 a 后面跟0个或者多个"bc";
  • "a(bc){1,5}": 一个到5个 "bc."

'│'

还有一个字符 '│', 相当于OR(或者) 操作:

  • "hi│hello": 匹配含有"hi" 或者 "hello" 的 字符串;
  • "(b│cd)ef": 匹配含有 "bef" 或者 "cdef"的字符串;
  • "(a│b)*c": 匹配含有这样多个(包括0个)a或b,后面跟一个c 的字符串;

'.'

一个点('.')可以代表所有的单一字符,不包括"\n"

如果,要匹配包括"\n"在内的所有单个字符,怎么办?

用'[\n.]'这种模式.

"a.[0-9]": 一个a加一个字符再加一个0到9的数字

".{3}$": 三个任意字符结尾 .

[ ]

中括号括住的内容只匹配一个单一的字符

"[ab]": 匹配单个的 a 或者 b ( 和 "a│b" 一样);

"[a-d]": 匹配'a' 到'd'的单个字符 (和"a│b│c│d" 还有 "[abcd]"效果一样); 一般我们都用[a-zA-Z]来指定字符为一个大小写英文

"^[a-zA-Z]": 匹配以大小写字母开头的字符串

"[0-9]%": 匹配含有 形如 x% 的字符串

",[a-zA-Z0-9]$": 匹配以逗号再加一个数字或字母结尾的字符串

^[]和[^ ]的区别

你也可以把你不想要得字符列在中括号里,你只需要在总括号里面使用'^' 作为开头 "%[^a-zA-Z]%" 匹配含有两个百分号里面有一个非字母的字符串.

要点:^用在中括号开头的时候,就表示排除括号里的字符

不要忘记在中括号里面的字符是这条规路的例外—在中括号里面, 所有的特殊字符,包括(''), 都将失去他们的特殊性质 "[*\+?{}.]"匹配含有这些字符的字符串.

{ }  \b

看了上面的例子,你对{n,m}应该理解了吧.要注意的是,n和m都不能为负整数,而且n总是小于m. 这样,才能 最少匹配n次且最多匹配m次. 如"p{1,5}"将匹配 "pvpppppp"中的前五个p

下面说说以\开头的

\b 书上说他是用来匹配一个单词边界,就是...比如've\b',可以匹配love里的ve而不匹配very里有ve

\B 正好和上面的\b相反.例子我就不举了

应用一

好,说了这么多下面我们再回过头来看我们的邮件正则怎么构造的:

用户名的正则表达式

^[a-zA-Z][0-9a-zA-Z_]{4,19}

a-z表示a到z的所有小写字母,A-Z表示A到Z的所有大写字母,但是[ ]只能取一个字符,所以[a-zA-Z]只能取其中一个符,也就是从所有的大小写英文字母中只能取一个字母,^放在[]外面表示开始, 所以^[a-zA-Z]表示以一个英文字母开头。

应用二

[0-9a-zA-Z_]表示从所有的阿拉伯数字和英文及_中取一个字符,而{4,19}表示匹配最少4次,最多9次显然

[0-9a-zA-Z_]{4,19}表示前面的字符至少出现4次,最多出现19次.

那么现在请问下面这个表达式所表达的意思

^[a-zA-Z][0-9a-zA-Z_]{4,19}

(\.)表示一个点别和'.'混淆了'.'是表示除\n的任意一个字符()表示这是个子母式

(com|cn|com.cn|net)$

表示以com或cn或com.cn或net结尾的一串字符

 
标签: 正则表达式 PHP
反对 0举报 0 评论 0
 

免责声明:本文仅代表作者个人观点,与乐学笔记(本网)无关。其原创性以及文中陈述文字和内容未经本站证实,对本文以及其中全部或者部分内容、文字的真实性、完整性、及时性本站不作任何保证或承诺,请读者仅作参考,并请自行核实相关内容。
    本网站有部分内容均转载自其它媒体,转载目的在于传递更多信息,并不代表本网赞同其观点和对其真实性负责,若因作品内容、知识产权、版权和其他问题,请及时提供相关证明等材料并与我们留言联系,本网站将在规定时间内给予删除等相关处理.

  • VB中的正则表达式 vb 正则表达式
    RegExp对象提供简单的正则表达式支持功能。  RegExp对象的用法:Function RegExpTest(patrn, strng)Dim regEx, Match, Matches ' 建立变量。Set regEx = New RegExp ' 建立正则表达式。regEx.Pattern = patrn ' 设置模式。regEx.IgnoreCase = True ' 设置是
    02-09
  • [perl] 正则表达式实现多模式匹配
    普通青年    3   文艺青年    3   二逼青年    8普通男友    5   文艺男友    2   二逼男友    9090  1 use strict;  2 use warnings;  3 my %hash = ();  4 my $line = "";  5 open FIN, "$ARGV[0]" or die "cannot open in
    02-09
  • Perl 正则表达式语法
    1. 概要Perl正则表达式是Boost.regex 默认行为,也可以将perl传入basic_regex 构造。boost::regex  e1(my_expression);boost::regex  e2(my_expression,  boost::regex::perl  |  boost::regex::icase);2. 特殊字符. [ { ( ) \ * + ? | ^ $3. 通配符 ‘
    02-09
  • Perl中的正则表达式(五) Perl正则
    正则表达式(Regular Expression),在Perl里边通常也叫做模式(Pattern),用来表示匹配(或不匹配)某个字符串的特征模板。 使用简单模式:若模式匹配的对象是$_的内容,只要把模式写在一对斜线(/)中就可以了。         $_ = "yabba dabba doo";
    02-09
  • 20-Perl 正则表达式
    1.Perl 正则表达式正则表达式(regular expression)描述了一种字符串匹配的模式,可以用来检查一个串是否含有某种子串、将匹配的子串做替换或者从某个串中取出符合某个条件的子串等。Perl语言的正则表达式功能非常强大,基本上是常用语言中最强大的,很多语言
    02-09
  • 在perl正则表达式中使用变量
    在变量两端应该加上\Q和\E进行消元,如下:$b=~/\Q$a\E/避免变量中存在的元字符产生影响
    02-09
  • matlab 正则表达式
    Replace text using regular expressioncollapse all in pageSyntaxnewStr = regexprep(str,expression,replace)examplenewStr = regexprep(str,expression,replace,option1,...optionM)exampleDescriptionexamplenewStr = regexprep(str,expression,replace
    02-09
  • R语言中的正则表达式(转载:http://blog.csdn.
    转载:http://blog.csdn.net/duqi_yc/article/details/9817243目录Table of Contents1 正则表达式简介2 字符数统计和字符翻译2.1 nchar和length2.2 tolower,toupper和chartr3 字符串连接3.1 paste函数4 字符串拆分4.1 strsplit函数5 字符串查询:5.1 grep和g
    02-09
  • R语言-正则表达式 r语言正则表达式提取位于中间
    R语言中正则表达式内容概览  有时候我们要处理的是非结构化的数据,例如网页或是电邮资料,那么就需要用R来抓取所需的字符串,整理为进一步处理的数据形式。R语言中有一整套可以用来处理字符的函数,在之前的 博文 中已经有所涉及。但真正的要用好字符处理
    02-09
  • 一步一步学Ruby(九):Ruby正则表达式(上)
    一步一步学Ruby(九):Ruby正则表达式(上)
    先推荐一个在线的Ruby正则表达式编辑器http://www.rubular.com/ Ruby的正则表达式以"//"作为构造方法。表达式返回一个RegExp的对象。  一般规则:   /a/匹配字符a。      /\?/匹配特殊字符?。特殊字符包括^, $, ? , ., /, \, [, ], {, }, (, ), +, *. 
    02-09
点击排行