|
正则表达式在 PHP 中的应用
在 PHP 应用中,正则表达式重要用于:
正则立室:凭据正则表达式立室相应的内容
正则更换:凭据正则表达式立室内容并更换
正则支解:凭据正则表达式支解字符串
在 PHP 中有两类正则表达式函数,一类是 Perl 兼容正则表达式函数,一类是 POSIX 扩展正则表达式函数。二者差异不大,并且保举利用Perl 兼容正则表达式函数,因此下文都因此 Perl 兼容正则表达式函数为例子阐明。
定界符
Perl 兼容模式的正则表达式函数,其正则表达式必要写在定界符中。任何不是字母、数字或反斜线()的字符都可以作为定界符,通常我们利用 / 作为定界符。详细利用见下面的例子。
提示
只管正则表达式功效非常壮大,但要是用平凡字符串处置处罚函数能完成的,就只管即便不要用正则表达式函数,由于正则表达式服从会低得多。关于平凡字符串处置处罚函数,请拜见《PHP 字符串处置处罚》。
preg_match()
preg_match() 函数用于举行正则表达式立室,乐成返回 1 ,不然返回 0 。
语法:
int preg_match( string pattern, string subject [, array matches ] )
参数阐明:
参数 阐明
pattern 正则表达式
subject 必要立室检索的工具
matches 可选,存储立室效果的数组, $matches[0] 将包罗与整个模式立室的文本,$matches[1] 将包罗与第一个捕捉的括号中的子模式所立室的文本,以此类推
例子 1 :- <?php
- if(preg_match("/php/i", "PHP is the web scripting language of choice.", $matches)){
- print "A match was found:". $matches[0];
- } else {
- print "A match was not found.";
- }
- ?>
复制代码 欣赏器输出:
A match was found: PHP
在该例子中,由于利用了 i 修正符,因此会不区分巨细写去文本中立室 php 。
提示
preg_match() 第一次立室乐成后就会制止立室,要是要实现全部效果的立室,即搜刮到subject末端处,则需利用 preg_match_all() 函数。
例子 2 ,从一个 URL 中取得主机域名 :- <?php
- // 从 URL 中取得主机名
- preg_match("/^(http://)?([^/]+)/i","http://www.5idev.com/index.html", $matches);
- $host = $matches[2];
- // 从主机名中取得背面两段
- preg_match("/[^./]+.[^./]+$/", $host, $matches);
- echo "域名为:{$matches[0]}";
- ?>
复制代码 欣赏器输出:
域名为:5idev.com
preg_match_all()
preg_match_all() 函数用于举行正则表达式全局立室,乐成返回整个模式立室的次数(大概为零),要是堕落返回 FALSE 。
语法:
int preg_match_all( string pattern, string subject, array matches [, int flags ] )
参数阐明:
参数 阐明
pattern 正则表达式
subject 必要立室检索的工具
matches 存储立室效果的数组
flags 可选,指定立室效果放入 matches 中的次序,可供选择的标志有:
PREG_PATTERN_ORDER:默认,对效果排序使 $matches[0] 为全部模式立室的数组,$matches[1] 为第一个括号中的子模式所立室的字符串构成的数组,以此类推
PREG_SET_ORDER:对效果排序使 $matches[0] 为第一组立室项的数组,$matches[1] 为第二组立室项的数组,以此类推
PREG_OFFSET_CAPTURE:要是设定本标志,对每个出现的立室效果也同时返回其隶属的字符串偏移量
下面的例子演示了将文本中全部 <pre></pre> 标签内的要害字(php)表现为赤色。- <?php
- $str = "<pre>学习php是一件快乐的事。</pre><pre>全部的phper必要配合高兴!</pre>";
- $kw = "php";
- preg_match_all('/<pre>([sS]*?)</pre>/',$str,$mat);
- for($i=0;$i<count($mat[0]);$i++){
- $mat[0][$i] = $mat[1][$i];
- $mat[0][$i] = str_replace($kw, '<span style="color:#ff0000">'.$kw.'</span>', $mat[0][$i]);
- $str = str_replace($mat[1][$i], $mat[0][$i], $str);
- }
- echo $str;
- ?>
复制代码 正则立室中文汉字
正则立室中文汉字凭据页面编码差别而略有区别:
GBK/GB2312编码:[x80-xff>]+ 或 [xa1-xff]+
UTF-8编码:[x{4e00}-x{9fa5}]+/u
例子:- <?php
- $str = "学习php是一件快乐的事。";
- preg_match_all("/[x80-xff]+/", $str, $match);
- //UTF-8 利用:
- //preg_match_all("/[x{4e00}-x{9fa5}]+/u", $str, $match);
- print_r($match);
- ?>
复制代码 输出:- Array
- (
- [0] => Array
- (
- [0] => 学习
- [1] => 是一件快乐的事。
- )
- )
复制代码 |
|