使用mysql正则表达式

发布时间:2020-07-03编辑:脚本学堂
mysql用where子句对正则表达式提供了初步的支持,允许你指定用正则表达式过滤SELECT检索出的数据。

正则表达式作用是匹配方本,将一个模式(正则表达式)与一个文本串进行比较。
mysql用where子句对正则表达式提供了初步的支持,允许你指定用正则表达式过滤SELECT检索出的数据。
mysql仅支持多数正则表达式实现的一个很小的子集。

基本字符匹配

REGEXP后所跟的东西作为正则表达式处理。
    SELECT prod_name FROM products where prod_name REGEXP '1000'ORDER BY prod_name;
    ------返回------
    +------------------------
    +|    prod_name    |
    +------------------------
    +|  JetPack 1000  |
    +------------------------+

表示匹配任意一个字符。

    SELECT prod_name FROM products where prod_name REGEXP '.000'ORDER BY prod_name;
    ------------返回-----------
    +-------------------------+
    | prod_name |
    +-------------------------+
    | JetPack 1000 |
    | JetPack 2000 |
     +-------------------------+

mysql中的正则表达式匹配不区分大小写。
为区分大小写,可使用BINARY关键字。
如:where prod_name REGEXP BINARY 'JetPack .000'

进行OR匹配

为搜索两个串之一(或者这个串,或者为另一个串),使用 | 。

| 作为OR操作符,表示匹配其中之一。可给出两个以上的OR条件。

    SELECT prod_nameFROM productswhere prod_name REGEXP '1000 | 2000'ORDER BY prod_name;
    ------------返回------------
    +----------------------+
    | prod_name |
    +----------------------+
    | JetPack 1000 |
    | JetPack 2000 |
    +----------------------+

[ ] 匹配任何单一字符。

[123]定义一组字符,意思是匹配1或2或3.

[ ]是另外一种形式的OR语句,[123] Ton  就是  [1 | 2 | 3] Ton 的缩写。

^ 否定一个字符集合,将匹配除指定字符外的任何东西。[^123]将匹配除这些字符外的任何东西。

    SELECT prod_nameFROM productswhere prod_name REGEXP '[123] Ton'ORDER BY prod_name;
    -------------返回------------
    +--------------------+
    | prod_name |
    +--------------------+
    | 1 ton anvil |
    | 2 ton anvil |
    +--------------------+

匹配范围

[0123456789] 或 [0-9] 将匹配数字0到9

[a-z] 匹配任意字母符号

    SELECT prod_nameFROM productswhere prod_name REGEXP '[1-5] Ton'ORDER BY prod_name;
    ----------返回-----------
    +-------------------+
    | prod_name |
    +-------------------+
    | .5 ton anvil |
    | 1 ton anvil |
    | 2 ton anvil |
    +-------------------+

匹配特殊字符

  为前导。即转义.正则表达式内具有特殊意义的所有字符都必须以这种方式转义。
-  表示查找 -
.  表示查找 .

    SELECT prod_nameFROM vendorswhere vend_name REGEXP '.'ORDER BY vend_name;
    -------------返回-------------
    +----------------------+
    | vend_name |
    +----------------------+
    | Furball Inc. |
    +----------------------+

  也用来引用元字符(具有特殊意义的字符)

    f 换页
    n 换行
    r 回车
    t 制表
    v 纵向制表

匹配字符类

    [:a;num:] 任意字母和数字(同 [a-zA-Z0-9])
    [:alpha:] 任意字符(同 [a-zA-Z])
    [:blank:] 空格和制表(同 [t])
    [:cntrl:] ASCII控制字符(ASCII 0到31和127)
    [:digit:] 任意数字(同[0-9])
    [:graph:] 与["print:] 相同,但不包括空格
    [:lower:] 任意小写字线(同 [a-z])
    [:print:] 任意可打印字符
    [:punct:] 既不在 [:alnum:] 又不在 [:cntrl:] 中的任意字符
    [space:] 包括空格在内的任意空白字符(同 [fntrv])
    [:upper:] 任意大小字母(同 [A-Z])
    [:xdigit:] 任意十六进制数字(同 [a-fA-F0-9])

匹配多个实例

    元字符 说明
    * 0个或多个匹配
    + 1个或多个匹配(等于 {1, })
    ? 0个或1个匹配(等于 {0, 1})
    {n} 指定数目的匹配
    {n, } 不少于指定数目的匹配
    {n ,m} 匹配数目的范围(m不超过255)

以下例子:s后的?使s可选,因为?匹配它前面的任何字符的0次或1次出现。

    SELECT prod_name
    FROM products
    where prod_name REGEXP '([0-9] sticks?)'
    ORDER BY prod_name;

    ------------返回------------

    +-----------------------+
    | prod_name |
    +-----------------------+
    | TNT (1 stick) |
    | TNT (5 sticks) |
    +-----------------------+

匹配连在一直的4位数字:where prod_name REGEXP '[[:digit:]]{4}'

定位符

    ^ 文本的开始
    $ 文本的末尾
    [[:<:]] 词的开始
    [[:>:]] 词的结尾

    SELECT prod_name
    FROM products
    where prod_name REGEXP '^[0-9.]'
    ORDER BY prod_name;

    -----------返回----------

    +---------------------+
    | prod_name |
    +---------------------+
    | .5 ton anvil |
    | 1 ton anvil |
    | 2 ton anvil |
    +---------------------+
^的双重用途:在集合中(用[ ]定义),用它来否定该集合。否则,用来指串的开始和。

LIKE 匹配整个串,而REGEXP匹配子串。

简单的正则表达式测试  可以在不使用数据库的情况下用SELECT来测试正则表达式。

REGEXP检查总是返回0(没有匹配)或1(匹配),可以用带文字串的REGEXP来测试表达式,并试验它们。相应的语法如下:
SELECT 'hello' REGEXP '[0-9]'
返回0(因为文本hello中没有数字)。