MySQL REGEXP:基于正则表达式的搜索

时间:2019-11-20 08:52:31  来源:igfitidea点击:

简介:在本教程中,您将学习如何使用MySQL REGEXP运算符基于正则表达式执行复杂的搜索。

正则表达式简介

正则表达式是描述搜索模式的特殊字符串。
它是一个功能强大的工具,可为您提供一种简洁灵活的方式,可以根据模式识别文本字符串,例如字符和单词。

例如,您可以使用正则表达式来搜索电子邮件,IP地址,电话号码,社会保险号或具有特定模式的任何内容。

正则表达式使用其自己的语法,可由正则表达式处理器解释。
正则表达式在从编程语言到数据库(包括MySQL)的几乎所有平台中广泛使用。

使用正则表达式的优点是,您不限于在LIKE运算符中基于带有百分号(%)和下划线(_)的固定模式来搜索字符串。
正则表达式具有更多的元字符来构造灵活的模式。

使用正则表达式的缺点是很难理解和维护这种复杂的模式。
因此,您应该在SQL语句的注释中描述正则表达式的含义。
此外,在某些情况下,如果在正则表达式中使用复杂的模式,则数据检索的速度会降低。

正则表达式的缩写是regex或regexp。

MySQL REGEXP运算符

MySQL改编了Henry Spencer实现的正则表达式。
MySQL允许您使用REGEXP运算符在SQL语句中匹配模式。

以下说明了WHERE子句中REGEXP运算符的语法:

SELECT 
    column_list
FROM
    table_name
WHERE
    string_column REGEXP pattern;

该语句执行string_column与模式的模式匹配。

如果string_column中的值与模式匹配,则WHERE子句中的表达式返回true,否则返回false。

如果string_column或pattern为NULL,则结果为NULL。

除了REGEXP运算符之外,您还可以使用RLIKE运算符,它是REGEXP运算符的同义词。

REGEXP运算符的取反形式不是REGEXP。

MySQL REGEXP示例

假设您要查找所有姓氏以字符A,B或C开头的产品。
您可以在以下SELECT语句中使用正则表达式:

SELECT 
    productname
FROM
    products
WHERE
    productname REGEXP '^(A|B|C)'
ORDER BY productname;

该模式使您可以找到名称以A,B或C开头的产品。

  • 字符^表示从字符串开头开始匹配。

  • 人物|表示如果不匹配则搜索替代项。

下表以正则表达式说明了一些常用的元字符和构造。

MetacharacterBehavior
^matches the position at the beginning of the searched string
$matches the position at the end of the searched string
.matches any single character
[…]matches any character specified inside the square brackets
[^…]matches any character not specified inside the square brackets
p1p2
*matches the preceding character zero or more times
+matches preceding character one or more times
{n}matches n number of instances of the preceding character
{m,n}matches from m to n number of instances of the preceding character

要查找名称以字符a开头的产品,请使用元字符'^'匹配名称的开头:

SELECT 
    productname
FROM
    products
WHERE
    productname REGEXP '^a';

如果希望REGEXP运算符以区分大小写的方式比较字符串,则可以使用BINARY运算符将字符串转换为二进制字符串。

因为MySQL逐字节而不是逐个字符地比较二进制字符串。
这样可以使字符串比较区分大小写。

例如,以下语句仅在产品名称的开头匹配大写字母" C"。

SELECT 
    productname
FROM
    products
WHERE
    productname REGEXP BINARY '^C';

要查找名称以f结尾的产品,请使用'f $'匹配字符串的末尾。

SELECT 
    productname
FROM
    products
WHERE
    productname REGEXP 'f$'

要查找名称包含单词" ford"的产品,请使用以下查询:

SELECT 
    productname
FROM
    products
WHERE
    productname REGEXP 'ford';

要查找名称恰好包含10个字符的产品,请使用" ^"和" $"来匹配产品名称的开头和结尾,然后对任意字符"。
"重复{10}次。
介于两者之间,如以下查询所示:

SELECT 
    productname
FROM
    products
WHERE
    productname REGEXP '^.{10}$';

在本教程中,您学习了如何使用带有正则表达式的MySQL REGEXP运算符查询数据。