MySQL REGEXP 子句正则表达式查询
前面章节中我们已经了解到 MySQL
可以通过 LIKE ...%
子句来进行模糊匹配,但这都只是简单的模糊查询,也是速度最快的模糊查询
除此之外,MySQL
同样也支持其它正则表达式的匹配
MySQL
通过使用 REGEXP
操作符来进行正则表达式匹配
如果你了解过其它语言的正则表达式,比如 PHP
或 Perl
等,那么你会对 MySQL
的正则表达式元字符非常熟悉,因为它们都类似
MySQL
REGEXP
操作符支持以下几种元子符
元字符 | 描述 |
---|---|
^ | 匹配输入字符串的开始位置 如果设置了 Multiline 属性,^ 也匹配 '\n' 或 '\r' 之后的位置 |
$ | 匹配输入字符串的结束位置 如果设置了 Multiline 属性,$ 也匹配 '\n' 或 '\r' 之前的位置 |
. | 匹配除 "\n" 之外的任何单个字符 如果要匹配包括 '\n' 在内的任何字符,请使用象 '[.\n]' 的模式 |
[...] | 字符集合。匹配所包含的任意一个字符 例如, '[abc]' 可以匹配 "plain" 中的 'a' |
[^...] | 负值字符集合。匹配未包含的任意字符 例如, '[^abc]' 可以匹配 "plain" 中的'p' |
p1|p2|p3 | 匹配 p1 或 p2 或 p3 例如,'z|food' 匹配 "z" 或 "food"。'(z|f)ood' 则匹配 "zood" 或 "food" |
* | 匹配前面的子表达式零次或多次 例如,zo 能匹配 "z" 以及 "zoo"。 等价于{0,}。 |
+ | 匹配前面的子表达式一次或多次 例如,'zo+' 能匹配 "zo" 以及 "zoo",但不能匹配 "z"。+ 等价于 |
{n} | n 是一个非负整数。匹配确定的 n 次 例如,'o{2}' 不能匹配 "Bob" 中的 'o',但是能匹配 "food" 中的两个 o |
{n,m} | m 和 n 均为非负整数,其中n <= m。最少匹配 n 次且最多匹配 m 次 |
在 MySQL
中正则表达式用的不多,但也有那么几个时刻还是很有用处的
下面我们就拿几个伪需求来看看如何使用
说是伪需求,是因为除了全文检索,其实都可以用 LIKE 语句代替
测试数据
首先运行下面的 SQL 语句准备测试数据
DROP TABLE IF EXISTS `tbl_language`; CREATE TABLE IF NOT EXISTS `tbl_language`( `id` INT UNSIGNED AUTO_INCREMENT, `name` VARCHAR(64) NOT NULL, `url` VARCHAR(128) NOT NULL, `founded_at` DATE, PRIMARY KEY ( `id` ) )ENGINE=InnoDB DEFAULT CHARSET=utf8mb4; INSERT INTO `tbl_language` VALUES (1,'Python','https://www.twle.cn','1991-2-20'), (2,'PHP','http://www.php.net','1994-1-1'), (3,'Ruby','https://www.ruby-lang.org/','1996-12-25'), (4,'Kotlin','http://kotlinlang.org/','2016-02-17'); INSERT INTO `tbl_language` (name,url) VALUES ('Perl','http://www.perl.org/'), ('Scala','http://www.scala-lang.org/');
使用 SELECT * FROM tbl_language
显示数据如下
+----+--------+----------------------------+------------+ | id | name | url | founded_at | +----+--------+----------------------------+------------+ | 1 | Python | https://www.twle.cn | 1991-02-20 | | 2 | PHP | http://www.php.net | 1994-01-01 | | 3 | Ruby | https://www.ruby-lang.org/ | 1996-12-25 | | 4 | Kotlin | http://kotlinlang.org/ | 2016-02-17 | | 5 | Perl | http://www.perl.org/ | NULL | | 6 | Scala | http://www.scala-lang.org/ | NULL | +----+--------+----------------------------+------------+
范例
-
查找
name
字段中以Py
为开头的所有name
SELECT name FROM tbl_language WHERE name REGEXP '^Py';
运行结果如下
+--------+ | name | +--------+ | Python | +--------+
-
查找
url
字段中以org/
结尾的所有name
SELECT name FROM tbl_language WHERE url REGEXP 'org/$';
运行结果如下
+--------+ | name | +--------+ | Ruby | | Kotlin | | Perl | | Scala | +--------+
-
查找
url
字段中包含lang
字符串的所有name
SELECT name FROM tbl_language WHERE url REGEXP 'lang';
运行结果如下
+--------+ | name | +--------+ | Ruby | | Kotlin | | Scala | +--------+
-
来一个复杂的,查找
url
字段中包含-lan
且以rg/
结尾的所有name
SELECT name FROM tbl_language WHERE url REGEXP '-lan.*rg/$';
运行结果如下
+-------+ | name | +-------+ | Ruby | | Scala | +-------+