利用索引提升Mysql大数据分页查询性能！

2023-12-31 03:04:55

~~~

前言

之前有看过到 Mysql 在大数据量情况下性能会很差，但是没有探究过它的原因，今天讲一讲 Mysql 大数据量下偏移量很大，性能很差的问题，并附上解决方式。

原因

将原因前我们先做一个试验，我做试验使用的表结构如下：

CREATE TABLE `test_table` (
  `id` bigint(20) NOT NULL AUTO_INCREMENT,
  `name` varchar(255) DEFAULT NULL,
  `age` int(11) DEFAULT NULL,
  PRIMARY KEY (`id`)
) ENGINE=InnoDB AUTO_INCREMENT=2000001 DEFAULT CHARSET=utf8;

表中有 200 万行数据，数据量相对较大。

试验一

首先我们对表中的所有数据进行一次全表扫描：

SELECT * FROM test_table;

这次查询执行了 2.17 秒。

试验二

然后我们对表中的数据进行分页查询，每页显示 1000 行数据：

SELECT * FROM test_table LIMIT 1000, 1000;

这次查询执行了 1.99 秒。

试验三

最后我们对表中的数据进行分页查询，每页显示 100 万行数据：

SELECT * FROM test_table LIMIT 1000000, 1000000;

这次查询执行了 10.12 秒。

从上面的试验中我们可以看出，随着分页查询的偏移量增大，查询性能会急剧下降。这是因为 Mysql 在执行分页查询时，需要先扫描完偏移量之前的所有数据，然后再从偏移量开始返回指定数量的数据。当偏移量很大的时候，Mysql 需要扫描的数据量就会非常大，从而导致查询性能下降。

解决方案

索引

索引是提高 Mysql 查询性能的利器，它可以通过减少需要扫描的数据量来提高查询速度。在进行分页查询时，我们可以通过在查询条件中添加索引列，来让 Mysql 使用索引来查找数据。这样，Mysql 就只需要扫描索引列中的数据，而不是扫描整个表中的数据。

以下是在 test_table 表中添加索引的示例：

CREATE INDEX idx_name ON test_table(name);

优化器提示

在某些情况下，Mysql 优化器可能无法自动选择合适的索引来执行查询。在这种情况下，我们可以通过在查询中使用优化器提示来强制 Mysql 使用指定的索引。

以下是在分页查询中使用优化器提示的示例：

SELECT * FROM test_table USE INDEX(idx_name) LIMIT 1000000, 1000000;

分区表

分区表是一种将数据水平分割成多个子表的技术。通过使用分区表，我们可以将数据分散到多个物理存储设备上，从而提高查询性能。在进行分页查询时，我们可以通过将数据分区到不同的物理存储设备上，来减少需要扫描的数据量。

以下是在 Mysql 中创建分区表的示例：

CREATE TABLE test_table (
  id bigint(20) NOT NULL AUTO_INCREMENT,
  name varchar(255) DEFAULT NULL,
  age int(11) DEFAULT NULL,
  PRIMARY KEY (id)
) ENGINE=InnoDB
PARTITION BY RANGE (id) (
  PARTITION p0 VALUES LESS THAN (1000000),
  PARTITION p1 VALUES LESS THAN (2000000)
);

查询缓存

查询缓存是一种将查询结果存储在内存中的技术，以便后续相同的查询可以直接从内存中读取。通过使用查询缓存，我们可以减少需要执行的查询次数，从而提高查询性能。

以下是在 Mysql 中启用查询缓存的示例：

SET GLOBAL query_cache_size = 100000000;
SET GLOBAL query_cache_type = 1;

结论

在进行 Mysql 大数据量分页查询时，偏移量过大往往会导致查询性能低下，严重影响用户体验。本文详细解析了导致这一问题的根源，并提供了切实有效的解决方案，包括使用索引、优化器提示、分区表和查询缓存。希望这些解决方案能够帮助您轻松提升 Mysql 分页查询性能。

Kyle

探索Web开发资源和人工智能教程的代码社区

联系我

扫码关注微信公众号

利用索引提升Mysql大数据分页查询性能！

Kyle

走进Redis数据结构之SDS简单动态字符串，揭开优化之道

畅游网络世界：揭秘计算机网络的166个核心概念

Koa2 + Vue: JWT 鉴权之路，轻松玩转跨域安全

Elasticsearch 分词器过滤器的无限潜力

自己写maven脚手架，轻松生成代码结构项目