豆爸的手册
  • 简介
  • 计算机基础
    • 浮点数的二进制表示
  • 架构设计
    • SSO
  • 服务器
    • 开启 gzip 压缩功能
    • 使用Liunx的crontab配置定时任务
    • OpenSSL生成秘钥对
    • 什么是线程安全
    • nginx基本配置与参数说明
    • Nginx日志配置参数
    • Linux命令
      • iostat
    • CGI, FashCGI, PHP-FPM
    • nginx中rewrite模块break和last原理详解
    • OOM
    • XXE漏洞的简单理解和测试
    • Apache 配置反向代理
    • 阿里云OSS STS上传配置
  • PHP
    • Laravel框架
      • Laravel 使用Apache服务器无法获取header中Authorization
      • Laravel5.1 表单数组验证
      • Laravel5 如何验证路由中的变量
      • Laravel 清除表单字段前后空白的Middleware
      • Laravel 获取执行的SQL语句
      • Laravel 将stdClass转换成Eloquent Model
      • 实际开发中如何活用 Closure
      • IoC 容器
    • Symfony框架
    • PHPExcel支持的样式
    • 计算地球上2个经纬度之间的距离
    • 创建一个自己的 Composer/Packagist 包
    • PHP Trait
    • 关于PHP浮点数
    • PHP7.2使用openssl替换mcrypt
    • rpc是什么?php中流行的rpc框架有哪些
  • MySQL
    • MySQL事务隔离级别
    • MySQL使用可重复读作为默认隔离级别的原因
    • FIND_IN_SET vs IN
    • MySQL慢查询
    • 是否使用SQL_CALC_FOUND_ROWS
    • GROUP BY性能优化
    • MySQL分页优化
    • MySQL在2个值之间获取随机数
    • MySQL数据库
      • 建表规约
      • 索引规约
      • SQL 语句
      • ORM 映射
    • MySQL 5.6 原生Online DDL解析
    • mysql使用utf8mb4经验吐血总结
  • HTTP
    • HTTP:Content-Type
    • 从HTTP到HTTPS再到HSTS
    • 主流浏览器中如何清除HSTS设置
    • 也许,这样理解HTTPS更容易
  • JavaScript
    • 跨域资源共享 CORS 详解
  • Git
    • 撤销合并
    • 从其他分支checkout文件或文件夹
    • 批量删除分支和标签
  • 前端
    • Grid布局
    • Flex布局
    • 浅谈OSS跨域功能
  • 书摘
    • 高效程序员的45个习惯
  • OpenResty
    • 新手上路
  • 敏捷开发
    • 为什么Scrum Master不叫Scrum Manager?
  • Postman
    • 使用Newman执行collections的时候,如果上传文件
    • 同步API定义到Postman
  • RESTful API最佳实践
  • 开发工具
  • 设计模式原则
  • Charles 从入门到精通
  • 阿里云OSS STS上传配置
  • 流式分页
Powered by GitBook
On this page

Was this helpful?

  1. MySQL

是否使用SQL_CALC_FOUND_ROWS

PreviousMySQL慢查询NextGROUP BY性能优化

Last updated 5 years ago

Was this helpful?

在优化SQL查询的过程中,我们经常遇到使用SQL_CALC_FOUND_ROWS的查询。很多人都认为使用SQL_CALC_FOUND_ROWS将会比使用2条SQL(1条查询数据,1条统计总数)更快。真实情况是这样的吗?

为了测试,我们首先创建一个简单的表:

CREATE TABLE `count_test` (
  `a` int(10) NOT NULL auto_increment,
  `b` int(10) NOT NULL,
  `c` int(10) NOT NULL,
  `d` varchar(32) NOT NULL,
  PRIMARY KEY  (`a`),
  KEY `bc` (`b`,`c`)
) ENGINE=MyISAM

并且插入测试数据:

mysql_connect("127.0.0.1", "root");
mysql_select_db("test");
for ($i = 0; $i < 10000000; $i++) {
    $b = $i % 1000;
    mysql_query("INSERT INTO count_test SET b=$b, c=ROUND(RAND()*10), d=MD5($i)");
}

首先,我们在WHERE子句中使用索引列B进行查询:

mysql> SELECT SQL_NO_CACHE SQL_CALC_FOUND_ROWS * FROM count_test WHERE b = 555 ORDER BY c LIMIT 5;

使用SQL_CALC_FOUND_ROWS的结果是:如果没有缓冲,每个不同的b值将花费20-100秒,有缓存的话将花费2-5秒。这种差异可以通过查询所需的I/O来解释:MySQL将忽略LIMIT,而扫描所有10K的行。

我们来测试下分为2条SQL查询的结果:

mysql> SELECT SQL_NO_CACHE count(*) FROM count_test WHERE b = 666;

结果是:第一次运行为0.01-0.11秒,后面均为0.00-0.02秒。

现在,我们来看看COUNT需要花多久:

mysql> SELECT SQL_NO_CACHE count(*) FROM count_test WHERE b = 666;

结果是:0.00-0.04秒

我们可以看到,使用SELECT+COUNT(0.00-0.15秒)的执行时间远远小于比使用SQL_CALC_FOUND_ROWS(2-100秒)的执行时间。我们来看看EXPLAIN:

mysql> explain SELECT SQL_CALC_FOUND_ROWS * FROM count_test WHERE b = 999 ORDER BY c LIMIT 5;
+----+-------------+------------+------+---------------+------+---------+-------+-------+-------------+
| id | select_type | table      | type | possible_keys | key  | key_len | ref   | rows  | Extra       |
+----+-------------+------------+------+---------------+------+---------+-------+-------+-------------+
|  1 | SIMPLE      | count_test | ref  | bc            | bc   | 4       | const | 75327 | Using where |
+----+-------------+------------+------+---------------+------+---------+-------+-------+-------------+
1 row in set (0.00 sec)
mysql> explain SELECT SQL_NO_CACHE count(*) FROM count_test WHERE b = 666;
+----+-------------+------------+------+---------------+------+---------+-------+------+-------------+
| id | select_type | table      | type | possible_keys | key  | key_len | ref   | rows | Extra       |
+----+-------------+------------+------+---------------+------+---------+-------+------+-------------+
|  1 | SIMPLE      | count_test | ref  | bc            | bc   | 4       | const | 5479 | Using index |
+----+-------------+------------+------+---------------+------+---------+-------+------+-------------+
1 row in set (0.00 sec)

原因是:当计算结果的行数时,MySQL扫描了所有的结果,即使我们不需要(忽略LIMIT)。使用count(*)因为有索引,所以更快。

我们测试b有索引和没有索引(全表扫描)的情况,结果如下:

Full-scan:

使用SQL_CALC_FOUND_ROWS:7秒

使用2条SQL:7秒 + 7秒

Filesort:

使用SQL_CALC_FOUND_ROWS:1.8秒

使用2条SQL:1.8+0.05秒

结论就是:当查询语句的WHERE/ORDER子句有合适索引的时候,使用2条分开的SQL比使用SQL_CALC_FOUND_ROWS会快很多。

https://www.percona.com/blog/2007/08/28/to-sql_calc_found_rows-or-not-to-sql_calc_found_rows/
https://bugs.mysql.com/bug.php?id=18454