怎么让MySQL性能优化？我们来聊聊（从以下四个维度考虑 ...

赵亚东 · 发表于 2023-4-28 10:42:40

MySQL性能优化

MySQL性能优化我们可以从以下四个维度考虑：硬件升级、系统配置、表结构设计、SQL语句和索引。

从成本上来说：硬件升级>系统配置>表结构设计>SQL语句及索引，然而效果却是由低到高。所以我们在优化的时候还是尽量从SQL语句和索引开始入手。
硬件升级

硬件升级这里不在过多赘述，升级更好配置的机器、机械硬盘更换为SSD等等。
系统配置优化

调整buffer_pool

通过调整buffer_pool使数据尽量从内存中读取，最大限度的降低磁盘操作，这样可以提升性能。查看buffer_pool数据的方法：
SHOW GLOBAL STATUS LIKE &#39;innodb_buffer_pool_page_%&#39;

可以看出总页数8192，空闲页数1024。
//查看buffer_pool大小
SELECT @@innodb_buffer_pool_size/1024/1024

innodb_buffer_pool_size默认为128M，理论上可以扩大到内存的3/4或4/5。我们修改mysql配置文件my.cnf,增加如下配置：
innodb_buffer_pool_size = 750M然后重启MySQL。
2. 数据预热
默认情况下，某条数据被读取过一次才会被缓存在innodb_buffer_pool里。所以数据库刚刚启动，可以进行一次数据预热，将磁盘上的数据缓存到内存中去。
预热脚本：
SELECT DISTINCT
CONCAT(&#39;SELECT &#39;,ndxcollist,&#39; FROM &#39;,db,&#39;.&#39;,tb,
  &#39; ORDER BY &#39;,ndxcollist,&#39;;&#39;) SelectQueryToLoadCache
  FROM
(
SELECT
   engine,table_schema db,table_name tb,
   index_name,GROUP_CONCAT(column_name ORDER BY seq_in_index)
ndxcollist
FROM
(
   SELECT
   B.engine,A.table_schema,A.table_name,
   A.index_name,A.column_name,A.seq_in_index
   FROM
   information_schema.statistics A INNER JOIN
   (
      SELECT engine,table_schema,table_name
      FROM information_schema.tables WHERE
engine=&#39;InnoDB&#39;
   ) B USING (table_schema,table_name)
   WHERE B.table_schema NOT IN (&#39;information_schema&#39;,&#39;mysql&#39;)
   ORDER BY table_schema,table_name,index_name,seq_in_index
) A
GROUP BY table_schema,table_name,index_name
) AA
ORDER BY db,tb;将脚本保存为：loadtomem.sql
执行命令：
mysql -uroot -p -AN < /root/loadtomem.sql > /root/loadtomem.sql在需要进行数据预热时就执行下面的命令：
mysql -uroot < /root/loadtomem.sql > /dev/null 2>&1

降低日志的磁盘落盘

增大redolog，减少落盘次数，innodb_log_file_size设置为0.25 * innodb_buffer_pool_size
通用查询日志、慢查询日志可以不开，bin-log要开，慢日志查询可以遇到性能问题再开
写redolog策略调整innodb_flush_log_at_trx_commit参数为0或2。当然涉及安全性非常高的系统（金融等）还是保持默认的就行。
在配置文件里加上 innodb_flush_log_at_trx_commit =2 即可。

SHOW VARIABLES LIKE &#39;innodb_flush_log_at_trx_commit&#39;表结构设计优化

设计中间表

设计中间表，一般针对于统计分析功能
2. 设计冗余字段
为减少关联查询，创建合理的冗余字段
3. 拆表
对于字段太多的大表，考虑拆表；对于表中经常不被使用的字段或存储数据比较多的字段，考虑拆表
4. 主键优化
主键类型最好是int类型，建议自增主键（分布式系统下用雪花算法）
5. 字段的设计

字段的宽度设得尽可能的小。
尽量把字段设置为NOT NULL
对于某些文本字段，如省份、性别等，我们可以把他们定义为enum类型。在mysql里enum类型被当作数值类型数据来处理，而数值型数据处理起来比文本类型快得多。

SQL语句及索引优化

学会用explain分析
SQL语句中IN包含的值不应太多

MySQL对IN做了一些优化，将IN中的常量去不存在一个数组里，而且会进行排序。如果数值较多，这些步骤消耗也是比较大的。
3. SELECT 语句务必指明字段名称
SELECT * 增加了很多不必要的消耗（CPU、IO、内存、网络带宽）
4. 当只需要一条数据时，使用limit
5. 排序字段加索引
6. 如果查询条件中其他字段没有索引，少用or
or两边的字段中，如果有一个不是索引字段，则会造成该查询都不会走索引的情况。
select * from tbiguser where nickname=&#39;zy1&#39; or loginname=&#39;zhaoyun3&#39;;如nickname是索引字段，loginname不是索引字段，则整体不会走索引。可以用union all代替
7. 尽量用union all代替union
union和union all的区别是，union需要将结果集合并再进行唯一性过滤操作，这就会涉及到排序，增加了大量的CPU运算。当然，使用union all的前提条件是两个结果集没有重复数据。
8. 区分in和exists、not in和not exists

exists：以外表为驱动表，先被访问。适合外表小而内表大的情况
in：先执行子查询。适合外表大而内表小的情况
关于not in和not exists，推荐使用not exists，不仅仅是效率问题，not in可能存在逻辑问题。如何高效的写出一个替代not exists的SQL语句？

原语句：
select colname … from A表 where a.id not in (select b.id from B表)
优化后的语句：
select colname … from A表 Left join B表 on where a.id = b.id where b.id is null

不建议使用%前缀模糊查询，不会走索引
避免在where子句中对字段进行表达式或函数操作
避免隐式类型转换如where age=&#39;18&#39;,如果确定是int类型，应写为where age = 18;
对于联合索引，要遵守最左前缀法则

举例来说索引含有字段id、name、school，可以直接用id字段，也可以id、name这样的顺序，但是name;school都无法使用这个索引。所以在创建联合索引的时候一定要注意索引字段顺序，常用的查询字段放在最前面。
13. 必要时可以使用force index来强制查询使用某个索引
14. 注意范围查询语句
对于联合索引来说，如果存在范围查询，比如between，>，<等条件时，会造成后面的索引字段失效
15. 使用JOIN优化
LEFT JOIN里左边的表为驱动表，RIGHT JOIN里右边的表为驱动表，而INNER JOIN MySQL会自动找出数据少的表为驱动表
注意：

MySQL没有full join，可以用以下方式解决

select * from A left join B on B.name = A.name where B.name is null union all
select * from B;

尽量用inner join，避免left join
合理利用索引字段作为on的限制字段
利用小表去驱动大表

下图是join查询的原理图，从图中可以看出如果能够减少驱动表的话，就能减少嵌套循环中的次数，以减少IO总量及CPU运算的次数。

SQL优化实战案例
介绍：tbiguser表有10000000条记录，表结构如下：
create table tbiguser(
id int primary key auto_increment,
nickname varchar(255),
loginname varchar(255),
age int ,
sex char(1),
status int,
address varchar(255)
);创建存储过程，并执行，插入一千万条数据
CREATE PROCEDURE test_insert()
BEGIN DECLARE i INT DEFAULT 1;
WHILE i<=10000000
DO
insert into tbiguser
VALUES(null,concat(&#39;zy&#39;,i),concat(&#39;zhaoyun&#39;,i),23,&#39;1&#39;,1,&#39;beijing&#39;); SET i=i+1;
END WHILE ;
commit;
END;
call test_insert还有tuser1表和tuser2表，两个表结构一致。
create table tuser1(
id int primary key auto_increment,
name varchar(255),
address varchar(255)
);
create table tuser2(
id int primary key auto_increment,
name varchar(255),
address varchar(255)
);

需求：tbiguser表按照地区分组统计求和，并且要求是在tuser1表和tuser2表中出现过的地区。
按照需求写出SQL：
SELECT COUNT(*) num,address FROM tbiguser WHERE address IN (SELECT address FROM tuser1)
GROUP BY address
UNION
SELECT COUNT(*) num,address FROM tbiguser WHERE address IN (SELECT address FROM tuser2)
GROUP BY address执行时间：4.65s
第一次优化：
加索引。我们可以给address字段加索引。
ALTER TABLE tuser1 ADD INDEX idx_address(address);
ALTER TABLE tuser2 ADD INDEX idx_address(address);
ALTER TABLE tbiguser ADD INDEX idx_address(address);执行时间0.9s
我们用explain分析sql

发现有两次都扫描了964147行，就是tbiguser这个大表扫描了两次。且有临时表使用。于是我们进行优化
第二次优化
SELECT COUNT(*) num,address FROM tbiguser WHERE address IN (SELECT address FROM tuser1) OR address IN (SELECT address FROM tuser2)
GROUP BY address执行时间0.65s

没有临时表了，大表也只扫描了一次。
另外我尝试这样查询：
SELECT COUNT(*) num,address FROM tbiguser WHERE address IN (SELECT address FROM tuser1 UNION ALL SELECT address FROM tuser2)
GROUP BY address执行时间12s。
SELECT COUNT(x.id),x.address
FROM
(SELECT DISTINCT b.* FROM tuser1 a,tbiguser b WHERE a.address=b.address UNION
ALL SELECT DISTINCT b.* FROM tuser2 a,tbiguser b WHERE a.address=b.address) X
GROUP BY x.address;执行时间5.8s
根据实践发现，sql查询优化没有定式，不同的数据量下相同的sql表现是不一样的，需要灵活运用。

来源：
https://www.cnblogs.com/javammc/p/16215256.html

夜之哀伤 · 发表于 2025-8-17 18:49:49

元芳你怎么看？

沙尘暴友满拒群 · 发表于 2025-12-22 19:47:37

高手云集果断围观

慈悲喜舍 · 发表于 2026-3-18 13:17:00

站位支持

子龙望月 · 发表于 2026-3-18 15:32:44

大人，此事必有蹊跷！