`
narcissusoyf
  • 浏览: 154121 次
  • 性别: Icon_minigender_1
  • 来自: 上海
社区版块
存档分类
最新评论

从一个死锁看mysql innodb的锁机制

 
阅读更多

 

背景及现象

         线上生产环境在某些时候经常性的出现数据库操作死锁,导致业务人员无法进行操作。经过DBA的分析,是某一张表的insert操作和delete操作发生了死锁。简单介绍下数据库的情况(因为涉及到真实数据,这里做了模拟,不影响具体的分析和分析的结果。)假设存在如下2张表:




 Order 表的数据如下:

 


 Customer表的数据如下:


 

OrderCustomer 在实体关系上存在一个关联,即order实体拥有一个指向customer实体的指针。在数据库设计的时候,order表的customer_id没有被设计成一个外键,这是因为在对order表做操作的时候不希望外键影响数据库的操作性能。这里把对外键约束的检查放到了应用程序里面,即数据库仅仅当成一个持久化和事务性的保证。同时为了查询方便,对customer_id做了索引。

 

在这个模拟业务场景中存在一个业务(因为是模拟的,所以不关心现实中是不是正确),一个客户拥有的订单会经常性的发生变化。即这个客户可能删除他名下的一些已经存在的订单,又增加一些新的订单,或者修改一些存在的订单,这3种操作可能都会发生在一个请求中。这时,应用人员做了一个不太好的实现:当一个客户把他这次改动的订单传到后台以后。开发人员不管这次有没有发生变化都针对这个客户的订单进行了先deleteinsert的操作,来替代update操作。这里的实现是可以理解的,因为这一次请求中的订单可能需要delete,insertupdate 三种操作,这样就要分辨出这批从页面传入的数据那些是delete,那些是insert,那些是upadte,还不如统一做成先deleteinsert操作。

 

因为上面业务场景的实现的关系,抽象出来的一个事务中的数据库操作如下:

Start transaction; // 开事务

Delete from `order` where customer_id = XXX;  // 先删除XXX名下所有订单

Insert into ‘order’ (customer_id) values (xxx);   // Inset多条XXX名下的订单

Insert into ‘order’ (customer_id) values (xxx);

Insert into ‘order’ (customer_id) values (xxx);

……….

Commit; //事务提交

 

这样的操作在高并发的情况下,经常性的出现数据库死锁。

 

假设我们进行如下2个事务的操作(客户3和客户5都想增加一条自己的订单记录):

 

T1

 



 T2


如果在mysql服务器端,执行顺序如下:

T1  Start Transaction ;

T2  Start Transaction ;

T1   delete from `order` where customer_id = 3;

T2   delete from `order` where customer_id = 5;

T1  insert into `order` (customer_id) values (3);

T2  insert into `order` (customer_id) values (5);

…….

这个时候,T1 insert 语句没有办法执行,一直在等待一个锁授权。Mysql 的锁信息如下:


 

 Thread 5 尝试在 insert 的时候在等待一个锁授权,已经等待了10秒。可以看到事务0 10248 持有了2个锁;事务0 10247 2个锁,1个等待锁授权。整个数据库只有这2个事务,所以导致insert等待的锁一定被0 10248持有了。

 

如果 T2 insert语句继续执行,那么死锁就发生了,mysql的信息如下:


 

分析

         首先我们先要了解下基本的数据库的锁的知识。

         数据库为了提高并发性,对于读和写进行2种不同的锁控制,分别称为共享锁(S锁)和排他锁(X锁)。这两种锁不是mysql独有的,在一般性的数据库基本原理介绍中都会提到。同时还有相应的意向锁的概念。

mysqlinnodb 存储引擎里面,使用的是行锁(SX),以及表锁(ISIX)。这里4种锁有个兼容矩阵(兼容矩阵做什么用的?不需要解释了吧,可以参考数据库基本原理的书)如下:



 我们打开锁监控,然后再具体观察下在事务执行之中的锁情况。

A   T1  Start Transaction ;

B   T2  Start Transaction ;

C   T1  delete from `order` where customer_id = 3;

D   T2  delete from `order` where customer_id = 5;

E   T1  insert into `order` (customer_id) values (3);

F   T2  insert into `order` (customer_id) values (5);

…….

我们先按照顺序执行到E,下面是mysql的锁情况:

T1



 T2


 

我们可以清楚的看到 T1 持有(包括等待授权的)3个锁:一个是对表orderIX锁;一个是对表order上面的index customer_id Gap类型的X锁; 还有一个是对表Order上面index customer_id Insert intention 类型的X锁等待被授权。

T2 持有2个锁:一个是对表OrderIX锁; 一个是对表order上面的index customer_id Gap锁。

注意 T1 GapInsert intention ,T2 Gap 都是锁的同一个地方 “space id 0 page no 198 n bits 80”

 

这里介绍下mysql innodb下的锁类型:

常见的三种类型


拿上面的例子来说

Record 类型,简单的理解就是执行delete from `order` where id = 1,锁住的order表里面id =1的记录。

Gap 类型:简单的理解就是执行 delete from `order` where customer_id = 3。这里在order表里面没有customer_id=3 的记录。但是又由于customer_id存在一个索引,mysql根据索引进行搜索,索引的key(1,2,6)3不在这些key里面而是位于(2,6)之间的gap(间隙)中。Mysql对于(2,6)这个间隙加的锁就叫做Gap锁。这个例子中的间隙一共有(-,1),(1,2),(2,6),(6,+)4个。注意gap只锁间隙不锁记录。

Next-Key 类型 : 简单的理解就是 Gap + 下一个 Record 。拿上面Gap的例子来说的话,锁住的就是(2,6]。这里包括了6这个记录。

 

除开以上三种常见的锁类型,还有一种对于Insert语句的特殊锁类型


 

也就是说insert语句会对插入的行加一个X锁,但是在插入这个行的过程之前,会设置一个Insert intentionGap锁,叫做Insert intention锁。

以上面的例子来说,在执行 insert into `order` (customer_id) values (3)的时候,由于存在customer_id的索引,所以会对这个索引的(2,6)增加一个Insert Intention 类型的X锁。

 

了解了这些之后,我们回到上面的例子。

这里我们清楚的知道 --注意 T1 GapInsert intention ,T2 Gap 都是锁的同一个地方 “space id 0 page no 198 n bits 80”—3个锁锁住同一个地方的原因了。因为customer_id = 3 customer_id =5 都是属于同一个gap2,6)。

T1 持有 gap (2,6) X锁,同时有个 insert intention (2,6)X锁在等待gap(2,6)X锁的释放;

T2 持有 gap(2,6) X锁。

这就是导致T1insert 语句执行不下去的真正原因。 T2insert 语句执行的时候,(即F语句)可以预见,T2也会有个 insert intention(2,6)X锁在等待gap(2,6)X锁的释放。这样就形成了死锁。

        

         分析到这里就结束了么?好像那个地方有点不对。T1本身不就是拥有了一个gap(2,6)X锁么?等等,为什么在T1拥有gap(2,6)X锁的情况下,T2还可以拥有gap(2,6)X锁?X锁同X锁不是不兼容的么(看看兼容矩阵)?

 

         是的,看看上面的兼容矩阵。IXIX兼容,XX不兼容。T1T2 同时拥有对于表orderIX锁是可以理解的;但是T1T2 同时拥有对于表orderindex customer_idX锁似乎就无法理解了。按照兼容矩阵的说法,在T2 执行D语句的时候就应该被block,因为它需要获取Gap(2,6)X锁,但是这个锁已经被T1执行C语句的时候持有了,所以只有在T1事务执行完以后,T2才能继续执行,按照这个顺序下来,是不会发生死锁的。

Mysql 或者说是 Innodb 是不是弄错了什么?

其实,我们分析的没有错,Mysql也没有弄错,唯一错的地方是官方文档上面没有介绍除了这个(IS,IX,S,X)的兼容矩阵外,在Mysql实现内部还有一个更加精确的被称为“precise mode”的兼容矩阵。(该矩阵没有出现在官方文档上,是有人通过Mysql lock0lock.c:lock_rec_has_to_wait源代码推测出来的。)下面这个是“precise mode”的兼容矩阵:(这个兼容矩阵发生在XXSX不兼容的情况下再进行比对的)

 G    I     R    N (已经存在的锁,包括等待的锁)
  G   +     +    +     + 
  I    -      +    +     -
  R   +     +     -     -
  N   +     +     -     -
  +
代表兼容, -代表不兼容. I代表插入意图锁,
  G
代表Gap锁,I代表插入意图锁,R代表记录锁,N代表Next-Key.

(http://www.mysqlops.com/2012/05/19/locks_in_innodb.html#more-3169)

这里需要注意的一点是,存在Insert Intention 锁时,申请Gap锁是允许的;但是存在Gap锁时,申请Insert Intention锁时是被阻止的。

        

         回到上面的例子,这下就可以解释清楚了。

         执行C语句完毕,T1持有了Gap(2,6)X锁;

         执行D语句,T2 申请Gap(2,6)X锁,根据“precise mode”兼容矩阵,该申请被授权,所以T2 持有了Gap(2,6)X锁。

         执行E语句,T1 申请Insert Intention (2,6)X锁,根据“precise mode”兼容矩阵,由于T2持有Gap(2,6)X锁,该申请被T2 block

         执行F语句,T2 申请 Insert Intention(2,6)X锁,根据“precise mode”兼容矩阵,由于T1持有Gap(2,6)X锁,该申请被T1 block

         这里一个死锁很明显的出现,T1T2都持有一个锁,同时都在等对方释放一个锁。到这里,整个死锁的原因分析清楚了。

 

解决

我们分析清楚了死锁形成的原因,就很好去解决这个问题了。可以看出T1T2 都是持有了Gap 锁,等待insert intention被授权。

只要消除了Gap锁,这个死锁就解决了。方案有几种:

A delete order上面的index customer_id。这样在delete的时候就不会产生Gap锁,insert 的时候也不会有insert intention锁。不过对于查询会有影响。

B delete的时候,不让事务获取到Gap锁。比如,在执行delete from        `order`  where customer_id = 3 ;之前,先通过数据库查询 select * from `order` where customer_id = 3; 看是否存在记录。不存在记录这不执行delete操作。因为insert总是要发生,delete则不是必须一定要发生的。

 

 

后记

         在真实解决线上这个问题的时候,走过了一些弯路,某些现象也让我认为是找到了真实的原因,其实那只是虚幻的假象。

         因为死锁发生在Insert 语句上面,一开始我们认为是`order` 表上面的主键id自增锁引起的(有点主观臆断,病急乱投医)。然后,我们把`order`上面的主键id转换成类似Oraclesequence 序列,通过应用程序给予其赋值id。大家可以去尝试操作下,把一张表的主键idauto_increment 给改掉,是多么恶心的一个操作(不是说多复杂,而是说这个操作的方式让有“操作洁癖”的人无法忍受)。等到上线以后,确实似乎好了很多,但是根源还是存在,只是它现在不想咬你。又过了段时间,系统压力上来了,这个问题又暴露出来了。正是应了那句“屋漏偏招连夜雨”,祸不单行,当问题出现的时候,开始我们还是认为是insert语句生成id的方式造成的,慢慢的对于这个问题的分析越来越详尽,终于意识到“id 生成方式”是替罪羔羊,真正的原因在于过多的无意义的delete操作的时候,这个问题才算是解决。

         为了避免大家对主键id自增锁的偏见,我简单介绍下主键id自增锁的机制,也算是我对冤枉它的一种补偿吧。

         主键自增锁基本上是通过 select Max(id) from table for update来实现的。很明显,for update 加的是表锁而且是X的。和其他的锁的区别就在于它的释放时机,其他的锁是跟随事务的。自增锁不跟着事务走,而是跟着那条Insert语句走。

         Mysql 5.1.22版本以后,增加了 innodb_autoinc_lock_mode的参数,来调整主键自增锁的性能。这个时候不一定会进行锁表操作了,有可能就是直接在内存里面算好id值。在这种情况下面,mysql会对Insert语句进行分类,不同的分类在不同的参数 innodb_autoinc_lock_mode 下面会有不同的自增方式。大家可以参考《mysql技术内幕 InnoDB存储引擎》

 

 

  • 大小: 110.5 KB
  • 大小: 41.1 KB
  • 大小: 163.6 KB
  • 大小: 156.7 KB
  • 大小: 38.7 KB
  • 大小: 111.3 KB
  • 大小: 55.2 KB
  • 大小: 56.2 KB
  • 大小: 137.8 KB
  • 大小: 107.3 KB
  • 大小: 24.4 KB
  • 大小: 26.9 KB
  • 大小: 25.2 KB
分享到:
评论
2 楼 zhao251021539 2013-12-04  
你好,看了你的文章并且看了你给的那个链接 对于下面这一句我觉得有点问题

Read Uncommitted和Read Committed时,不需要在间隙上加锁,Nexk-Key变成Record锁。

下面这行是mysql官方文档的描述

在范围类型UPDATE
和DELETE语句,InnoDB必须对范围覆盖的间隙设置next-key锁定或间隙锁定以及其它用户做的块插入。这是很必要的,因为要让MySQL复制和恢复起作用,“幽灵行”必须被阻止掉。

我测试了一下 用例是这样  有 id,num 两个字段 有记录 (1,1) (20,20)
隔离级别为Read Committed 我使用 T1 执行 delete from test where id<15
t2 执行 insert into test values(12,12) t2 会阻塞 ,这说明官方文档是正确的 ,你觉得呢?
1 楼 sandaobusi 2013-06-24  
牛,分析的很详细。

相关推荐

    mysql innodb死锁问题详解.docx

    数据库也会发生死锁的现象,数据库系统实现了各种死锁检测和死锁超时机制来解除死锁,锁监视器进行死锁检测,MySQL的InnoDB处理死锁的方式是 将持有最少行级排它锁的事务进行回滚,相对比较简单的死锁回滚办法

    何登成 - 管中窥豹——MySQL(InnoDB)死锁分析之道

    2015 Oracle 技术嘉年华(OTN)分会场11何登成 - 管中窥豹——MySQL(InnoDB)死锁分析之道

    MySQL-InnoDB死锁分析之道

    该文档详细分析了innodb的加锁原理、死锁原因以及处理方式

    MySQL技术内幕 InnoDB存储引擎.pdf

    最近在学习MySQL技术内幕 InnoDB存储引擎 第2版,整理了一些文档分享出来,同时也方便以后查看。若有不当之处,烦请批评指正。 1. MySQL体系结构和存储引擎 2. InnoDB存储引擎 2.1 InnoDB体系结构 2.2 ...

    Mysql Innodb死锁情况分析与归纳.docx

    Mysql Innodb死锁情况分析与归纳.docx

    MYSQL 解锁与锁表介绍

    相对其他数据库而言,MySQL的锁机制比较简单,其最显著的特点是不同的存储引擎支持不同的锁机制。比如,MyISAM和MEMORY存储引擎采用的是表级锁(table-level locking);BDB存储引擎采用的是页面锁(page-level ...

    管中窥豹——MySQL(InnoDB)死锁分析之道

    管中窥豹——MySQL(InnoDB)死锁分析之道 阿里巴巴高级数据库专家

    详解MySQL(InnoDB)是如何处理死锁的

    主要介绍了MySQL(InnoDB)是如何处理死锁的,文中通过示例代码介绍的非常详细,对大家的学习或者工作具有一定的参考学习价值,需要的朋友们下面随着小编来一起学习学习吧

    MySQL锁机制与用法分析

    本文实例讲述了MySQL锁机制与用法。分享给大家供大家参考,具体如下: MySQL的锁机制比较简单,其最显著的特点是不同的存储引擎支持不同的锁机制。比如,MyISAM和MEMORY存储引擎采用的是表级锁;BDB存储引擎采用的是...

    MySQL Innodb表导致死锁日志情况分析与归纳

    发现当备份表格的sql语句与删除该表部分数据的sql语句同时运行时,mysql会检测出死锁,并打印出日志

    几种不常见的MySQL InnoDB 死锁情况--1

    NULL 博文链接:https://edwin-chen.iteye.com/blog/440645

    该如何解决MySQL中的死锁问题.txt

    MySQL中的死锁是指两个或多个事务在相互等待对方释放资源,导致它们都无法继续执行的情况。解决MySQL中的死锁问题通常涉及多个方面,包括监控死锁、分析死锁原因、优化事务设计以及调整系统配置等。以下是一些解决...

    InnoDB调试死锁的方法

    • 并发事务,间隙锁可能互斥 (1)A删除不存在的记录,...• 并发插入相同记录,可能死锁(某一个回滚) • 并发插入,可能出现间隙锁死锁(难排查) • show engine innodb status; 可以查看InnoDB的锁情况,也可以调试死锁

    Mysql 行级锁的使用及死锁的预防方案

     mysql的InnoDB,支持事务和行级锁,可以使用行锁来处理用户提现等业务。使用mysql锁的时候有时候会出现死锁,要做好死锁的预防。 二、MySQL行级锁  行级锁又分共享锁和排他锁。  共享锁:  名词解释:共享锁又...

    MySQL中InnoDB的间隙锁问题

    在为一个客户排除死锁问题时我遇到了一个有趣的包括InnoDB间隙锁的情形。对于一个WHERE子句不匹配任何行的非插入的写操作中,我预期事务应该不会有锁,但我错了。让我们看一下这张表及示例UPDATE。   mysql&gt; SHOW...

    Mysql解除死锁状态排查

    SELECT * FROM INFORMATION_SCHEMA.INNODB_LOCKS;SELECT * FROM INFORMATION_SCHEMA.INNODB_LOCK_WAITS; show status like ‘%lock%’等语句排查详解

    MySQL网络培训精品班-Inside君姜承尧

    MySQL 索引与innodb锁机制 day027-Secondary Index day028-join算法锁_1 day029-锁_2 day030-锁_3 day031-锁_4 day032-锁_5 day032-锁5标清 day033-锁_6 事物_1 day033-锁_6 事物1标清 day034-事物_2 MySQL 性能衡量...

    MySQL中InnoDB存储引擎的锁的基本使用教程

    InnoDB支持行级锁(row-level locking)和表级锁,默认为行级锁 各种锁特点 表级锁:开销小,加锁快;不会出现死锁;锁定粒度大,发生冲突的概率最高,并发度最低 行级锁:开销大,加锁慢;会出现死锁;锁定粒度最小...

    innodb GAP LOCK 死锁例子1

    innodb GAP LOCK 死锁例子1

Global site tag (gtag.js) - Google Analytics