谈谈HashMap为什么是线程不安全的?

集合1 3171阅读模式
摘要

我们都知道HashMap是线程不安全的,在多线程环境中不建议使用,应该使用ConcurrentHashMap,但是其线程不安全体现在什么地方,可能并没有深入理解,本文将对该问题进行解密

HashMap的线程不安全有三个方面:死循环,数据丢失,数据覆盖。其中死循环和数据丢失在Java8中已经得到解决。

多线程下扩容造成的死循环

我们都知道HashMap是通过链地址法解决哈希碰撞,即当哈希冲突时,会将相同哈希值的键值对通过单向链表的形式存放。

Java7中采用的是头插法,即下一个冲突的键值对会放在上一个键值对的前面。这就是形成死循环的关键点。

在分析这个问题之前我们先用模拟一下这个问题。创建多个线程不断进行put操作。即会出现如下死循环的情况,用jstack命令定位线程死循环的原因,如下:

谈谈HashMap为什么是线程不安全的?

从日志中可以看出问题出在transfer函数上(这个函数是在resize扩容方法中)。Java7中HashMap的transfer源码如下:

谈谈HashMap为什么是线程不安全的?

注意 e.next = newTable[i] 和newTable[i] = e 这两行代码,就会导致链表的顺序翻转。

如果是多线程环境下,假设有线程A,线程B都在进行put操作

谈谈HashMap为什么是线程不安全的?

线程A在执行到newTable[i] = e时被挂起,随后执行线程B,且线程B正常执行完成了resize操作

谈谈HashMap为什么是线程不安全的?

         线程B执行完成后,因为线程A和线程B是共享的,所以现在9.next = 5,5.next = null
         随后线程A获得CPU时间片继续执行,完成第一轮循环后线程A的情况如下
谈谈HashMap为什么是线程不安全的?
        继续循环
谈谈HashMap为什么是线程不安全的?
        注意此时第三轮循环5.next = 9,第二轮循环9.next = 5,并且此时e = null循环结束,结果如下
谈谈HashMap为什么是线程不安全的?
      出现环形链表。

多线程下扩容造成的数据丢失

Java7中采用的头插法,除了引起死循环,还有数据丢失,同样的线程A,线程B进行put操作

谈谈HashMap为什么是线程不安全的?

线程A在执行到newTable[i] = e时被挂起,随后执行线程B,且线程B正常执行完成了resize操作

谈谈HashMap为什么是线程不安全的?

线程B执行完成后,现在15.next = null

谈谈HashMap为什么是线程不安全的?

继续向下执行

谈谈HashMap为什么是线程不安全的?

此时e = null 循环结束,5元素丢失

数据覆盖

        Java8中已经不再采用头插法,改为尾插法,即直接插入链表尾部,因此不会出现死循环和数据丢失,但是在多线程环境下仍然会有数据覆盖的问题。

首先我们看一下Java8中put操作的源码

谈谈HashMap为什么是线程不安全的?

         注意红色框内的部分,如果插入元素没有发生hash碰撞则直接插入。
         如果线程A和线程B同时进行put,刚好两条数据的hash值相同,如果线程A已经判断该位置数据为null,此时被挂起,线程B正常执行,并且正常插入数据,随后线程A继续执行就会将线程A的数据给覆盖。发生线程不安全。

评论  1  访客  0  作者  1
    • 小左
      小左

      谢谢博主分享,多多更新哦!

    匿名

    发表评论

    匿名网友

    :?: :razz: :sad: :evil: :!: :smile: :oops: :grin: :eek: :shock: :???: :cool: :lol: :mad: :twisted: :roll: :wink: :idea: :arrow: :neutral: :cry: :mrgreen:

    确定