Java關(guān)鍵字volatile知識點總結(jié)
volatile關(guān)鍵字是Java提供的一種輕量級同步機制。它能夠保證可見性和有序性,但是不能保證原子性
可見性對于volatile的可見性,先看看這段代碼的執(zhí)行

flag默認為true 創(chuàng)建一個線程A去判斷flag是否為true,如果為true循環(huán)執(zhí)行i++操作兩秒后,創(chuàng)建另一個線程B將flag修改為false 線程A沒有感知到flag已經(jīng)被修改成false了,不能跳出循環(huán)
這相當于啥呢?相當于你的女神和你說,你好好努力,年薪百萬了就嫁給你,你聽了之后,努力賺錢。3年之后,你年薪百萬了,回去找你女神,結(jié)果發(fā)現(xiàn)你女神結(jié)婚了,她結(jié)婚的消息根本沒有告訴你!難不難受?
女神結(jié)婚可以不告訴你,可是Java代碼中的屬性都是存在內(nèi)存中,一個線程的修改為什么另一個線程為什么不可見呢?這就不得不提到Java中的內(nèi)存模型了,Java中的內(nèi)存模型,簡稱JMM,JMM定義了線程和主內(nèi)存之間的抽象關(guān)系,定義了線程之間的共享變量存儲在主內(nèi)存中,每個線程都有一個私有的本地內(nèi)存,本地內(nèi)存中存儲了該線程以讀/寫共享變量的副本,它涵蓋了緩存、寫緩沖區(qū)、寄存器以及其他的硬件和編譯器優(yōu)化。
注意!JMM是一個屏蔽了不同操作系統(tǒng)架構(gòu)的差異的抽象概念,只是一組Java規(guī)范。

了解了JMM,現(xiàn)在我們再回顧一下文章開頭的那段代碼,為什么線程B修改了flag線程A看到的還是原來的值呢?

因為線程A復制了一份剛開始的flage=true到本地內(nèi)存,之后線程A使用的flag都是這個復制到本地內(nèi)存的flag。線程B修改了flag之后,將flag的值刷新到主內(nèi)存,此時主內(nèi)存的flag值變成了false。線程A是不知道線程B修改了flag,一直用的是本地內(nèi)存的flag = true。
那么,如何才能讓線程A知道flag被修改了呢?或者說怎么讓線程A本地內(nèi)存中緩存的flag無效,實現(xiàn)線程間可見呢?用volatile修飾flag就可以做到:

我們可以看到,用volatile修飾flag之后,線程B修改flag之后線程A是能感知到的,說明了volatile保證了線程同步之間的可見性。
重排序在闡述volatile有序性之前,需要先補充一些關(guān)于重排序的知識。
重排序是指編譯器和處理器為了優(yōu)化程序性能而對指令序列進行重新排序的一種手段。
為什么要有重排序呢?簡單來說,就是為了提升執(zhí)行效率。為什么能提升執(zhí)行效率呢?我們看下面這個例子:

可以看到重排序之后CPU實際執(zhí)行省略了一個讀取和寫回的操作,也就間接的提升了執(zhí)行效率。
有一點必須強調(diào)的是,上圖的例子只是為了讓讀者更好的理解為什么重排序能提升執(zhí)行效率,實際上Java里面的重排序并不是基于代碼級別的,從代碼到CPU執(zhí)行之間還有很多個階段,CPU底層還有一些優(yōu)化,實際上的執(zhí)行流程可能并不是上圖的說的那樣。不必過于糾結(jié)于此。
重排序可以提高程序的運行效率,但是必須遵循as-if-serial語義。as-if-serial語義是什么呢?簡單來說,就是不管你怎么重排序,你必須保證不管怎么重排序,單線程下程序的執(zhí)行結(jié)果不能被改變。
有序性上面我們已經(jīng)介紹了Java有重排序情況,現(xiàn)在我們再來聊一聊volatile的有序性。
先看一個經(jīng)典的面試題:為什么DDL(double check lock)單例模式需要加volatile關(guān)鍵字?

因為singleton = new Singleton()不是一個原子操作,大概要經(jīng)過這幾個步驟:
分配一塊內(nèi)存空間調(diào)用構(gòu)造器,初始化實例 singleton指向分配的內(nèi)存空間
實際執(zhí)行的時候,可能發(fā)生重排序,導致實際執(zhí)行步驟是這樣的:
申請一塊內(nèi)存空間 singleton指向分配的內(nèi)存空間調(diào)用構(gòu)造器,初始化實例
在singleton指向分配的內(nèi)存空間之后,singleton就不為空了。但是在沒有調(diào)用構(gòu)造器初始化實例之前,這個對象還處于半初始化狀態(tài),在這個狀態(tài)下,實例的屬性都還是默認屬性,這個時候如果有另一個線程調(diào)用getSingleton()方法時,會拿到這個半初始化的對象,導致出錯。
而加volatile修飾之后,就會禁止重排序,這樣就能保證在對象初始化完了之后才把singleton指向分配的內(nèi)存空間,杜絕了一些不可控錯誤的產(chǎn)生。volatile提供了happens-before保證,對volatile變量的寫入happens-before所有其他線程后續(xù)對的讀操作。
原理從上面的DDL單例用例來看,在并發(fā)情況下,重排序的存在會導致一些未知的錯誤。而加上volatile之后會防止重排序,那volatile是如何禁止重排序呢?
為了實現(xiàn)volatile的內(nèi)存語義,JMM會限制特定類型的編譯器和處理器重排序,JMM會針對編譯器制定volatile重排序規(guī)則表:

總結(jié)來說就是:
第二個操作是volatile寫,不管第一個操作是什么都不會重排序第一個操作是volatile讀,不管第二個操作是什么都不會重排序第一個操作是volatile寫,第二個操作是volatile讀,也不會發(fā)生重排序
如何保證這些操作不會發(fā)送重排序呢?就是通過插入內(nèi)存屏障保證的,JMM層面的內(nèi)存屏障分為讀(load)屏障和寫(Store)屏障,排列組合就有了四種屏障。對于volatile操作,JMM內(nèi)存屏障插入策略:
在每個volatile寫操作的前面插入一個StoreStore屏障在每個volatile寫操作的后面插入一個StoreLoad屏障在每個volatile讀操作的后面插入一個LoadLoad屏障在每個volatile讀操作的后面插入一個LoadStore屏障

上面的屏障都是JMM規(guī)范級別的,意思是,按照這個規(guī)范寫JDK能保證volatile修飾的內(nèi)存區(qū)域的操作不會發(fā)送重排序。
在硬件層面上,也提供了一系列的內(nèi)存屏障來提供一致性的能力。拿X86平臺來說,主要提供了這幾種內(nèi)存屏障指令:
lfence指令:在lfence指令前的讀操作當必須在lfence指令后的讀操作前完成,類似于讀屏障 sfence指令:在sfence指令前的寫操作當必須在sfence指令后的寫操作前完成,類似于寫屏障 mfence指令: 在mfence指令前的讀寫操作當必須在mfence指令后的讀寫操作前完成,類似讀寫屏障。
JMM規(guī)范需要加這么多內(nèi)存屏障,但實際情況并不需要加這么多內(nèi)存屏障。以我們常見的X86處理器為例,X86處理器不會對讀-讀、讀-寫和寫-寫操作做重排序,會省略掉這3種操作類型對應(yīng)的內(nèi)存屏障,僅會對寫-讀操作做重排序。所以volatile寫-讀操作只需要在volatile寫后插入StoreLoad屏障。在《The JSR-133 Cookbook for Compiler Writers》中,也很明確的指出了這一點:

而在x86處理器中,有三種方法可以實現(xiàn)實現(xiàn)StoreLoad屏障的效果,分別為:
mfence指令:上文提到過,能實現(xiàn)全能型屏障,具備lfence和sfence的能力。 cpuid指令:cpuid操作碼是一個面向x86架構(gòu)的處理器補充指令,它的名稱派生自CPU識別,作用是允許軟件發(fā)現(xiàn)處理器的詳細信息。 lock指令前綴:總線鎖。lock前綴只能加在一些特殊的指令前面。
實際上HotSpot關(guān)于volatile的實現(xiàn)就是使用的lock指令,只在volatile標記的地方加上帶lock前綴指令操作,并沒有參照JMM規(guī)范的屏障設(shè)計而使用對應(yīng)的mfence指令。
加上-XX:+UnlockDiagnosticVMOptions -XX:+PrintAssembly -XcompJVM參數(shù)再次執(zhí)行main方法,在打印的匯編碼中,我們也可以看到有一個lock addl $0x0,(%rsp)的操作。

在源碼中也可以得到驗證:

lock addl $0x0,(%rsp)后面的addl $0x0,(%rsp)其實是一個空操作。add是加的意思,0x0是16進制的0,rsp是一種類型寄存器,合起來就是把寄存器的值加0,加0是不是等于什么都沒有做?這段匯編碼僅僅是lock指令的一個載體而已。其實上文也有提到過,lock前綴只能加在一些特殊的指令前面,add就是其中一個指令。
至于Hotspot為什么要使用lock指令而不是mfence指令,按照我的理解,其實就是省事,實現(xiàn)起來簡單。因為lock功能過于強大,不需要有太多的考慮。而且lock指令優(yōu)先鎖緩存行,在性能上,lock指令也沒有想象中的那么差,mfence指令更沒有想象中的好。所以,使用lock是一個性價比非常高的一個選擇。而且,lock也有對可見性的語義說明。
在《IA-32架構(gòu)軟件開發(fā)人員手冊》的指令表中找到lock:

我不打算在這里深入闡述lock指令的實現(xiàn)原理和細節(jié),這很容易陷入堆砌技術(shù)術(shù)語中,而且也超出了本文的范圍,有興趣的可以去看看《IA-32架構(gòu)軟件開發(fā)人員手冊》。
我們只需要知道lock的這幾個作用就可以了:
確保后續(xù)指令執(zhí)行的原子性。在Pentium及之前的處理器中,帶有l(wèi)ock前綴的指令在執(zhí)行期間會鎖住總線,使得其它處理器暫時無法通過總線訪問內(nèi)存,很顯然,這個開銷很大。在新的處理器中,Intel使用緩存鎖定來保證指令執(zhí)行的原子性,緩存鎖定將大大降低lock前綴指令的執(zhí)行開銷。禁止該指令與前面和后面的讀寫指令重排序。把寫緩沖區(qū)的所有數(shù)據(jù)刷新到內(nèi)存中。
總結(jié)來說,就是lock指令既保證了可見性也保證了原子性。
重要的事情再說一遍,是lock指令既保證了可見性也保證了原子性,和什么緩沖一致性協(xié)議啊,MESI什么的沒有一點關(guān)系。
為了不讓你把緩存一致性協(xié)議和JMM混淆,在前面的文章中,我特意沒有提到過緩存一致性協(xié)議,因為這兩者本不是一個維度的東西,存在的意義也不一樣,這一部分,我們下次再聊。
總結(jié)全文重點是圍繞volatile的可見性和有序性展開的,其中花了不少的部分篇幅描述了一些計算機底層的概念,對于讀者來說可能過于無趣,但如果你能認真看完,我相信你或多或少也會有一點收獲。
不去深究,volatile只是一個普通的關(guān)鍵字。深入探討,你會發(fā)現(xiàn)volatile是一個非常重要的知識點。volatile能將軟件和硬件結(jié)合起來,想要徹底弄懂,需要深入到計算機的最底層。但如果你做到了。你對Java的認知一定會有進一步的提升。
只把眼光放在Java語言,似乎顯得非常局限。發(fā)散到其他語言,C語言,C++里面也都有volatile關(guān)鍵字。我沒有看過C語言,C++里面volatile關(guān)鍵字是如何實現(xiàn)的,但我相信底層的原理一定是相通的。
到此這篇關(guān)于Java關(guān)鍵字volatile知識點總結(jié)的文章就介紹到這了,更多相關(guān)理解Java關(guān)鍵字volatile內(nèi)容請搜索好吧啦網(wǎng)以前的文章或繼續(xù)瀏覽下面的相關(guān)文章希望大家以后多多支持好吧啦網(wǎng)!
相關(guān)文章:
1. ASP常用日期格式化函數(shù) FormatDate()2. Python 操作 MySQL數(shù)據(jù)庫3. Python數(shù)據(jù)相關(guān)系數(shù)矩陣和熱力圖輕松實現(xiàn)教程4. 開發(fā)效率翻倍的Web API使用技巧5. bootstrap select2 動態(tài)從后臺Ajax動態(tài)獲取數(shù)據(jù)的代碼6. CSS3中Transition屬性詳解以及示例分享7. js select支持手動輸入功能實現(xiàn)代碼8. 什么是Python變量作用域9. vue使用moment如何將時間戳轉(zhuǎn)為標準日期時間格式10. python 如何在 Matplotlib 中繪制垂直線
