文章詳情頁(yè)

Java Volatile關(guān)鍵字實(shí)現(xiàn)原理過(guò)程解析

【字号：大中小】作者：豬豬瀏覽：73日期：2022-09-04 11:09:56

volatile的用法

volatile通常被比喻成'輕量級(jí)的synchronized'，也是Java并發(fā)編程中比較重要的一個(gè)關(guān)鍵字。和synchronized不同，volatile是一個(gè)變量修飾符，只能用來(lái)修飾變量。無(wú)法修飾方法及代碼塊等。

volatile的用法比較簡(jiǎn)單，只需要在聲明一個(gè)可能被多線程同時(shí)訪問(wèn)的變量時(shí)，使用volatile修飾就可以了。

如以下代碼，是一個(gè)比較典型的使用雙重鎖校驗(yàn)的形式實(shí)現(xiàn)單例的，其中使用volatile關(guān)鍵字修飾可能被多個(gè)線程同時(shí)訪問(wèn)到的singleton。

public class Singleton { private volatile static Singleton singleton; private Singleton (){} public static Singleton getSingleton() { if (singleton == null) { synchronized (Singleton.class) { if (singleton == null) { singleton = new Singleton(); } } } return singleton; } }

volatile的原理

為了提高處理器的執(zhí)行速度，在處理器和內(nèi)存之間增加了多級(jí)緩存來(lái)提升。但是由于引入了多級(jí)緩存，就存在緩存數(shù)據(jù)不一致問(wèn)題。

但是，對(duì)于volatile變量，當(dāng)對(duì)volatile變量進(jìn)行寫操作的時(shí)候，JVM會(huì)向處理器發(fā)送一條lock前綴的指令，將這個(gè)緩存中的變量回寫到系統(tǒng)主存中。

但是就算寫回到內(nèi)存，如果其他處理器緩存的值還是舊的，再執(zhí)行計(jì)算操作就會(huì)有問(wèn)題，所以在多處理器下，為了保證各個(gè)處理器的緩存是一致的，就會(huì)實(shí)現(xiàn)緩存一致性協(xié)議

緩存一致性協(xié)議：每個(gè)處理器通過(guò)嗅探在總線上傳播的數(shù)據(jù)來(lái)檢查自己緩存的值是不是過(guò)期了，當(dāng)處理器發(fā)現(xiàn)自己緩存行對(duì)應(yīng)的內(nèi)存地址被修改，就會(huì)將當(dāng)前處理器的緩存行設(shè)置成無(wú)效狀態(tài)，當(dāng)處理器要對(duì)這個(gè)數(shù)據(jù)進(jìn)行修改操作的時(shí)候，會(huì)強(qiáng)制重新從系統(tǒng)內(nèi)存里把數(shù)據(jù)讀到處理器緩存里。

所以，如果一個(gè)變量被volatile所修飾的話，在每次數(shù)據(jù)變化之后，其值都會(huì)被強(qiáng)制刷入主存。而其他處理器的緩存由于遵守了緩存一致性協(xié)議，也會(huì)把這個(gè)變量的值從主存加載到自己的緩存中。這就保證了一個(gè)volatile在并發(fā)編程中，其值在多個(gè)緩存中是可見(jiàn)的。

volatile與可見(jiàn)性

可見(jiàn)性是指當(dāng)多個(gè)線程訪問(wèn)同一個(gè)變量時(shí)，一個(gè)線程修改了這個(gè)變量的值，其他線程能夠立即看得到修改的值。

Java內(nèi)存模型規(guī)定了所有的變量都存儲(chǔ)在主內(nèi)存中，每條線程還有自己的工作內(nèi)存，線程的工作內(nèi)存中保存了該線程中是用到的變量的主內(nèi)存副本拷貝，線程對(duì)變量的所有操作都必須在工作內(nèi)存中進(jìn)行，而不能直接讀寫主內(nèi)存。不同的線程之間也無(wú)法直接訪問(wèn)對(duì)方工作內(nèi)存中的變量，線程間變量的傳遞均需要自己的工作內(nèi)存和主存之間進(jìn)行數(shù)據(jù)同步進(jìn)行。所以，就可能出現(xiàn)線程1改了某個(gè)變量的值，但是線程2不可見(jiàn)的情況。

前面的關(guān)于volatile的原理中介紹過(guò)了，Java中的volatile關(guān)鍵字提供了一個(gè)功能，那就是被其修飾的變量在被修改后可以立即同步到主內(nèi)存，被其修飾的變量在每次是用之前都從主內(nèi)存刷新。因此，可以使用volatile來(lái)保證多線程操作時(shí)變量的可見(jiàn)性。

volatile與有序性

有序性即程序執(zhí)行的順序按照代碼的先后順序執(zhí)行。

除了引入了時(shí)間片以外，由于處理器優(yōu)化和指令重排等，CPU還可能對(duì)輸入代碼進(jìn)行亂序執(zhí)行，比如load->add->save 有可能被優(yōu)化成load->save->add 。這就是可能存在有序性問(wèn)題。

而volatile除了可以保證數(shù)據(jù)的可見(jiàn)性之外，還有一個(gè)強(qiáng)大的功能，那就是他可以禁止指令重排優(yōu)化等。

普通的變量?jī)H僅會(huì)保證在該方法的執(zhí)行過(guò)程中所依賴的賦值結(jié)果的地方都能獲得正確的結(jié)果，而不能保證變量的賦值操作的順序與程序代碼中的執(zhí)行順序一致。

volatile可以禁止指令重排，這就保證了代碼的程序會(huì)嚴(yán)格按照代碼的先后順序執(zhí)行。這就保證了有序性。被volatile修飾的變量的操作，會(huì)嚴(yán)格按照代碼順序執(zhí)行，load->add->save 的執(zhí)行順序就是：load、add、save。

volatile與原子性原子性是指一個(gè)操作是不可中斷的，要全部執(zhí)行完成，要不就都不執(zhí)行。

線程是CPU調(diào)度的基本單位。CPU有時(shí)間片的概念，會(huì)根據(jù)不同的調(diào)度算法進(jìn)行線程調(diào)度。當(dāng)一個(gè)線程獲得時(shí)間片之后開(kāi)始執(zhí)行，在時(shí)間片耗盡之后，就會(huì)失去CPU使用權(quán)。所以在多線程場(chǎng)景下，由于時(shí)間片在線程間輪換，就會(huì)發(fā)生原子性問(wèn)題。

為了保證原子性，需要通過(guò)字節(jié)碼指令monitorenter和monitorexit，但是volatile和這兩個(gè)指令之間是沒(méi)有任何關(guān)系的。

所以，volatile是不能保證原子性的。

在以下兩個(gè)場(chǎng)景中可以使用volatile來(lái)代替synchronized：

1、運(yùn)算結(jié)果并不依賴變量的當(dāng)前值，或者能夠確保只有單一的線程會(huì)修改變量的值。

2、變量不需要與其他狀態(tài)變量共同參與不變約束。

除以上場(chǎng)景外，都需要使用其他方式來(lái)保證原子性，如synchronized或者concurrent包。

我們來(lái)看一下volatile和原子性的例子：

public class Test { public volatile int inc = 0; public void increase() { inc++; } public static void main(String[] args) { final Test test = new Test(); for(int i=0;i<10;i++){ new Thread(){public void run() { for(int j=0;j<1000;j++) test.increase();}; }.start(); } while(Thread.activeCount()>1) //保證前面的線程都執(zhí)行完 Thread.yield(); System.out.println(test.inc); }}

以上代碼比較簡(jiǎn)單，就是創(chuàng)建10個(gè)線程，然后分別執(zhí)行1000次i++操作。正常情況下，程序的輸出結(jié)果應(yīng)該是10000，但是，多次執(zhí)行的結(jié)果都小于10000。這其實(shí)就是volatile無(wú)法滿足原子性的原因。

為什么會(huì)出現(xiàn)這種情況呢，那就是因?yàn)殡m然volatile可以保證inc在多個(gè)線程之間的可見(jiàn)性。但是無(wú)法inc++的原子性。

總結(jié)與思考

我們介紹過(guò)了volatile關(guān)鍵字和synchronized關(guān)鍵字。現(xiàn)在我們知道，synchronized可以保證原子性、有序性和可見(jiàn)性。而volatile卻只能保證有序性和可見(jiàn)性。

我們知道volatile關(guān)鍵字的作用是保證變量在多線程之間的可見(jiàn)性，它是java.util.concurrent包的核心，沒(méi)有volatile就沒(méi)有這么多的并發(fā)類給我們使用。

本文詳細(xì)解讀一下volatile關(guān)鍵字如何保證變量在多線程之間的可見(jiàn)性，在此之前，有必要講解一下CPU緩存的相關(guān)知識(shí)，掌握這部分知識(shí)一定會(huì)讓我們更好地理解volatile的原理，從而更好、更正確地地使用volatile關(guān)鍵字。

CPU緩存

CPU緩存的出現(xiàn)主要是為了解決CPU運(yùn)算速度與內(nèi)存讀寫速度不匹配的矛盾，因?yàn)镃PU運(yùn)算速度要比內(nèi)存讀寫速度快得多，舉個(gè)例子：

一次主內(nèi)存的訪問(wèn)通常在幾十到幾百個(gè)時(shí)鐘周期一次L1高速緩存的讀寫只需要1~2個(gè)時(shí)鐘周期一次L2高速緩存的讀寫也只需要數(shù)十個(gè)時(shí)鐘周期

這種訪問(wèn)速度的顯著差異，導(dǎo)致CPU可能會(huì)花費(fèi)很長(zhǎng)時(shí)間等待數(shù)據(jù)到來(lái)或把數(shù)據(jù)寫入內(nèi)存。

基于此，現(xiàn)在CPU大多數(shù)情況下讀寫都不會(huì)直接訪問(wèn)內(nèi)存（CPU都沒(méi)有連接到內(nèi)存的管腳），取而代之的是CPU緩存，CPU緩存是位于CPU與內(nèi)存之間的臨時(shí)存儲(chǔ)器，它的容量比內(nèi)存小得多但是交換速度卻比內(nèi)存快得多。而緩存中的數(shù)據(jù)是內(nèi)存中的一小部分?jǐn)?shù)據(jù)，但這一小部分是短時(shí)間內(nèi)CPU即將訪問(wèn)的，當(dāng)CPU調(diào)用大量數(shù)據(jù)時(shí)，就可先從緩存中讀取，從而加快讀取速度。

按照讀取順序與CPU結(jié)合的緊密程度，CPU緩存可分為：

一級(jí)緩存：簡(jiǎn)稱L1 Cache，位于CPU內(nèi)核的旁邊，是與CPU結(jié)合最為緊密的CPU緩存二級(jí)緩存：簡(jiǎn)稱L2 Cache，分內(nèi)部和外部?jī)煞N芯片，內(nèi)部芯片二級(jí)緩存運(yùn)行速度與主頻相同，外部芯片二級(jí)緩存運(yùn)行速度則只有主頻的一半三級(jí)緩存：簡(jiǎn)稱L3 Cache，部分高端CPU才有

每一級(jí)緩存中所存儲(chǔ)的數(shù)據(jù)全部都是下一級(jí)緩存中的一部分，這三種緩存的技術(shù)難度和制造成本是相對(duì)遞減的，所以其容量也相對(duì)遞增。

當(dāng)CPU要讀取一個(gè)數(shù)據(jù)時(shí)，首先從一級(jí)緩存中查找，如果沒(méi)有再?gòu)亩?jí)緩存中查找，如果還是沒(méi)有再?gòu)娜?jí)緩存中或內(nèi)存中查找。一般來(lái)說(shuō)每級(jí)緩存的命中率大概都有80%左右，也就是說(shuō)全部數(shù)據(jù)量的80%都可以在一級(jí)緩存中找到，只剩下20%的總數(shù)據(jù)量才需要從二級(jí)緩存、三級(jí)緩存或內(nèi)存中讀取。

使用CPU緩存帶來(lái)的問(wèn)題

用一張圖表示一下CPU-->CPU緩存-->主內(nèi)存數(shù)據(jù)讀取之間的關(guān)系：

Java Volatile關(guān)鍵字實(shí)現(xiàn)原理過(guò)程解析

當(dāng)系統(tǒng)運(yùn)行時(shí)，CPU執(zhí)行計(jì)算的過(guò)程如下：

程序以及數(shù)據(jù)被加載到主內(nèi)存指令和數(shù)據(jù)被加載到CPU緩存CPU執(zhí)行指令，把結(jié)果寫到高速緩存高速緩存中的數(shù)據(jù)寫回主內(nèi)存

如果服務(wù)器是單核CPU，那么這些步驟不會(huì)有任何的問(wèn)題，但是如果服務(wù)器是多核CPU，那么問(wèn)題來(lái)了，以Intel Core i7處理器的高速緩存概念模型為例（圖片摘自《深入理解計(jì)算機(jī)系統(tǒng)》）：

Java Volatile關(guān)鍵字實(shí)現(xiàn)原理過(guò)程解析

試想下面一種情況：

核0讀取了一個(gè)字節(jié)，根據(jù)局部性原理，它相鄰的字節(jié)同樣被被讀入核0的緩存核3做了上面同樣的工作，這樣核0與核3的緩存擁有同樣的數(shù)據(jù)核0修改了那個(gè)字節(jié)，被修改后，那個(gè)字節(jié)被寫回核0的緩存，但是該信息并沒(méi)有寫回主存核3訪問(wèn)該字節(jié)，由于核0并未將數(shù)據(jù)寫回主存，數(shù)據(jù)不同步

為了解決這個(gè)問(wèn)題，CPU制造商制定了一個(gè)規(guī)則：當(dāng)一個(gè)CPU修改緩存中的字節(jié)時(shí)，服務(wù)器中其他CPU會(huì)被通知，它們的緩存將視為無(wú)效。于是，在上面的情況下，核3發(fā)現(xiàn)自己的緩存中數(shù)據(jù)已無(wú)效，核0將立即把自己的數(shù)據(jù)寫回主存，然后核3重新讀取該數(shù)據(jù)。

反匯編Java字節(jié)碼，查看匯編層面對(duì)volatile關(guān)鍵字做了什么

有了上面的理論基礎(chǔ)，我們可以研究volatile關(guān)鍵字到底是如何實(shí)現(xiàn)的。首先寫一段簡(jiǎn)單的代碼：

/** * @author 五月的倉(cāng)頡http://www.cnblogs.com/xrq730/p/7048693.html */ public class LazySingleton { private static volatile LazySingleton instance = null; public static LazySingleton getInstance() { if (instance == null) { instance = new LazySingleton(); } return instance; } public static void main(String[] args) { LazySingleton.getInstance(); } }

首先反編譯一下這段代碼的.class文件，看一下生成的字節(jié)碼：

Java Volatile關(guān)鍵字實(shí)現(xiàn)原理過(guò)程解析

沒(méi)有任何特別的。要知道，字節(jié)碼指令，比如上圖的getstatic、ifnonnull、new等，最終對(duì)應(yīng)到操作系統(tǒng)的層面，都是轉(zhuǎn)換為一條一條指令去執(zhí)行，我們使用的PC機(jī)、應(yīng)用服務(wù)器的CPU架構(gòu)通常都是IA-32架構(gòu)的，這種架構(gòu)采用的指令集是CISC（復(fù)雜指令集），而匯編語(yǔ)言則是這種指令集的助記符。

因此，既然在字節(jié)碼層面我們看不出什么端倪，那下面就看看將代碼轉(zhuǎn)換為匯編指令能看出什么端倪。Windows上要看到以上代碼對(duì)應(yīng)的匯編碼不難（吐槽一句，說(shuō)說(shuō)不難，為了這個(gè)問(wèn)題我找遍了各種資料，差點(diǎn)就準(zhǔn)備安裝虛擬機(jī)，在Linux系統(tǒng)上搞了），訪問(wèn)hsdis工具路徑可直接下載hsdis工具，下載完畢之后解壓，將hsdis-amd64.dll與hsdis-amd64.lib兩個(gè)文件放在%JAVA_HOME%jrebinserver路徑下即可，如下圖：

Java Volatile關(guān)鍵字實(shí)現(xiàn)原理過(guò)程解析

然后跑main函數(shù)，跑main函數(shù)之前，加入如下虛擬機(jī)參數(shù)：

-server -Xcomp -XX:+UnlockDiagnosticVMOptions -XX:+PrintAssembly -XX:CompileCommand=compileonly,*LazySingleton.getInstance

這么長(zhǎng)長(zhǎng)的匯編代碼，可能大家不知道CPU在哪里做了手腳，沒(méi)事不難，定位到59、60兩行：

0x0000000002931351: lock add dword ptr [rsp],0h ;*putstatic instance; - org.xrq.test.design.singleton.LazySingleton::getInstance@13 (line 14)

之所以定位到這兩行是因?yàn)檫@里結(jié)尾寫明了line 14，line 14即volatile變量instance賦值的地方。后面的add dword ptr [rsp],0h都是正常的匯編語(yǔ)句，意思是將雙字節(jié)的棧指針寄存器+0，這里的關(guān)鍵就是add前面的lock指令，后面詳細(xì)分析一下lock指令的作用和為什么加上lock指令后就能保證volatile關(guān)鍵字的內(nèi)存可見(jiàn)性。

lock指令做了什么

之前有說(shuō)過(guò)IA-32架構(gòu)，關(guān)于CPU架構(gòu)的問(wèn)題大家有興趣的可以自己查詢一下，這里查詢一下IA-32手冊(cè)關(guān)于lock指令的描述，沒(méi)有IA-32手冊(cè)的可以去這個(gè)地址下載IA-32手冊(cè)下載地址，是個(gè)中文版本的手冊(cè)。

我摘抄一下IA-32手冊(cè)中關(guān)于lock指令作用的一些描述（因?yàn)閘ock指令的作用在手冊(cè)中散落在各處，并不是在某一章或者某一節(jié)專門講）：

在修改內(nèi)存操作時(shí)，使用LOCK前綴去調(diào)用加鎖的讀-修改-寫操作，這種機(jī)制用于多處理器系統(tǒng)中處理器之間進(jìn)行可靠的通訊，具體描述如下：

（1）在Pentium和早期的IA-32處理器中，LOCK前綴會(huì)使處理器執(zhí)行當(dāng)前指令時(shí)產(chǎn)生一個(gè)LOCK#信號(hào)，這種總是引起顯式總線鎖定出現(xiàn)

（2）在Pentium4、Inter Xeon和P6系列處理器中，加鎖操作是由高速緩存鎖或總線鎖來(lái)處理。如果內(nèi)存訪問(wèn)有高速緩存且只影響一個(gè)單獨(dú)的高速緩存行，那么操作中就會(huì)調(diào)用高速緩存鎖，而系統(tǒng)總線和系統(tǒng)內(nèi)存中的實(shí)際區(qū)域內(nèi)不會(huì)被鎖定。同時(shí)，這條總線上的其它Pentium4、Intel Xeon或者P6系列處理器就回寫所有已修改的數(shù)據(jù)并使它們的高速緩存失效，以保證系統(tǒng)內(nèi)存的一致性。如果內(nèi)存訪問(wèn)沒(méi)有高速緩存且/或它跨越了高速緩存行的邊界，那么這個(gè)處理器就會(huì)產(chǎn)生LOCK#信號(hào)，并在鎖定操作期間不會(huì)響應(yīng)總線控制請(qǐng)求

32位IA-32處理器支持對(duì)系統(tǒng)內(nèi)存中的某個(gè)區(qū)域進(jìn)行加鎖的原子操作。這些操作常用來(lái)管理共享的數(shù)據(jù)結(jié)構(gòu)（如信號(hào)量、段描述符、系統(tǒng)段或頁(yè)表），兩個(gè)或多個(gè)處理器可能同時(shí)會(huì)修改這些數(shù)據(jù)結(jié)構(gòu)中的同一數(shù)據(jù)域或標(biāo)志。處理器使用三個(gè)相互依賴的機(jī)制來(lái)實(shí)現(xiàn)加鎖的原子操作：

1、保證原子操作

2、總線加鎖，使用LOCK#信號(hào)和LOCK指令前綴

3、高速緩存相干性協(xié)議，確保對(duì)高速緩存中的數(shù)據(jù)結(jié)構(gòu)執(zhí)行原子操作（高速緩存鎖）。這種機(jī)制存在于Pentium4、Intel Xeon和P6系列處理器中

IA-32處理器提供有一個(gè)LOCK#信號(hào)，會(huì)在某些關(guān)鍵內(nèi)存操作期間被自動(dòng)激活，去鎖定系統(tǒng)總線。當(dāng)這個(gè)輸出信號(hào)發(fā)出的時(shí)候，來(lái)自其他處理器或總線代理的控制請(qǐng)求將被阻塞。軟件能夠通過(guò)預(yù)先在指令前添加LOCK前綴來(lái)指定需要LOCK語(yǔ)義的其它場(chǎng)合。

在Intel386、Intel486、Pentium處理器中，明確地對(duì)指令加鎖會(huì)導(dǎo)致LOCK#信號(hào)的產(chǎn)生。由硬件設(shè)計(jì)人員來(lái)保證系統(tǒng)硬件中LOCK#信號(hào)的可用性，以控制處理器間的內(nèi)存訪問(wèn)。

對(duì)于Pentinum4、Intel Xeon以及P6系列處理器，如果被訪問(wèn)的內(nèi)存區(qū)域是在處理器內(nèi)部進(jìn)行高速緩存的，那么通常不發(fā)出LOCK#信號(hào)；相反，加鎖只應(yīng)用于處理器的高速緩存。

為顯式地強(qiáng)制執(zhí)行LOCK語(yǔ)義，軟件可以在下列指令修改內(nèi)存區(qū)域時(shí)使用LOCK前綴。當(dāng)LOCK前綴被置于其它指令之前或者指令沒(méi)有對(duì)內(nèi)存進(jìn)行寫操作（也就是說(shuō)目標(biāo)操作數(shù)在寄存器中）時(shí)，會(huì)產(chǎn)生一個(gè)非法操作碼異常（#UD）。

【1】位測(cè)試和修改指令（BTS、BTR、BTC）【2】交換指令（XADD、CMPXCHG、CMPXCHG8B）【3】自動(dòng)假設(shè)有LOCK前綴的XCHG指令【4】下列單操作數(shù)的算數(shù)和邏輯指令：INC、DEC、NOT、NEG【5】下列雙操作數(shù)的算數(shù)和邏輯指令：ADD、ADC、SUB、SBB、AND、OR、XOR

一個(gè)加鎖的指令會(huì)保證對(duì)目標(biāo)操作數(shù)所在的內(nèi)存區(qū)域加鎖，但是系統(tǒng)可能會(huì)將鎖定區(qū)域解釋得稍大一些。軟件應(yīng)該使用相同的地址和操作數(shù)長(zhǎng)度來(lái)訪問(wèn)信號(hào)量（用作處理器之間發(fā)送信號(hào)的共享內(nèi)存）。例如，如果一個(gè)處理器使用一個(gè)字來(lái)訪問(wèn)信號(hào)量，其它處理器就不應(yīng)該使用一個(gè)字節(jié)來(lái)訪問(wèn)這個(gè)信號(hào)量。總線鎖的完整性不收內(nèi)存區(qū)域?qū)R的影響。加鎖語(yǔ)義會(huì)一直持續(xù)，以滿足更新整個(gè)操作數(shù)所需的總線周期個(gè)數(shù)。但是，建議加鎖訪問(wèn)應(yīng)該對(duì)齊在它們的自然邊界上，以提升系統(tǒng)性能：

【1】任何8位訪問(wèn)的邊界（加鎖或不加鎖）【2】鎖定的字訪問(wèn)的16位邊界【3】鎖定的雙字訪問(wèn)的32位邊界【4】鎖定的四字訪問(wèn)的64位邊界

對(duì)所有其它的內(nèi)存操作和所有可見(jiàn)的外部事件來(lái)說(shuō)，加鎖的操作都是原子的。所有取指令和頁(yè)表操作能夠越過(guò)加鎖的指令。加鎖的指令可用于同步一個(gè)處理器寫數(shù)據(jù)而另一個(gè)處理器讀數(shù)據(jù)的操作。

IA-32架構(gòu)提供了幾種機(jī)制用來(lái)強(qiáng)化或弱化內(nèi)存排序模型，以處理特殊的編程情形。這些機(jī)制包括：

【1】I/O指令、加鎖指令、LOCK前綴以及串行化指令等，強(qiáng)制在處理器上進(jìn)行較強(qiáng)的排序

【2】SFENCE指令（在Pentium III中引入）和LFENCE指令、MFENCE指令（在Pentium4和Intel Xeon處理器中引入）提供了

某些特殊類型內(nèi)存操作的排序和串行化功能...（這里還有兩條就不寫了）

這些機(jī)制可以通過(guò)下面的方式使用。

總線上的內(nèi)存映射設(shè)備和其它I/O設(shè)備通常對(duì)向它們緩沖區(qū)寫操作的順序很敏感，I/O指令（IN指令和OUT指令）以下面的方式對(duì)這種訪問(wèn)執(zhí)行強(qiáng)寫操作的排序。在執(zhí)行了一條I/O指令之前，處理器等待之前的所有指令執(zhí)行完畢以及所有的緩沖區(qū)都被都被寫入了內(nèi)存。只有取指令和頁(yè)表查詢能夠越過(guò)I/O指令，后續(xù)指令要等到I/O指令執(zhí)行完畢才開(kāi)始執(zhí)行。

反復(fù)思考IA-32手冊(cè)對(duì)lock指令作用的這幾段描述，可以得出lock指令的幾個(gè)作用：

鎖總線，其它CPU對(duì)內(nèi)存的讀寫請(qǐng)求都會(huì)被阻塞，直到鎖釋放，不過(guò)實(shí)際后來(lái)的處理器都采用鎖緩存替代鎖總線，因?yàn)殒i總線的開(kāi)銷比較大，鎖總線期間其他CPU沒(méi)法訪問(wèn)內(nèi)存lock后的寫操作會(huì)回寫已修改的數(shù)據(jù)，同時(shí)讓其它CPU相關(guān)緩存行失效，從而重新從主存中加載最新的數(shù)據(jù)不是內(nèi)存屏障卻能完成類似內(nèi)存屏障的功能，阻止屏障兩遍的指令重排序

（1）中寫了由于效率問(wèn)題，實(shí)際后來(lái)的處理器都采用鎖緩存來(lái)替代鎖總線，這種場(chǎng)景下多緩存的數(shù)據(jù)一致是通過(guò)緩存一致性協(xié)議來(lái)保證的，我們來(lái)看一下什么是緩存一致性協(xié)議。

緩存一致性協(xié)議

講緩存一致性之前，先說(shuō)一下緩存行的概念：

緩存是分段（line）的，一個(gè)段對(duì)應(yīng)一塊存儲(chǔ)空間，我們稱之為緩存行，它是CPU緩存中可分配的最小存儲(chǔ)單元，大小32字節(jié)、64字節(jié)、128字節(jié)不等，這與CPU架構(gòu)有關(guān)，通常來(lái)說(shuō)是64字節(jié)。當(dāng)CPU看到一條讀取內(nèi)存的指令時(shí)，它會(huì)把內(nèi)存地址傳遞給一級(jí)數(shù)據(jù)緩存，一級(jí)數(shù)據(jù)緩存會(huì)檢查它是否有這個(gè)內(nèi)存地址對(duì)應(yīng)的緩存段，如果沒(méi)有就把整個(gè)緩存段從內(nèi)存（或更高一級(jí)的緩存）中加載進(jìn)來(lái)。注意，這里說(shuō)的是一次加載整個(gè)緩存段，這就是上面提過(guò)的局部性原理

上面說(shuō)了，LOCK#會(huì)鎖總線，實(shí)際上這不現(xiàn)實(shí)，因?yàn)殒i總線效率太低了。因此最好能做到：使用多組緩存，但是它們的行為看起來(lái)只有一組緩存那樣。緩存一致性協(xié)議就是為了做到這一點(diǎn)而設(shè)計(jì)的，就像名稱所暗示的那樣，這類協(xié)議就是要使多組緩存的內(nèi)容保持一致。

緩存一致性協(xié)議有多種，但是日常處理的大多數(shù)計(jì)算機(jī)設(shè)備都屬于'嗅探（snooping）'協(xié)議，它的基本思想是：

所有內(nèi)存的傳輸都發(fā)生在一條共享的總線上，而所有的處理器都能看到這條總線：緩存本身是獨(dú)立的，但是內(nèi)存是共享資源，所有的內(nèi)存訪問(wèn)都要經(jīng)過(guò)仲裁（同一個(gè)指令周期中，只有一個(gè)CPU緩存可以讀寫內(nèi)存）。

CPU緩存不僅僅在做內(nèi)存?zhèn)鬏數(shù)臅r(shí)候才與總線打交道，而是不停在嗅探總線上發(fā)生的數(shù)據(jù)交換，跟蹤其他緩存在做什么。所以當(dāng)一個(gè)緩存代表它所屬的處理器去讀寫內(nèi)存時(shí)，其它處理器都會(huì)得到通知，它們以此來(lái)使自己的緩存保持同步。只要某個(gè)處理器一寫內(nèi)存，其它處理器馬上知道這塊內(nèi)存在它們的緩存段中已失效。

MESI協(xié)議是當(dāng)前最主流的緩存一致性協(xié)議，在MESI協(xié)議中，每個(gè)緩存行有4個(gè)狀態(tài)，可用2個(gè)bit表示，它們分別是：

Java Volatile關(guān)鍵字實(shí)現(xiàn)原理過(guò)程解析

這里的I、S和M狀態(tài)已經(jīng)有了對(duì)應(yīng)的概念：失效/未載入、干凈以及臟的緩存段。所以這里新的知識(shí)點(diǎn)只有E狀態(tài)，代表獨(dú)占式訪問(wèn)，這個(gè)狀態(tài)解決了'在我們開(kāi)始修改某塊內(nèi)存之前，我們需要告訴其它處理器'這一問(wèn)題：只有當(dāng)緩存行處于E或者M(jìn)狀態(tài)時(shí)，處理器才能去寫它，也就是說(shuō)只有在這兩種狀態(tài)下，處理器是獨(dú)占這個(gè)緩存行的。當(dāng)處理器想寫某個(gè)緩存行時(shí)，如果它沒(méi)有獨(dú)占權(quán)，它必須先發(fā)送一條'我要獨(dú)占權(quán)'的請(qǐng)求給總線，這會(huì)通知其它處理器把它們擁有的同一緩存段的拷貝失效（如果有）。只有在獲得獨(dú)占權(quán)后，處理器才能開(kāi)始修改數(shù)據(jù)----并且此時(shí)這個(gè)處理器知道，這個(gè)緩存行只有一份拷貝，在我自己的緩存里，所以不會(huì)有任何沖突。

反之，如果有其它處理器想讀取這個(gè)緩存行（馬上能知道，因?yàn)橐恢痹谛崽娇偩€），獨(dú)占或已修改的緩存行必須先回到'共享'狀態(tài)。如果是已修改的緩存行，那么還要先把內(nèi)容回寫到內(nèi)存中。

由lock指令回看volatile變量讀寫

相信有了上面對(duì)于lock的解釋，volatile關(guān)鍵字的實(shí)現(xiàn)原理應(yīng)該是一目了然了。首先看一張圖：

Java Volatile關(guān)鍵字實(shí)現(xiàn)原理過(guò)程解析

工作內(nèi)存Work Memory其實(shí)就是對(duì)CPU寄存器和高速緩存的抽象，或者說(shuō)每個(gè)線程的工作內(nèi)存也可以簡(jiǎn)單理解為CPU寄存器和高速緩存。

那么當(dāng)寫兩條線程Thread-A與Threab-B同時(shí)操作主存中的一個(gè)volatile變量i時(shí)，Thread-A寫了變量i，那么：

Thread-A發(fā)出LOCK#指令發(fā)出的LOCK#指令鎖總線（或鎖緩存行），同時(shí)讓Thread-B高速緩存中的緩存行內(nèi)容失效Thread-A向主存回寫最新修改的i

Thread-B讀取變量i，那么：

Thread-B發(fā)現(xiàn)對(duì)應(yīng)地址的緩存行被鎖了，等待鎖的釋放，緩存一致性協(xié)議會(huì)保證它讀取到最新的值

由此可以看出，volatile關(guān)鍵字的讀和普通變量的讀取相比基本沒(méi)差別，差別主要還是在變量的寫操作上。

以上就是本文的全部?jī)?nèi)容，希望對(duì)大家的學(xué)習(xí)有所幫助，也希望大家多多支持好吧啦網(wǎng)。

Java

上一條：Java synchronize底層實(shí)現(xiàn)原理及優(yōu)化下一條：Java Map接口及其實(shí)現(xiàn)類原理解析

相關(guān)文章：

1. idea設(shè)置提示不區(qū)分大小寫的方法2. HTTP協(xié)議常用的請(qǐng)求頭和響應(yīng)頭響應(yīng)詳解說(shuō)明（學(xué)習(xí)）3. .NET SkiaSharp 生成二維碼驗(yàn)證碼及指定區(qū)域截取方法實(shí)現(xiàn)4. 原生JS實(shí)現(xiàn)記憶翻牌游戲5. django創(chuàng)建css文件夾的具體方法6. css代碼優(yōu)化的12個(gè)技巧7. CentOS郵件服務(wù)器搭建系列—— POP / IMAP 服務(wù)器的構(gòu)建（ Dovecot ）8. Django使用HTTP協(xié)議向服務(wù)器傳參方式小結(jié)9. IntelliJ IDEA創(chuàng)建web項(xiàng)目的方法10. ASP.NET MVC通過(guò)勾選checkbox更改select的內(nèi)容

排行榜

					
					idea設(shè)置提示不區(qū)分大小寫的方法
.NET SkiaSharp 生成二維碼驗(yàn)證碼及指定區(qū)域截取方法實(shí)現(xiàn)
HTTP協(xié)議常用的請(qǐng)求頭和響應(yīng)頭響應(yīng)詳解說(shuō)明（學(xué)習(xí)）
django創(chuàng)建css文件夾的具體方法
docker容器調(diào)用yum報(bào)錯(cuò)的解決辦法
css代碼優(yōu)化的12個(gè)技巧
IntelliJ IDEA創(chuàng)建web項(xiàng)目的方法
Django使用HTTP協(xié)議向服務(wù)器傳參方式小結(jié)
CentOS郵件服務(wù)器搭建系列—— POP / IMAP 服務(wù)器的構(gòu)建（ Dovecot ）
ASP.NET MVC通過(guò)勾選checkbox更改select的內(nèi)容
原生JS實(shí)現(xiàn)記憶翻牌游戲