詳解Java編譯優(yōu)化之循環(huán)展開和粗化鎖
我們先來回顧一下什么是循環(huán)展開。
循環(huán)展開就是說,像下面的循環(huán)遍歷的例子:
for (int i = 0; i < 1000; i++) { x += 0x51;}
因?yàn)槊看窝h(huán)都需要做跳轉(zhuǎn)操作,所以為了提升效率,上面的代碼其實(shí)可以被優(yōu)化為下面的:
for (int i = 0; i < 250; i++) { x += 0x144; //0x51 * 4}
注意上面我們使用的是16進(jìn)制數(shù)字,至于為什么要使用16進(jìn)制呢?這是為了方便我們?cè)诤竺娴腶ssembly代碼中快速找到他們。
好了,我們?cè)僭?x += 0x51 的外面加一層synchronized鎖,看一下synchronized鎖會(huì)不會(huì)隨著loop unrolling展開的同時(shí)被粗化。
for (int i = 0; i < 1000; i++) { synchronized (this) {x += 0x51; }}
萬事具備,只欠我們的運(yùn)行代碼了,這里我們還是使用JMH來執(zhí)行。
相關(guān)代碼如下:
@Warmup(iterations = 10, time = 1, timeUnit = TimeUnit.SECONDS)@Measurement(iterations = 5, time = 1, timeUnit = TimeUnit.SECONDS)@Fork(value = 1,jvmArgsPrepend = {'-XX:-UseBiasedLocking','-XX:CompileCommand=print,com.flydean.LockOptimization::test'})@State(Scope.Benchmark)@BenchmarkMode(Mode.AverageTime)@OutputTimeUnit(TimeUnit.NANOSECONDS)public class LockOptimization { int x; @Benchmark @CompilerControl(CompilerControl.Mode.DONT_INLINE) public void test() {for (int i = 0; i < 1000; i++) { synchronized (this) {x += 0x51; }} } public static void main(String[] args) throws RunnerException {Options opt = new OptionsBuilder().include(LockOptimization.class.getSimpleName()).build();new Runner(opt).run(); }}
上面的代碼中,我們?nèi)∠似蜴i的使用:-XX:-UseBiasedLocking。為啥要取消這個(gè)選項(xiàng)呢?因?yàn)槿绻谄蜴i的情況下,如果線程獲得鎖之后,在之后的執(zhí)行過程中,如果沒有其他的線程訪問該鎖,那么持有偏向鎖的線程則不需要觸發(fā)同步。
為了更好的理解synchronized的流程,這里我們將偏向鎖禁用。
其他的都是我們之前講過的JMH的常規(guī)操作。
接下來就是見證奇跡的時(shí)刻了。
分析Assembly日志我們運(yùn)行上面的程序,將會(huì)得到一系列的輸出。因?yàn)楸疚牟⒉皇侵v解Assembly語言的,所以本文只是大概的理解一下Assembly的使用,并不會(huì)詳細(xì)的進(jìn)行Assembly語言的介紹,如果有想深入了解Assembly的朋友,可以在文后留言。
分析Assembly的輸出結(jié)果,我們可以看到結(jié)果分為C1-compiled nmethod和C2-compiled nmethod兩部分。
先看C1-compiled nmethod:
第一行是monitorenter,表示進(jìn)入鎖的范圍,后面還跟著對(duì)于的代碼行數(shù)。
最后一行是monitorexit,表示退出鎖的范圍。
中間有個(gè)add $0x51,%eax操作,對(duì)于著我們的代碼中的add操作。
可以看到C1—compiled nmethod中是沒有進(jìn)行Loop unrolling的。
我們?cè)倏纯碈2-compiled nmethod:
和C1很類似,不同的是add的值變成了0x144,說明進(jìn)行了Loop unrolling,同時(shí)對(duì)應(yīng)的鎖范圍也跟著進(jìn)行了擴(kuò)展。
最后看下運(yùn)行結(jié)果:
Benchmark Mode Cnt Score Error Units
LockOptimization.test avgt 5 5601.819 ± 620.017 ns/op
得分還不錯(cuò)。
禁止Loop unrolling接下來我們看下如果將Loop unrolling禁掉,會(huì)得到什么樣的結(jié)果。
要禁止Loop unrolling,只需要設(shè)置-XX:LoopUnrollLimit=1即可。
我們?cè)龠\(yùn)行一下上面的程序:
可以看到C2-compiled nmethod中的數(shù)字變成了原本的0x51,說明并沒有進(jìn)行Loop unrolling。
再看看運(yùn)行結(jié)果:
Benchmark Mode Cnt Score Error Units
LockOptimization.test avgt 5 20846.709 ± 3292.522 ns/op
可以看到運(yùn)行時(shí)間基本是優(yōu)化過后的4倍左右。說明Loop unrolling還是非常有用的。
以上就是詳解Java編譯優(yōu)化之循環(huán)展開和粗化鎖的詳細(xì)內(nèi)容,更多關(guān)于Java編譯優(yōu)化之循環(huán)展開和粗化鎖的資料請(qǐng)關(guān)注好吧啦網(wǎng)其它相關(guān)文章!
相關(guān)文章:
1. IntelliJ IDEA創(chuàng)建web項(xiàng)目的方法2. CentOS郵件服務(wù)器搭建系列—— POP / IMAP 服務(wù)器的構(gòu)建( Dovecot )3. ASP中實(shí)現(xiàn)字符部位類似.NET里String對(duì)象的PadLeft和PadRight函數(shù)4. django創(chuàng)建css文件夾的具體方法5. 存儲(chǔ)于xml中需要的HTML轉(zhuǎn)義代碼6. Android打包上傳AAR文件到Maven倉庫的示例7. .NET SkiaSharp 生成二維碼驗(yàn)證碼及指定區(qū)域截取方法實(shí)現(xiàn)8. MyBatis JdbcType 與Oracle、MySql數(shù)據(jù)類型對(duì)應(yīng)關(guān)系說明9. phpstudy apache開啟ssi使用詳解10. jsp網(wǎng)頁實(shí)現(xiàn)貪吃蛇小游戲
