<menu id="guoca"></menu>
<nav id="guoca"></nav><xmp id="guoca">
  • <xmp id="guoca">
  • <nav id="guoca"><code id="guoca"></code></nav>
  • <nav id="guoca"><code id="guoca"></code></nav>

    圖文并茂:JVM 內存布局詳解

    VSole2022-08-18 17:26:27

    內存布局

    JVM內存布局規定了Java在運行過程中內存申請、分配、管理的策略,保證了JVM的穩定高效運行。不同的JVM對于內存的劃分方式和管理機制存在部分差異。結合JVM虛擬機規范,一起來探討jVM的內存布局。如下圖所示:

    Heap 堆區

    Heap堆區是Java發生OOM(Out Of Memory)故障的地方,堆中存儲著我們平時創建的實例對象,最終這些不再使用的對象會被垃圾收集器回收掉,而且堆是線程共享的。一般情況下,堆所占用的內存空間是JVM內存區域中最大的,我們在平時編碼中,創建對象如果不加以克制,內存空間也會被耗盡。

    堆的內存空間是可以自定義大小的,同時也支持在運行時動態修改,通過 -Xms-Xmx 這兩參數去改變堆的初始值最大值-X指的是JVM運行參數,ms 是memory start的簡稱,代表的是最小堆容量mx是memory max的簡稱,代表的是最大堆容量;如 -Xms256M代表堆的初始值是256M,-Xmx1024M代表堆的最大值是1024M。

    由于堆的內存空間是可以動態調整的,所以在服務器運行的時候,請求流量的不確定性可能會導致我們堆的內存空間不斷調整,會增加服務器的壓力,所以我們一般都會將JVM的XmsXmx的值設置成一樣,同樣也為了避免在GC(垃圾回收)之后調整堆大小時帶來的額外壓力。

    堆區分為兩大區:Young區和Old區,又稱新生代老年代。對象剛創建的時候,會被創建在新生代到一定階段之后會移送至老年代,如果創建了一個新生代無法容納的新對象,那么這個新對象也可以創建到老年代。如上圖所示。

    新生代分為1個Eden區和2個S區,S代表Survivor。大部分的對象會在Eden區中生成,當Eden區沒有足夠的空間容納新對象時,會觸發Young Garbage Collection,即YGC。在Eden區進行垃圾清除時,它的策略是會把沒有引用的對象直接給回收掉,還有引用的對象會被移送到Survivor區

    Survivor區有S0S1兩個內存空間,每次進行YGC的時候,會將存活的對象復制到未使用的那塊內存空間,然后將當前正在使用的空間完全清除掉,再交換兩個空間的使用狀況。如果YGC要移送的對象Survivor區無法容納,那么就會將該對象直接移交給老年代。

    上面說了,到一定階段的對象會移送到老年區,這是什么意思呢?每一個對象都有一個計數器,當每次進行YGC的時候,都會 +1。通過-XX:MAXTenuringThrehold參數可以配置當計數器的值到達某個閾值時,對象就會從新生代移送至老年代。

    該參數的默認值為15,也就是說對象在Survivor區中的S0和S1內存空間交換的次數累加到15次之后,就會移送至老年代。如果參數配置為1,那么創建的對象就會直接移送至老年代。具體的對象分配即回收流程可觀看下圖所示。

    如果Survivor區無法放下,或者創建了一個超大新對象,EdenOld區都無法存放,就會觸發Full Garbage Collection,即FGG,便再嘗試放在Old區,如果還是容納不了,就會拋出OOM異常。在不同的JVM實現及不同的回收機制中,堆內存的劃分方式是不一樣的。

    Metaspace 元空間

    在JDK8版本中,元空間的前身Pern區已經被淘汰。在JDK7及之前的版本中,Hotspot還有Pern區,翻譯為永久代,在啟動時就已經確定了大小,難以進行調優,并且只有FGC時會移動類元信息。不同于之前版本的Pern(永久代),JDK8的元空間已經在本地內存中進行分配,并且,Pern區中的所有內容中字符串常量移至堆內存,其他內容也包括了類元信息字段靜態屬性方法常量等等都移至元空間內。

    JVM Stacks 虛擬機棧

    棧(Stack)是一個先進后出的數據結構,先進后出怎么理解?類似于我們平時打羽毛球時,裝羽毛球的球筒,第一個先放進去的往往最后一個才能拿出來,最后放進去的一個最先拿出來。

    相對于基于寄存器的運行環境來說,JVM是基于棧結構的運行環境。因為棧結構移植性更好,可控性更強。JVM的虛擬機棧是描述Java方法執行的內存區域,并且是線程私有的。棧中的元素用于支持虛擬機進行方法調用,每個方法從開始調用到執行完成的過程,就是棧幀從入幀到出幀的過程。

    在活動線程中,只有位于棧頂的幀才是有效的,稱為當前棧幀。正在執行的方法稱為當前方法,棧幀是方法運行的基本結構。在執行引擎運行時,所有指令都只能針對當前棧幀進行操作。而StackOverflowError表示請求的棧溢出,導致內存耗盡,通常出現在遞歸方法中。如果把JVM當做一個棋盤,虛擬機棧就是棋盤上的將/帥,當前方法的棧幀就是棋子能走的區域,而操作棧就是每一個棋子。操作棧的壓棧和出棧如下圖所示:

    虛擬機棧通過壓棧出棧的方式,對每個方法對應的活動棧幀進行運算處理,方法正常執行結束,肯定會跳轉到另外一個棧幀上。在執行的過程中,如果出現異常,會進行異常回溯,返回地址通過異常處理表確定。棧幀在整個JVM體系中的地位頗高,包括局部變量表操作棧動態連接方法返回地址等。

    下面對棧幀的各個活動棧幀進行簡要的分析

    (1)局部變量表

    局部變量表是存放方法參數局部變量的區域。我們都知道,類屬性變量一共要經歷兩個階段,分為準備階段初始化階段,而局部變量是沒有準備階段,只有初始化階段,而且必須是顯示的。如果是非靜態方法,則在index[0]位置上存儲的是方法所屬對象的實例引用,隨后存儲的是參數局部變量。字節碼指令中的STORE指令就是將操作棧中計算完成的局部變量寫回局部變量表的存儲空間內

    (2)操作棧

    操作棧是一個初始狀態為空的桶式結構棧。在方法執行過程中,會有各種指令往棧中寫入和提取信息。JVM的執行引擎是基于棧的執行引擎,其中的棧指的就是操作棧。字節碼指令集的定義都是基于棧類型的,棧的深度在方法元信息的stack屬性中,下面就通過一個例子來說明下操作棧與局部變量表的交互:

    public int add() {
        int x = 10;
        int y = 20;
        int z = x + y;
        return z;
    }
    

    字節碼操作順序如下:

    public int add();
      Code:
         0: bipush        10 // 常量 10 壓入操作棧
         2: istore_1     // 并保存到局部變量表的 slot_1 中  (第 1 處)
         3: bipush        20 // 常量 20 壓入操作棧
         5: istore_2     // 并保存到局部變量表的 slot_2 中
         6: iload_1      // 把局部變量表的 slot_1 元素(int x)壓入操作棧
         7: iload_2      // 把局部變量表的 slot_2 元素(int y)壓入操作棧
         8: iadd      // 把上方的兩個數都取出來,在 CPU 里加一下,并壓回操作棧的棧頂
         9: istore_3     // 把棧頂的結果存儲到局部變量表的 slot_3 中
        10: iload_3
        11: ireturn      // 返回棧頂元素值
    

    第 1 處說明:局部變量表就像一個快遞柜,有著很多的柜子,依次編號為1,2,3,...,n,字節碼指令 istore_1 就代表打開了 1 號柜子,再把棧頂中的值 10 存進去。棧就好如一個桶,任何時候只能對桶口的元素進行操作,所以數據只能在棧頂進行存取。部分指令可以直接在柜子里面直接進行,比如 iinc指令,直接對抽屜里的數值進行 +1操作。我們經常遇到的 i++ 和 ++i,通過字節碼對比起來,答案一下子就一目了然了。如下表格所示:

    左列中,iload_1 從局部變量表的第1號柜子取出一個數,壓入棧頂,下一步直接在柜子里實現 + 1的操作,而這個操作時對棧頂元素的值沒有任何影響,所以 istore_2 只是把棧頂元素賦值給 a,而右列,它是先在柜子里面進行 +1的操作,然后再通過 iload_1 把第1號柜子里的數壓入棧頂,所以istore_2賦給a的值是 +1 之后的值。擴展下,i++ 并非是原子操作。即使通過volatile關鍵字來修飾,多線程情況下,還是會出現數據互相覆蓋的情況。

    (3)動態連接

    每個棧幀中包含一個在常量池中對當前方法的引用,目的是支持方法調用過程的動態連接

    (4)方法返回地址

    方法執行時有兩種退出情況:第一,正常退出,即正常執行到任何方法的返回字節碼指令,如 RETURNIRETURNARETURN等;第二,異常退出。無論何種退出情況,都將返回方法當前被調用的位置。方法退出的過程相當于彈出當前棧幀,而退出可能有三種方式:

    • 返回值壓入上層調用棧幀。
    • 異常信息拋給能夠處理的棧幀。
    • PC 計數器指向方法調用后的下一條指令。

    Native Method Stacks(本地方法棧)

    本地方法棧(Native Method Stack)在JVM內存布局中,也是線程對象私有的,但是虛擬機棧“主內”,而本地方法棧“主外”。這個“內外”是針對JVM來說的,本地方法棧為Native方法服務。線程開始調用本地方法時,會進入一個不再受JVM約束的世界。本地方法可以通過JVNI(Java Native Interface)來訪問虛擬機運行時的數據區,甚至可以調用寄存器,具有和JVM相同的能力和權限。當大量本地方法出現時,勢必會削弱JVM對系統的控制力,因為它的出錯信息都比較黑盒,難以捉摸。對于內存不足的情況,本地方法棧還是會拋出 native heap OutOfMemory

    重點說下JNI類本地方法,最常用的本地方法應該是System.currentTimeMills()JNI使Java深度使用操作系統的特性功能,復用非Java代碼。但是在項目過程中,如果大量使用其他語言來實現JNI,就會喪失跨平臺特性,威脅到程序運行的穩定性。假如需要與本地代碼交互,就可以用中間標準框架來進行解耦,這樣即使本地方法崩潰也不至于影響到JVM的穩定。

    Program Counter Register (程序計數寄存器)

    在程序計數寄存器(Program Counter Register,PC)中,Register的命名源于CPU的寄存器,CPU只有把數據裝載到寄存器才能夠運行。寄存器存儲指令相關的現場信息,由于CPU時間片輪限制,眾多線程在并發執行過程中,任何一個確定的時刻,一個處理器或者多核處理器中的一個內核,只會執行某個線程中的一個指令。

    這樣必然會導致經常中斷或恢復,如何才能保證分毫無差呢?每個線程在創建之后,都會產生自己的程序計數器棧幀程序計數器用來存放執行指令的偏移量和行號指示器等,線程執行或恢復都要依賴程序計數器程序計數器在各個線程之間互不影響,此區域也不會發生內存溢出異常

    小結

    最后,從線程的角度來看,堆和元空間是所有線程共享的,而虛擬機棧、本地方法棧、程序計數器是線程內部私有的,我們以線程的角度再來看看Java的內存結構圖:

    局部變量jvm
    本作品采用《CC 協議》,轉載必須注明作者和本文鏈接
    堆區分為兩大區:Young區和Old區,又稱新生代和老年代。在不同的JVM實現及不同的回收機制中,堆內存的劃分方式是不一樣的。相對于基于寄存器的運行環境來說,JVM是基于棧結構的運行環境。在活動線程中,只有位于棧頂的幀才是有效的,稱為當前棧幀。正在執行的方法稱為當前方法,棧幀是方法運行的基本結構。在執行引擎運行時,所有指令都只能針對當前棧幀進行操作。而StackOverflowError表示請求的棧溢出,導致內存耗盡,通常出現在遞歸方法中。
    無論對于Java程序員還是大數據研發人員,JVM是必須掌握的技能之一。Java提供的GC功能可以自動監測對象是否超過作用域等從而達到自動回收內存的目的,可以有效防止內存泄露,有效的使用可用內存。
    Java 8 的內存結構
    2022-03-10 14:37:13
    java8內存結構圖虛擬機內存與本地內存的區別Java虛擬機在執行的時候會把管理的內存分配成不同的區域,這些
    JSP Webshell的檢測工具
    2021-12-13 12:04:53
    在11月初,我做了一些JSP Webshell的免殺研究,主要參考了三夢師傅開源的代碼。然后加入了一些代碼混淆手段,編寫了一個免殺馬生成器JSPHorse,沒想到在Github上已收獲500+的Star
    Java作為解釋型的語言,其高度抽象的特性意味其很容易被反編譯,容易被反編譯,自然有防止反編譯措施存在。
    介紹實戰中由于各種情況,可能會對反序列化Payload的長度有所限制,因此研究反序列化Payload縮小技術是有意義且必要的本文以CommonsBeanutils1鏈為示例,
    Java線程安全:狹義地認為是多線程之間共享數據的訪問。 Java語言中各種操作共享的數據有5種類型:不可變、絕對線程安全、相對線程安全、線程兼容、線程獨立
    棧與棧幀的調試
    2022-03-06 16:24:19
    再次執行pop EAX,ESP的值增加4個字節,變為0012FFC4。OD狀態變成最開始的狀態。
    結構&拷貝與引用
    2023-05-10 11:27:04
    結構&拷貝與引用開始之前,我們約定數據塊也叫插槽,也就是storage。storage是永久存儲在區塊鏈上的地方。Stack 的最大深度為 1024 個元素,支持 256 位的字長。結構當定義局部變量時,它存儲在內存中,然后壓入堆棧以執行。1024棧深簡介EVM不是寄存器機而是堆棧機,所以所有的計算都在稱為堆棧的數據區域上進行。1024 是一個非常保守的值,以盡可能安全EVM 的設計方式往往會使更大的堆棧變得無用。EVM 只能訪問堆棧中前16個slot。
    mruby是一個Ruby語言的輕量級實現,mruby工作方式類似CPython,它可以將Ruby源碼編譯為字節碼,再在虛擬機中解釋運行。
    VSole
    網絡安全專家
      亚洲 欧美 自拍 唯美 另类