Categories
程式開發

Java中的String到底佔用多大的內存空間?你所了解的可能都是錯誤的! !


寫在前面

最近小伙伴加群時,我總是問一個問題:Java中的String類占用多大的內存空間?很多小伙伴的回答著實讓我哭笑不得,有說不佔空間的,有說1個字節的,有說2個字節的,有說3個字節的,有說不知道的,更讓人哭笑不得的是竟然還有人說是2的31次方。那如果真是這樣的話,服務器的內存空間還放不下一個字符串呀!作為程序員的我們,可不能鬧這種笑話呀。今天,我們就一起來聊聊Java中的String到底佔用多大的內存空間!

Java對象的結構

首先,我們來下Java對像在虛擬機中的結構,這裡,以HotSpot虛擬機為例。

Java中的String到底佔用多大的內存空間?你所了解的可能都是錯誤的!  ! 7

注:圖片來源http://r6d.cn/wp7q

從上面的這張圖裡面可以看出,對像在內存中的結構主要包含以下幾個部分:

Mark Word(標記字段):對象的Mark Word部分佔4個字節,其內容是一系列的標記位,比如輕量級鎖的標記位,偏向鎖標記位等等。 Klass Pointer(Class對象指針):Class對象指針的大小也是4個字節,其指向的位置是對像對應的Class對象(其對應的元數據對象)的內存地址對象實際數據:這裡麵包括了對象的所有成員變量,其大小由各個成員變量的大小決定,比如:byte和boolean是1個字節,short和char是2個字節,int和float是4個字節,long和double是8個字節,reference是4個字節對齊:最後一部分是對齊填充的字節,按8個字節填充。

換種說法就是:

對像頭(object header):8 個字節(保存對象的class 信息、ID、在虛擬機中的狀態)Java 原始類型數據:如int, float, char 等類型的數據引用(reference):4 個字節填充符(padding)

Java中的String類型

空String佔用的空間

這裡,我們以Java8為例進行說明。首先,我們來看看String類中的成員變量。

/** The value is used for character storage. */
private final char value[];

/** Cache the hash code for the string */
private int hash; // Default to 0

/** use serialVersionUID from JDK 1.0.2 for interoperability */
private static final long serialVersionUID = -6849794470754667710L;

在Java 里數組也是對象,因此數組也有對像頭。所以,一個數組所佔的空間為對像頭所佔的空間加上數組長度加上數組的引用,即8 + 4 + 4= 16 字節。

所以,我們可以得出一個空String對象所佔用的內存空間,如下所示。

对象头(8 字节)+ 引用 (4 字节 ) + char 数组(16 字节)+ 1个 int(4字节)+ 1个long(8字节)= 40 字节

所以,小伙伴們,你們的回答正確嗎?

非空String佔用的空間

如果String字符串的長度大於0的話,我們也可以得出String佔用內存的計算公式,如下所示。

40 + 2 * n

其中,n為字符串的長度。

這裡,可能有小伙伴會問,為什麼是40 + 2 n 呢?這是因為40是空字符串佔用的內存空間,這個我們上面已經說過了,String類實際上是把數據存儲到char[]這個成員變量數組中的,而char[]數組中的一個char類型的數據佔用2個字節的空間,所以,只是String中的數據就會佔用2 n(n為字符串的長度)個字節的空間,再加上空字符串所佔用的40個字節空間,最終得出一個字符串所佔用的存儲空間為: 40 + 2 * n (n為字符串長度)。

注:40 + 2 * n 這個公式我們可以看成是計算String對象佔用多大內存空間的通用公式。

因此在代碼中大量使用String對象時,應考慮內存的實際佔用情況。

驗證結論

接下來,我們就一起來驗證下我們上面的結論。首先,創建一個UUIDUtils類用來生成32位的UUID,如下所示。

package io.mykit.binghe.string.test;

import java.util.UUID;

/**
* @author binghe
* @version 1.0.0
* @description 生成没有-的UUID
*/
public class UUIDUtils {
public static String getUUID(){
String uuid = UUID.randomUUID().toString();
return uuid.replace("-", "");
}
}

接下來,創建一個TestString類,在main()方法中創建一個長度為4000000的數組,然後在數組中放滿UUID字符串,如下所示。

package io.mykit.binghe.string.test;

import java.util.UUID;

/**
* @author binghe
* @version 1.0.0
* @description 测试String占用的内存空间
*/
public class TestString{
public static void main(String[] args){
String[] strContainer = new String[4000000];
for(int i = 0; i < 4000000; i++){ strContainer[i] = UUIDUtils.getUUID(); System.out.println(i); } //防止程序退出 while(true){ } } }

這裡,4000000個字符串,每個字符串的長度為32,所以保存字符串數據所佔用的內存空間為:(40 + 32 2) 4000000 = 416000000字節,約等於416MB。

我們使用Jprofiler內存分析工具進行分析:

Java中的String到底佔用多大的內存空間?你所了解的可能都是錯誤的!  ! 8

可以看到,使用Jprofiler內存分析工具的結果為:321MB + 96632KB,約等於417MB。之所以使用Jprofiler內存分析工具得出的結果比我們計算的大些,是因為在程序實際運行的過程中,程序內部也會生成一些字符串,這些字符串也會佔用內存空間! !

所以,使用Jprofiler內存分析工具得出的結果符合我們的預期。

好了,今天就到這兒吧,希望小伙伴們能有所收穫,我是冰河,我們下期見! !

重磅福利

微信搜一搜【冰河技術】微信公眾號,關注這個有深度的程序員,每天閱讀超硬核技術乾貨,公眾號內回复【PDF】有我準備的一線大廠面試資料和我原創的超硬核PDF技術文檔,以及我為大家精心準備的多套簡歷模板(不斷更新中),希望大家都能找到心儀的工作,學習是一條時而鬱鬱寡歡,時而開懷大笑的路,加油。如果你通過努力成功進入到了心儀的公司,一定不要懈怠放鬆,職場成長和新技術學習一樣,不進則退。如果有幸我們江湖再見!

另外,我開源的各個PDF,後續我都會持續更新和維護,感謝大家長期以來對冰河的支持! !

寫在最後

如果你覺得冰河寫的還不錯,請微信搜索並關注「 冰河技術」微信公眾號,跟冰河學習高並發、分佈式、微服務、大數據、互聯網和雲原生技術,「 冰河技術」微信公眾號更新了大量技術專題,每一篇技術文章乾貨滿滿!不少讀者已經通過閱讀「 冰河技術」微信公眾號文章,吊打麵試官,成功跳槽到大廠;也有不少讀者實現了技術上的飛躍,成為公司的技術骨幹!如果你也想像他們一樣提升自己的能力,實現技術能力的飛躍,進大廠,升職加薪,那就關注「 冰河技術」微信公眾號吧,每天更新超硬核技術乾貨,讓你對如何提陞技術能力不再迷茫!

Java中的String到底佔用多大的內存空間?你所了解的可能都是錯誤的!  ! 9