Java String不可變性實現原理解析
一、原理
1、不變模式(不可變對象)
在并行軟件開發過程中,同步操作似乎是必不可少的。當多線程對同一個對象進行讀寫操作時,為了保證對象數據的一致性和正確性,有必要對對象進行同步。而同步操作對系統性能是相當的損耗。為了能盡可能的去除這些同步操作,提高并行程序性能,可以使用一種不可改變的對象,依靠對象的不變性,可以確保其在沒有同步操作的多線程環境中依然始終保持內部狀態的一致性和正確性。這就是不變模式。
不變模式天生就是多線程友好的,它的核心思想是,一個對象一旦被創建,則它的內部狀態將永遠不會發生改變。所以,沒有一個線程可以修改其內部狀態和數據,同時其內部狀態也絕不會自行發生改變。基于這些特性,對不變對象的多線程操作不需要進行同步控制。
同時還需要注意,不變模式和只讀屬性是有一定的區別的,不變模式是比讀屬性具有更強的一致性和不變性。對只讀屬性的對象而言,對象本身不能被其他線程修改,但是對象身狀態卻可能自行修改比如,一個對象的存活時間(對象創建時間和當前時間的時間差)是只讀的,因為任何個第三方線程都不能修改這個屬性,但是這是一個可變的屬性,因為隨著時間的推移,存活時司時刻都在發生變化。而不變模式則要求,無論出于什么原因,對象自創建后,其內部狀態和數據保持絕對的穩定。
2、怎么實現不可變對象
在Java語言中,不變模式的實現很簡單。為確保對象被創建后,不發生任何改變,并保證不變模式正常工作,只需要注意以下4點:
去除 setter方法以及所有修改自身屬性的方法。 將所有屬性設置為私有,并用final標記,確保其不可修改 確保沒有子類可以重載修改它的行為。 有一個可以創建完整對象的構造函數。是不是和final的功能很吻合。我們復習一下java中final的作用。
final修飾類,表示該類不能被繼承,俗稱斷子絕孫類,該類的所有方法自動地成為final方法 final修飾方法,表示子類不可重寫該方法 final修飾基本數據類型變量,表示該變量為常量,值不能再修改 final修飾引用類型變量,表示該引用在構造對象之后不能指向其他的對象,但該引用指向的對象的狀態可以改變這里需要說明的是:當使用final修飾基本類型變量時,不能對基本類型變量重新賦值,因此基本類型變量不能被改變。但對于引用類型變量而言,它保存的僅僅是一個引用,final只保證這個引用變量所引用的地址不會改變,即一直引用同一個對象,但這個對象完全可以發生改變。例如某個指向數組的final引用,它必須從此至終指向初始化時指向的數組,但是這個數組的內容完全可以改變。
二、String源碼分析
以下是jdk1.8中String類的部分源碼。
public final class String implements java.io.Serializable, Comparable<String>, CharSequence { /** The value is used for character storage. */ private final char value[]; /** Cache the hash code for the string */ private int hash; // Default to 0 /** use serialVersionUID from JDK 1.0.2 for interoperability */ private static final long serialVersionUID = -6849794470754667710L; /** ...}
首先可以看到,String類使用了final修飾符,表明String類是不可繼承的。然后,我們主要關注String類的成員變量value,value是char[]類型,因此String對象實際上是用這個字符數組進行封裝的。
再看value的修飾符,使用了private,也沒有提供setter方法,所以在String類的外部不能修改value,同時value也使用了final進行修飾,那么在String類的內部也不能修改value,也就是說value一旦賦予初始值之后,value指向的地址就不能再改變了。但是上面final修飾引用類型變量的內容提到,這只能保證value不能指向其他的對象,但value指向的對象的狀態是可以改變的。
通過查看String類源碼可以發現,String類不可變,關鍵是因為SUN公司的工程師,在后面所有String的方法里都很小心的沒有去動字符數組里的元素。所以String類不可變的關鍵都在底層的實現,而不僅僅是一個final。
三、修改String使其“可變”
雖然value是final修飾的,只是說明value不能再重新指向其他的引用。但是value指向的數組可以改變,一般情況下我們是沒有辦法訪問到這個value指向的數組的元素。But,反射,對,反射可以,牛逼吧。可以反射出String對象中的value屬性, 進而改變通過獲得的value引用改變數組的結構。
public static void main(String[] args) throws Exception { String str = 'Hello World'; System.out.println('修改前的str:' + str); System.out.println('修改前的str的內存地址' + System.identityHashCode(str)); // 獲取String類中的value字段 Field valueField = String.class.getDeclaredField('value'); // 改變value屬性的訪問權限 valueField.setAccessible(true); // 獲取str對象上value屬性的值 char[] value = (char[]) valueField.get(str); // 改變value所引用的數組中的字符 value[3] = ’?’; System.out.println('修改后的str:' + str); System.out.println('修改前的str的內存地址' + System.identityHashCode(str));}// 運行結果// 可以看到str的字符串序列已經被改變了,但是str的內存地址還是沒有改變。修改前的str:Hello World修改前的str的內存地址1922154895修改后的str:Hel?o World修改前的str的內存地址1922154895
四、String設計成不可變性的原因
在Java中,將String設計成不可變的是綜合考慮到內存、同步、數據結構及安全等各種因素的結果,下文將為各種因素做一個小結。
1、運行時常量池的需要
比如執行 String s = 'abc';執行上述代碼時,JVM首先在運行時常量池中查看是否存在String對象“abc”,如果已存在該對象,則不用創建新的String對象“abc”,而是將引用s直接指向運行時常量池中已存在的String對象“abc”;如果不存在該對象,則先在運行時常量池中創建一個新的String對象“abc”,然后將引用s指向運行時常量池中創建的新String對象。這樣在運行時常量池中只會創建一個String對象'abc',這樣就節省了內存空間。
2、同步
因為String對象是不可變的,所以是多線程安全的,同一個String實例可以被多個線程共享。這樣就不用因為線程安全問題而使用同步。
3、允許String對象緩存hashcode
查看上文JDK1.8中String類源碼,可以發現其中有一個字段hash,String類的不可變性保證了hashcode的唯一性,所以可以用hash字段對String對象的hashcode進行緩存,就不需要每次重新計算hashcode。所以Java中String對象經常被用來作為HashMap等容器的鍵。
4、安全性
如果String對象是可變的,那么會引起很嚴重的安全問題。比如,數據庫的用戶名、密碼都是以字符串的形式傳入來獲得數據庫的連接,或者在socket編程中,主機名和端口都是以字符串的形式傳入。因為String對象是不可變的,所以它的值是不可改變的,否則黑客們可以鉆到空子,改變String引用指向的對象的值,造成安全漏洞。
以上就是本文的全部內容,希望對大家的學習有所幫助,也希望大家多多支持好吧啦網。
相關文章:
