Effective Java Item87 - 考慮使用自己定義的序列化

October 03, 2017

這篇是Effective Java - Consider using a custom serialized form章節的讀書筆記本篇的程式碼來自於原書內容

在看這篇文章之前強烈建議先看過序列化基本知識

Item87: 考慮使用自己定義的序列化形式

Item86講到當你宣告一個class有實作序列化他就必須永遠支援序列化所以非經過謹慎地思考之前不要輕易地使用預設的序列化方式你需要從靈活性性能正確性下手比較

且當你自己寫出來的跟default的一樣你才可以用default的序列化

通常什麼情況下需要用default的序列化呢就是一個class的物理表示法跟邏輯內容相同

比如說下面這個例子

// Good candidate for default serialized form
public class Name implements Serializable {
  /**
  * Last name. Must be non-null.
  * @serial
  */
  private final String lastName;
  /**
  * First name. Must be non-null.
  * @serial
  */
  private final String firstName;
  /**
  * Middle name, or null if there is none.
  * @serial
  */
  private final String middleName;
  ... // Remainder omitted
}

邏輯上來說一個名字包含三個String 物理上來說就是三個String 這種沒什麼爭議的東西就可以用default的序列化

但如果是下面這個例子

public final class StringList implements Serializable {
  private int size = 0;
  private Entry head = null;
  private static class Entry implements Serializable {
    String data;
    Entry next;
    Entry previous;
  }
  ... // Remainder omitted
}

這是一個String的List但他用double-linked list實作那他的物理表示就跟邏輯內容不同

當物理表示跟邏輯內容不同時而你卻還是想用預設的序列化時有下列四個缺點

1.這個class的API永遠被當前的內部表示法束縛

已剛剛的例子來說 private的Entry變成了API的一部分即使之後的版本不再用linkedlist實踐你的input還是永遠是linkedinlist

2.消耗過多空間

以剛剛的例子來說序列化除了記錄每個element之外還會序列化所有實作的細節比如說linkedlist 這些都非必要會讓序列化完的byte stream過大傳輸浪費

3.消耗過多時間

序列化對於原本的圖形沒有概念通常需要經過昂貴的traversal

4.導致stack overflow

預設的序列化會跑一個recursive traversal消耗很多空間在序列化的過程中可能就會把你的stack用完

所以比較好的物理表達就是先來一個 string數量再接其他的string 這樣物理表示跟邏輯內容就一樣所以當你自己實作序列化時就該這麼做

public final class StringList implements Serializable {
  private transient int size = 0;
  private transient Entry head = null;

  // No longer Serializable!
  private static class Entry {
    String data;
    Entry next;
    Entry previous;
  }

  // Appends the specified string to the list
  public final void add(String s) {
    // Implementation omitted
  }
  private void writeObject(ObjectOutputStream s) throws IOException {
    s.defaultWriteObject();
    s.writeInt(size);

    for (Entry e = head; e != null; e = e.next)
    	s.writeObject(e.data);
  }
  private void readObject(ObjectInputStream s) throws IOException, ClassNotFoundException {
    s.defaultReadObject();
    int numElements = s.readInt();

    for (int i = 0; i < numElements; i++)
    	add((String) s.readObject());
  }
}

注意當我們反序列化這個StringList的時候我們並不需要size跟head 因為我們都是從0開始建這個StringList 所以這兩個變數都是trasient 代表說這兩個值不需要被儲存起來

那當我所有的instance variable都是trasient的時候理論上我的readObject跟writeObject是不需要call defaultReadObject跟defaultWriteObject的但作者給的建議還是call一下比較好原因有點複雜借我30秒

倒數計時

如果你因為所有的instance variable都是transient就不call defaultReadObject/defaultWriteObject的話如果你下一個版本增加了一個non-transient的變數那麼可能發生一種情況

你的object在一個拿著新版的JVM中被序列化但在一個拿著舊版的JVM中被反序列化那你的那個新的non-transient變數會被忽略因為你舊版的那個class的readObject中沒有defaultReadObject

看不懂的跳過也沒關係你就記得always要呼叫defaultReadObject/defaultWriteObject就對了

計時結束

對於StringList的例子用預設的序列化只是不適合而已你真的要用也可以但在某些時候你用預設的就真的會爆

比如說一個Hash table 每一個item應該放在哪一個bucket是透過一個hash function 不妙的是這個hash function在不同的JVM可能不一樣即使用同一個JVM也不能保證每次都會用同一個函數所以你用預設的序列化和反序列化可能會還原出完全不一樣的東西

盡可能地讓你的變數是transient

每一個你的instance variable都應該仔細想想能不能是transient 代表說你需要序列化的東西越少越好把所有能transient的都transient之後呢要注意反序列化之後那些變數都會是那些資料型態的預設值無法接受預設值的話你就必須有個readObject 裡面先defaultReadOject之後再來assign你的變數初始值

private void readObject(ObjectInputStream s) throws IOException, ClassNotFoundException {
  s.defaultReadObject();
  //assign initial value for transient variables  
}

總結

當你決定要實作序列化之後盡可能的自己定義如何序列化你也應該花足夠多的時間來決定你怎麼序列化才能合理的描述物件狀態因為一個錯誤的序列化對於一個class的複雜性和性能會有永久的負面影響

jyt0532's Blog

Effective Java Item87 - 考慮使用自己定義的序列化

Item87: 考慮使用自己定義的序列化形式

倒數計時

計時結束

盡可能地讓你的變數是transient

總結

相關文章

jyt0532's Blog

Effective Java Item87 - 考慮使用自己定義的序列化

Item87: 考慮使用自己定義的序列化形式

倒數計時

計時結束

盡可能地讓你的變數是transient

總結

相關文章

Effective Java Item5 - 依賴注入優於硬連接資源 17 Mar 2020

Effective Java Item31 - 利用限制通配符來提昇API靈活性 23 Dec 2018

到底 <T extends Comparable<? super T>>是什麼意思 23 Dec 2018

類型參數和通配符的選擇 23 Dec 2018