Effective Java Item48 - 謹慎使用並行Stream

November 25, 2018

這篇是Effective Java - Use caution when making streams parallel章節的讀書筆記本篇的程式碼來自於原書內容

Item48: 謹慎使用並行Stream

要正確快速的編寫並發程序很難在寫流程序的時候也不例外

public static void main(String... args){
  primes().map(p -> TWO.pow(p.intValueExact()).subtract(ONE))
    .filter(mersenne -> mersenne.isProbablePrime(50))
    .limit(20)
    .forEach(System.out::println);
}

static Stream<BigInteger> primes() {
  return Stream.iterate(TWO, BigInteger::nextProbablePrime);
}

執行這個程式會輸出前20個2^n-1且是質數的數字

要跑出前20個在作者的電腦需要12.5秒但如果我們在Stream的後面呼叫parallel() 會不會比較快呢

public static void main(String... args){
  primes().parallel()
    .map(p -> TWO.pow(p.intValueExact()).subtract(ONE))
    .filter(mersenne -> mersenne.isProbablePrime(50))
    .limit(20)
    .forEach(System.out::println);
}

static Stream<BigInteger> primes() {
  return Stream.iterate(TWO, BigInteger::nextProbablePrime);
}

答案是什麼都不會印出來因為Stream的library不知道怎麼並行化這個pipeline

使用並行時機

如果你的原始數據結構是:

ArrayList、HashMap、HashSet和ConcurrentHashMap, Arrays、int類型範圍的流和long類型的範圍的流

那就比較適合並行原因是可以精準而且便宜的切割成任意大小的子程序使得thread劃分工作變得簡單

你的終結操作也很大程度的影響了並行化的效能如果你在終結操作做了很多工作而且工作與工作間彼此依賴(比如說下一個操作依賴於上一個操作) 那就很難並行化

比較好的終結操作是reduce min max count sum anyMatch allMatch noneMatch

比較不好的就是collect

不可預期的故障

並行化一個流不僅會導致低性能他還會導致不正確結果和不可預知的行為

即使並行完後預期行為都正確也必須測試性能來決定值不值得並行化

成功例子

作者也提供了一個成功並行化的例子這段程式計算小於n的質數有幾個

static long pi(long n) {
  return LongStream.rangeClosed(2, n)
    .mapToObj(BigInteger::valueOf)
    .filter(i -> i.isProbablePrime(50))
    .count();
}

這裡只要輕鬆的加個.parallel()

static long pi(long n) {
  return LongStream.rangeClosed(2, n)      
    .parallel()
    .mapToObj(BigInteger::valueOf)
    .filter(i -> i.isProbablePrime(50))
    .count();
}

在作者的四核計算機上效能提升3.7倍

注意這個pipeline的資料結構是long類型的範圍的流而且終結操作是count

總結

不要輕易嘗試並行化流除非你有充分的理由相信它將保持正確而且會提高性能(要仔細分析你的資料結構以及所有流操作)

不恰當的並行化流不止會讓程式跑錯結果甚至性能災難

jyt0532's Blog

Effective Java Item48 - 謹慎使用並行Stream

Item48: 謹慎使用並行Stream

使用並行時機

不可預期的故障

成功例子

總結

相關文章

jyt0532's Blog

Effective Java Item48 - 謹慎使用並行Stream

Item48: 謹慎使用並行Stream

使用並行時機

不可預期的故障

成功例子

總結

相關文章

Effective Java Item5 - 依賴注入優於硬連接資源 17 Mar 2020

Effective Java Item31 - 利用限制通配符來提昇API靈活性 23 Dec 2018

到底 <T extends Comparable<? super T>>是什麼意思 23 Dec 2018

類型參數和通配符的選擇 23 Dec 2018