Designing Data-Intensive Applications 心得筆記

Alt text

本書介紹

2019年 幾乎你叫得出名字的應用 都無可避免地要面對海量資料的問題 本書會講到數據設計系統中的精髓 從底層的數據結構到頂層的架構設計全部涵蓋 也是準備系統設計必讀的一本書

作者介紹

Martin Kleppmann 前領英工程師 貢獻了許多open source專案比如Apache Avro和Apache Samza現在則是在劍橋大學繼續研究

Martin Kleppmann

Part1: Foundations of Data Systems

Part1: Intro - Foundations of Data Systems

Reliable, Scalable, and Maintainable Application

Data Models and Query Languages

Storage and Retrieval

Encoding and Evolution

Part2: Distributed Data

Part2: Intro - Distributed Data

Replication

Partitioning

Transactions

  1. ACID

  2. 弱隔離級別

  3. 可串行化

The Trouble with Distributed Systems

Consistency and Consensus

  1. 線性一致性

  2. 順序保證

  3. 分佈式事務與共識

Part3: Derived Data

Part3: Intro

Batch Processing

Stream Processing

  1. 傳遞事件流

  2. 數據庫與流

  3. 處理流

The Future of Data System