Effective Engineer - Balance Quality with Pragmatism

July 29, 2017

這篇是Effective Engineer - Balance Quality with Pragmatism章節的讀書筆記

當作者在Google的時候 Google對於code的quality要求非常高排版什麼的都非常的一致這讓code非常好讀也非常好maintain 但很多人最後都跳槽去startup 因為覺得在Google開發速度太慢時間應該花在新code上面還是應該讓舊code更好讀 找平衡點這件事情本身就是一個high-leverage的Task

建立code preview的process

讓Code品質高的作法中最重要的就是要有code review 每一個commit在被push之前要確保至少有一個engineer review過好處如下:

1.及早抓到bug或是design的缺陷: bug上了production之後才發現會花的時間比一開始就抓到還浪費非常多 為了省review的時間之後就會花時間在找production的bug 2008年有個研究顯示有code review比沒有code review減少了85%的bug

2.增加engineer的責任感:有人在看你的code你就不會亂搞

3.好的code會被學習: review別人的時候學習別人的好處被review的時候被給的每個comment都是一個進步的機會

4.讓其他人知道你在做什麼: 確保至少有一個人看過知道你在做什麼之後你不在的時候還有人可以接手

5.高品質的code容易讀容易改 iteration的speed就會變快

多樣的code review方式

但要不要code review不是兩個極端的選擇有很多中間地帶可以選以下提供幾個例子:

早期的Instagram: 跟你的reviewer share螢幕然後講給他聽

Square跟Twitter: pair programming

早期的OOyala: 只看核心功能的困難部分他們還在post-commit之後review 就是code已經上去了才開始看就是為了加快iteration速度

Quora:只review model跟controller, 每個commit優先度不一樣比如說碰到infra的就要仔細看 new hire的commit也要認真看

現在其實市面上很多review的tool 也有很多tool可以直接看你的unit test coverage跟coding stylecheck

怎麼樣的code review process適合你們的team 需要不斷做實驗通常隨著team size跟code size不同通常review方式會不一樣

利用抽象化簡化複雜度

Procedural abstraction=> function development should separate the concern of what is to be achieved by a function from the details of how it is to be achieved. 。

Data abstraction => separation of the logical view of a data object (what is stored) from the physical view (how the information is stored).

《Using Abstraction to Manage Complexity》

作者提了MapReduce當做例子在Google他只要花半小時就可以寫一個C++的程式去爬billions的網頁這是因為MapReduce把內部的實作抽象化了你只需要在乎你的application logic 剩下的什麼reliability或fault tolerance你不用管

MapReduce的例子讓我們知道只要正確地把一件事情抽象化可以很大程度的放大我們的output

正確的抽象一個複雜的問題可以讓我們

1.降低複雜度: MapReduce把一個大數據的處理問題簡化成兩個 map: 轉化input reduce:把轉化的data aggregate

2.減少未來維護成本: 因為你實際需要寫的code變少理解容易

3.只需要解決一次複雜的問題(怎麼build MapReduce framework) 可以應用在無數的小問題 DRY(Don’t repeat yourself) 好的抽象可以分離出所有很常被共用但又很複雜的細節不用之後處理每個問題都要再解決一次

好一點的公司都有專門的team去開發這些tool

Google - Protocol buffer: encode structured data in a extensible way, Sawzal: simplify distributed logs processing, BigTable: store and manage terabyte of structured data

Facebook - Thrift: support cross-language service development, Hive: support relational queries over semi-structured data, Tao: simplify graph queries on top of MySQL

這些tool可以讓大家開發新feature的時間從幾個月變成幾天

但比invest tool更重要的事情是 invest invest tool這件事划不划算 作者拿Asana公司舉例他們曾經想開發一個猛語言可以讓之後的工程師花更少時間上手但花了太多時間原本的重點product沒有預期出來那個project也被迫中斷

作者給的建議是不要太早就開始抽象化這樣你手上的example太少有可能抽象完後會太overfit 根本很少case可以適用不好的抽象不是浪費開發tool的時間而已他還會浪費之後所有用它的人的時間

過早最佳化是萬惡的根源 – Donald Knuth

一個好的tool應該要有什麼條件呢

1.很好用

2.即使沒有document也很好用

3.很難用錯

4.強大可以滿足需求

5.很好擴展

想build好一個tool需要花費時間心力以下有幾點建議

1.去看你工作環境的codebase的tools 讀document 讀source code 試著擴展

2.去看大公司的open source project 看看為什麼Protobuf Thrift Hive對他們公司那麼重要

3.讀好的API 像AWS的api 為什麼那麼多人那麼輕易就上手

自動化測試 

我們需要寫好unit test跟integration test因為

1.手動測試很麻煩基本上一個事情需要重複做兩次以上就應該自動化何況是需要做無數次的test

2.每次有新feature或是refactoring的時候就不用怕舊的功能壞掉

3.測試寫得好當有事情發生可以馬上找到到底錯在哪裡節省時間

4.test code本身就是document 新來的可以由test看出這code怎麼用

償還技術債

在軟體開發的過程無可避免地會有很多時候急就章比如說某個test先不寫或是copy paste某部分的code而不是refactor 每一個決定不論是因為偷懶還是product的deadline壓力都會加重我們的技術債 指的就是那些被拖延但是是必須完成的事

有債務就會有利息如果你不快點償還你之後就會越花越多時間在還利息當然就像之前每個主題所說這不是個兩極的選擇還或不還你可以先從那些利息高的開始還起比如說最接近你核心的code 一天會有很多人看的code 那些相關技術債先還再還比較不重要的

大多數的人都是遇到需要還技術債的時候才會開始還但effective engineer會規劃它的時間從投資報酬率最高的開始

jyt0532's Blog

Effective Engineer - Balance Quality with Pragmatism

建立code preview的process

多樣的code review方式

利用抽象化簡化複雜度

自動化測試

償還技術債

相關文章

jyt0532's Blog

Effective Engineer - Balance Quality with Pragmatism

建立code preview的process

多樣的code review方式

利用抽象化 簡化複雜度

自動化測試

償還技術債

相關文章

Effective Engineer - Validate Your Ideas Early and Often 05 Sep 2017

Effective Engineer - Invest Your Team's Growth 25 Aug 2017

Effective Engineer - Minimize Operational Burden 14 Aug 2017

Effective Engineer - Focus on High-Leverage Activities 31 Jul 2017

利用抽象化簡化複雜度

自動化測試