新書推薦《Google系統架構解密》

如何保證大型分布式服務能夠安全、可靠地運行?擁有億級用戶和復雜業務場景的Google讓這件事看起來很簡單,但事實并非如此。今天,小安就為大家推薦一本集結GoogleSRE團隊和安全團隊前沿經驗和真知灼見的寶藏圖書,帶你領略互聯網級別的服務如何保障安全性和可靠性!
新書簡介
如果系統非常安全,那么它一定可靠嗎?
Google曾遭遇一個有關安全性和可靠性的死循環。
最終,Google的工程師用一把電鉆破解了死循環。
是的,你沒看錯,用一把電鉆。
2012年9月27日,Google向乘坐舊金山灣區各園區巴士的數千名員工發了一條消息,告知巴士WiFi密碼變更了。很稀松平常的一條消息,對吧?這能掀起多大風浪呢?可是,Google員工用的內部密碼管理系統竟然就這樣崩潰了!這個系統原本是為少數系統管理員設計的,已經用了五年,從未遭遇過停機。原來,收到消息的數千名員工在短時間內集中訪問了密碼管理系統,導致系統主機和備機接連失效。你可能會想,重啟一下不就行了?沒錯,Google的值班工程師也是這樣想的。不過,這個系統設計得非常安全,重啟需要用硬件安全模塊智能卡。智能卡存放在哪里呢?哦,在一個保險箱里,安全極了!可是,值班工程師不記得保險箱密碼了。密碼又存儲在哪里呢?呵呵,在已經崩潰的密碼管理系統里。
當然,蠻力法總能派上用場。一小時后,工程師用電鉆打開了保險箱……
以上來自《Google系統架構解密》的開篇小故事。作為處理萬億級流量的超大型公司,Google在這本書中一開篇就“自揭傷疤”,意在強調:要使系統真正值得信賴,安全性和可靠性都不可或缺,但要構建既安全又可靠的系統是相當困難的。
好在有這一本書。

本書由圖靈教育提供
封面是中國水龍。若環境適中,這種蜥蜴可健康地生活20年之久。軟件系統亦如此Google SRE系列第三部
這是Google公司SRE系列的第三本書。前兩本的主題是SRE(Site Reliability Engineering,網站可靠性工程):
SRE是Google自創的一個工種,國內大廠也已經開始設置SRE崗位。簡單地說,當把運維視作解決軟件問題時,你就是在做SRE。
作為這個系列的第三本書,《Google系統架構解密》則聚焦于SRE與安全性的結合。Google公司安全工程副總裁Royal Hansen在為這本書所作的序中寫道:
自SRE的書出版以來,我時常贊賞和推薦它們。當發現公司內部有一本專注于安全性和可靠性的書正在編寫時,我非常興奮。
我發現SRE領域出現的問題與安全性問題很相近。一些團隊已將這兩項工作合二為一,稱為DevSecOps。
在這個越來越依賴技術的世界中,一本從Google和整個行業的經驗中汲取有關安全性和可靠性方法論的書,會對軟件開發、系統管理和數據保護的發展做出重要貢獻。
新書目錄(節選)




強大陣容
本書由Google的SRE團隊和安全團隊撰寫,內容貢獻者多達150人,主要作者的陣容十分強大。
★ 希瑟·阿德金斯(Heather Adkins)是在Google有近20年工作經驗的“老兵”,也是Google安全團隊的創始成員。
★ 貝齊·拜爾(Betsy Beyer)畢業于斯坦福大學,是Google SRE技術作者。
★ 保羅·布蘭肯希普(Paul Blankinship)是Google技術寫作團隊負責人,同時服務于Google安全與隱私工程團隊。
★ 彼得·萊萬多夫斯基(Piotr Lewandowski)是Google安全生產技術負責人,負責促成SRE與安全團隊緊密協作。
★ 阿那·奧普雷亞(Ana Oprea)負責安全、SRE及Google技術基礎設施的戰略規劃。
★ 亞當·斯塔布菲爾德(Adam Stubblefield)是Google安全領域的技術負責人,他協助建立了Google大部分核心安全基礎設施。
譯者簡介
周雨陽:就職于騰訊安全平臺部研發安全團隊,參與DevSecOps的一線建設工作,對業務研發流程、編碼安全及漏洞檢測有深入了解,曾發現并報告Google、Apple、Mozilla等的產品漏洞,另譯有《黑客攻防技術寶典:反病毒篇》。
劉志穎:高級安全工程師,現就職于騰訊PCG應用安全團隊,擔任研發安全方向負責人,主導應用漏洞風險治理和DevSecOps落地工作,在研發與架構安全、安全漏洞發現與防護等方向有較多實戰經驗。