原Google架构师王璞:谷歌是这样做运维的

引言 SRE是Site Reliability Engineer的简称,从名字可以看出Google的SRE不只是做Operation方面的工作,更多是保障整个Google服务的稳定性。SRE不接触底层硬件如服务器,这也是高逼格的由来. Google 数据中心的硬件层面的维护工作是交给technician来做的,technician一般不需要有大学学历。 SWE是SoftWare Egineer的简称,即软件工程师(负责软件服务的开发、测试、发布)。SWE更新的程序代码(下文称为server),只有在SRE同意后才能上线发布。因此,SRE在Google工程师团队中地位非常高!我们下面将分别介绍。 SRE 职责 SRE在Google不负责某个服务的上线、 »