readnotes/devops/googlesre/5.md

57 lines
1.8 KiB
Markdown
Raw Normal View History

2022-01-17 11:41:03 +08:00
# 第五章 减少琐事
***如果系统正常运转中需要人工干预应该将此视为一种BUG。***
***“正常”的定义会随系统的进步而不断改变。***
SRE要把更多的时间花费在长期项目研发上而非琐事(日常运维)中。
## 琐事的定义
琐事不仅仅代表“我不喜欢的工作”。
琐事就是运维服务中手动性的、重复性的、可以被自动化的、战术性的、没有持久价值的、与服务呈线性关系增长的工作。
流程开销不是琐事如团队会议、目标的建立和评估、每周总结以及HR的书面工作。
## SRE的工作时间分配
SRE的一个公开目标是保持每个SRE工作时间中的运维工作(琐事)的比例低于50%。SRE至少花50%的时间在工程项目上,以减少未来的琐事或增加服务功能(提高可用性、利用率、性能)。
### 什么是工程工作
工程工作是一种新颖的,本质上需要主观判断的,符合长期战略的,会对你的服务进行长久性改善的工作。
## SRE的活动分类
典型的SRE活动分为以下几类
- 软件工程
编写或修改代码,以及所有其他相关性设计和文档的工作
- 系统工程
配置生产系统,修改现存配置,或者用一种通过一次性工作产生持久的改进的方法来书写系统文档。
- 琐事
与运维服务相关的重复性的、手工的劳动
- 流程负担
与运维服务不直接相关的行政工作
## 琐事的有害因素
在SRE工作种一定量的琐事是不可避免的如果琐事特别繁重那就应该非常担忧大声抱怨。在许多琐事有害的原因种以下因素要被考虑
- 职业停滞
- 士气低落
- 造成误解
- 进展缓慢
- 开创先例,造成琐事越来越多
- 促进摩擦产生
- 违反承诺
## 总结
让我们多创新,少干琐事吧。