第一:技能全面,比如网络、操作系统、监控、CICD、研发等,对于研发能力,可能不需要你精通,但是你需要具备可以使用一门语言完成某个功能的设计、开发与迭代。
第二:打破传统运维思想壁垒,以产品角度思维贯穿整个业务架构服务质量为前提的沟通协调能力。
第三:始终以软件工程解决问题为方向的规划之路。
第四:很强的Trouble Shooting与思考、抽象能力,这三个能力在SRE工作当中是至关重要的,是时间与实践积累的最终成果。
以下为《SRE谷歌运维解密》一书当中已经提到了关键点:
可观测性系统
故障响应
测试与部署
容量规划
自动化软件开发
用户支持
Oncall
制定可交付的SLI/SLO/SLA
故障复盘