根据阿里官网上的介绍,sysAK,全称是system analyse kit,目前主要来自于阿里百万服务器运维经验,通过对这些经验进行抽象总结出典型场景,提供了一系列工具针对不同的运维需求。
主要包括:
• 线上问题分析诊断:(比如负载异常、网络抖动、内存泄漏、io毛刺、性能异常等等)针对性的提供工具, 同时减少工具的专业性,让用户更易使用和解读。
• 资源监控: 针对各种系统资源更精细化的资源监控,帮助业务运维实现细粒度的运维调度,和资源控制。
• 故障止血: 总有不可预期的问题会发生,真正问题发生后需要及时恢复,对于不是整机异常的问题(死锁、夯机), 提供介入能力对系统进行恢复或故障隔离。
同时,sysAK工具本身不会为系统带来更大的负载开销,避免引起抖动问题。sysAK通过技术手段保证所有工具同时运行时不超过3%的系统消耗,单个工具不超过1%的系统消耗。
1