返回
拥抱智能时代:阿里毕玄论运维变革
见解分享
2024-01-18 00:32:34
智能时代席卷而来,运维工程师这个古老的职业,也在经历着前所未有的变革。
在过去的十年里,运维自动化、云原生、DevOps等技术不断涌现,让运维工程师的工作方式发生了翻天覆地的变化。然而,真正的智能化运维,依然处于探索阶段。
阿里巴巴研发效能团队负责人阿里研究员毕玄在《智能时代的新运维》演讲中,深度剖析了运维在智能时代的责任与变革。
阿里的运维体系承载着怎样的责任?
阿里巴巴是一个庞大的互联网帝国,每天有数十亿人使用阿里的产品和服务。这些产品和服务背后,是庞大而复杂的运维体系。
阿里云是阿里巴巴集团旗下的大型云计算平台,为全球数百万客户提供云计算服务。阿里云的运维体系,更是重中之重。
毕玄表示,阿里的运维体系承载着三个重要的责任:
- 保证业务稳定运行。 这是运维体系的首要责任。阿里云上的业务千千万万,如果运维体系出现问题,可能会导致大面积的业务中断,造成巨大的损失。
- 提升业务效率。 运维体系可以通过自动化、云原生、DevOps等技术,提升业务效率。例如,通过自动化运维任务,可以减少人工操作,提高效率。
- 支撑业务创新。 运维体系可以为业务创新提供基础支撑。例如,通过云原生技术,可以快速部署和扩展新的业务应用。
智能运维面临的挑战
虽然智能化运维是大势所趋,但目前业界真正的智能化运维落地实践并不多。大多还停留在自动化甚至人工化阶段。
毕玄指出,智能运维面临着四大挑战:
- 数据难题。 智能运维需要大量的运维数据,但目前运维数据往往分散在不同的系统中,难以收集和分析。
- 算法难题。 智能运维需要强大的算法,才能从海量数据中挖掘出有价值的信息。但运维算法往往复杂且难以开发。
- 人才难题。 智能运维需要复合型人才,既懂运维,又懂算法。但这样的人才非常稀缺。
- 文化难题。 智能运维需要运维文化和理念的变革。但很多运维工程师思维固化,难以适应新的技术和理念。
阿里如何应对智能运维挑战
面对智能运维的挑战,阿里巴巴采取了以下应对措施:
- 建立数据中台。 阿里巴巴建立了统一的运维数据中台,将分散在不同系统中的运维数据汇聚到一起,为智能运维提供数据基础。
- 自研算法。 阿里巴巴自研了大量的运维算法,包括故障预测算法、根因分析算法等。这些算法为智能运维提供了算法支撑。
- 培养人才。 阿里巴巴通过培训和招聘,培养了一支复合型人才队伍。这支队伍既懂运维,又懂算法。
- 推动文化变革。 阿里巴巴通过宣讲、培训等方式,推动运维文化和理念的变革。让运维工程师了解和接受智能运维的理念。
毕玄表示,阿里巴巴在智能运维方面还处于探索阶段,但已经取得了初步成效。阿里巴巴希望通过自己的探索和实践,为业界智能运维的发展提供借鉴。