返回

拥抱智能时代:阿里毕玄论运维变革

见解分享

智能时代席卷而来,运维工程师这个古老的职业,也在经历着前所未有的变革。

在过去的十年里,运维自动化、云原生、DevOps等技术不断涌现,让运维工程师的工作方式发生了翻天覆地的变化。然而,真正的智能化运维,依然处于探索阶段。

阿里巴巴研发效能团队负责人阿里研究员毕玄在《智能时代的新运维》演讲中,深度剖析了运维在智能时代的责任与变革。

阿里的运维体系承载着怎样的责任?

阿里巴巴是一个庞大的互联网帝国,每天有数十亿人使用阿里的产品和服务。这些产品和服务背后,是庞大而复杂的运维体系。

阿里云是阿里巴巴集团旗下的大型云计算平台,为全球数百万客户提供云计算服务。阿里云的运维体系,更是重中之重。

毕玄表示,阿里的运维体系承载着三个重要的责任:

  1. 保证业务稳定运行。 这是运维体系的首要责任。阿里云上的业务千千万万,如果运维体系出现问题,可能会导致大面积的业务中断,造成巨大的损失。
  2. 提升业务效率。 运维体系可以通过自动化、云原生、DevOps等技术,提升业务效率。例如,通过自动化运维任务,可以减少人工操作,提高效率。
  3. 支撑业务创新。 运维体系可以为业务创新提供基础支撑。例如,通过云原生技术,可以快速部署和扩展新的业务应用。

智能运维面临的挑战

虽然智能化运维是大势所趋,但目前业界真正的智能化运维落地实践并不多。大多还停留在自动化甚至人工化阶段。

毕玄指出,智能运维面临着四大挑战:

  1. 数据难题。 智能运维需要大量的运维数据,但目前运维数据往往分散在不同的系统中,难以收集和分析。
  2. 算法难题。 智能运维需要强大的算法,才能从海量数据中挖掘出有价值的信息。但运维算法往往复杂且难以开发。
  3. 人才难题。 智能运维需要复合型人才,既懂运维,又懂算法。但这样的人才非常稀缺。
  4. 文化难题。 智能运维需要运维文化和理念的变革。但很多运维工程师思维固化,难以适应新的技术和理念。

阿里如何应对智能运维挑战

面对智能运维的挑战,阿里巴巴采取了以下应对措施:

  1. 建立数据中台。 阿里巴巴建立了统一的运维数据中台,将分散在不同系统中的运维数据汇聚到一起,为智能运维提供数据基础。
  2. 自研算法。 阿里巴巴自研了大量的运维算法,包括故障预测算法、根因分析算法等。这些算法为智能运维提供了算法支撑。
  3. 培养人才。 阿里巴巴通过培训和招聘,培养了一支复合型人才队伍。这支队伍既懂运维,又懂算法。
  4. 推动文化变革。 阿里巴巴通过宣讲、培训等方式,推动运维文化和理念的变革。让运维工程师了解和接受智能运维的理念。

毕玄表示,阿里巴巴在智能运维方面还处于探索阶段,但已经取得了初步成效。阿里巴巴希望通过自己的探索和实践,为业界智能运维的发展提供借鉴。