Flink 迁移之路：从 Standalone 到 On Yarn，性能提升五倍

2024-01-12 01:59:45

引言

在数据驱动时代，流式数据处理已成为企业实时洞察、快速响应和业务决策的关键。Apache Flink 作为领先的流式数据处理框架，凭借其低延迟、高吞吐量和容错性，受到广泛欢迎。对于 TalkingData 而言，Flink 已成为我们流式数据处理的重要支柱。

Standalone 之痛

在 2017 年上半年，我们的 App Analytics 和 Game Analytics 产品仍然使用自研的 td-etl-framework。虽然该框架降低了开发流式任务的复杂度，但同时也存在着一些痛点：

拥抱 Flink

为了解决这些问题，我们决定拥抱 Flink。Flink 的分布式流处理架构和丰富的 API 为我们提供了高效、稳定和可扩展的解决方案。

迁移之路

Flink 迁移之路并非一蹴而就。我们从最简单的 standalone 模式入手，逐步过渡到 on Yarn 模式，最终实现了性能的五倍提升。

Standalone 模式

最初，我们部署 Flink 采用 standalone 模式。在此模式下，Flink 的 JobManager 和 TaskManager 部署在单台机器上。这种模式简单易用，但受限于单机性能，无法满足我们日益增长的数据处理需求。

On Yarn 模式

为了突破性能瓶颈，我们探索了 on Yarn 模式。在该模式下，Flink 的 JobManager 和 TaskManager 分别部署在 Yarn 的 ResourceManager 和 NodeManager 上。Yarn 负责资源管理和调度，Flink 专注于数据处理。

on Yarn 模式具有以下优势：

性能提升

通过迁移到 on Yarn 模式，Flink 的性能得到了显著提升。在相同的硬件条件下，Flink 的处理能力提升了五倍，满足了我们业务快速增长的需求。

优化实践

除了迁移到 on Yarn 模式之外，我们还进行了以下优化实践：

经验总结

两年 Flink 迁移之路，我们积累了一些宝贵的经验：

展望未来

随着 Flink 生态的不断完善，我们将继续探索 Flink 的更多特性，如流批一体、事件时间处理和机器学习集成等，进一步提升我们的数据处理能力，为业务发展提供强有力的技术支撑。

关于 TalkingData

TalkingData 是全球领先的数据智能云服务商，为企业提供全栈式数据智能解决方案，赋能企业数字化转型。

探索Web开发资源和人工智能教程的代码社区

扫码关注微信公众号