返回

爱奇艺大数据生态实时化的裨益与挑战

见解分享





数据,数字化的燃料,正引领着各个产业向数字化的未来进军。爱奇艺,一家引领着在线娱乐行业发展的头部公司,同样不例外地感受着数字化转转型型给自身带来的巨大变革。

**实时化转型の背景** 

在飞速发展的互联网时代,数据早已不再仅仅只是一个冰冷的数字,而演变成一种重要的生产要素,并日益渗透到各个行业、各个角落。爱奇艺亦不例外,在大数据生态中,海量的数据每时每刻都在不断地产生和累积。

随着业务的飞速壮大,传统的 T+1(隔日)离线数据已经难以满足爱奇艺对数据时效性的需求。一方面,对海量数据的实时洞察,有利于爱奇艺第一时间掌握业务发展的态势,并据此作出迅速的业务调整,以占据行业发展的有利赛道。另一方面,实时数据的接入,有利于提升爱奇艺的运营效率和服务质量。

**实时化转型の目标** 

基于上述的考量,爱奇艺亟需一场以数据实时化为核心的变革。这场变革的目标,就是要在大数据生态中,全面提升数据的实时性、准确性和可用性。

**实时化转型の路径** 

为达成实时化转型の目标,爱奇艺的技术团队从数据采集、数据接入、数据清洗、数据计算、数据可信度、数据服务等环节逐次突破。

在数据采集环节,接入海量日志、指标、告警等数据,建立起全链路的数据采集体系,保证数据源的丰富性和数据采集的时效性。

在数据接入环节,摒弃了传统的数据接入方案,自研了基于流式计算和 lambda 架构的新型数据接入方案。该方案不仅提升了数据接入的效率,更重要的是解决了数据接入的准确性和一致性问题。

在数据清洗环节,结合大数据清洗领域的研究与最佳的技术方案,自研了一套大数据实时清洗的治理规则和数据质量评估体系。

在数据计算环节,重新梳理了数据计算的逻辑,基于 Flink、Spark 等开源计算引擎,全面提升了数据计算的性能和稳定性。

在数据可信度环节,从数据接入、数据计算、数据存储等多个环节,建立了一整套完善的数据可信度体系,保障了数据的真实、可靠。

在数据服务环节,依托数据中台和数据湖,实现了数据服务的多场景化、多样化的接入。

**实时化转型の挑战** 

在实时化转型の过程中,爱奇艺的技术团队也遇到了不小的挑战。

一是数据标准化的挑战。海量数据接入后,其标准化问题就变得尤为突出。为此,爱奇艺的技术团队自研了一套基于机器深度自适应神经算法的数据标准化模型,在数据集规范和标准化等维度取得了显著的成效。

二是数据治理的挑战。海量数据涌入后,其治理难度也成倍增长。为此,爱奇艺的技术团队自研了一套基于人工智能和大数据的智能数据治理方案。该方案大幅提升了数据治理的效率和准确性,使数据价值得以更大化的释放。

三是数据质量的挑战。数据接入量级和接入频率的提升,对数据质量提出了更高的诉求。为此,爱奇艺的技术团队建立了一整套基于数据质量规则、模型和指标的数据质量保障体系。

**实时化转型带来的裨益** 

经过不懈的努力,爱奇艺大数据生态的实时化转型取得了显著成效。

首先,数据时效性大幅提升。实时化转型后,爱奇艺的数据时延从 T+1(隔日)缩短至 1min(分钟)以内,数据时效性获得了大幅提升。

其次,数据准确性大幅提升。实时化转型后,爱奇艺基于数据标准化和数据治理的手段,大幅提升了数据的准确性,为其业务决策和运营管理提供了更坚实的数据基础。

***,数据可用性大幅提升。实时化转型后,爱奇艺基于数据中台和数据湖,实现了数据服务的全天候和全天候接入,为其业务决策和运营管理提供了更及时的和全的数据支撑。

**对实时化转型の思考** 

数据的实时化转型并非一朝一夕之功,而是需要一个持续的投入和迭代的过程。在实时化转转型型中,爱奇艺总结了三条经验:

一是技术的引领。人工智能、大数据等新技术的引入,为数据实时化转型提供了强劲的驱