返回

美团搜索:粗排优化黑科技,如何又快又好地让你的商品更靠前?

人工智能

粗排在美团搜索中的重要性

粗排是工业界搜广推系统的重要模块,美团搜索也不例外。在美团搜索的整个排序流程中,粗排处于最上游的位置,负责将大量候选商品进行初步筛选,为精排提供候选集。粗排的效果直接影响到精排的效率和最终的排序结果。因此,美团搜索粗排优化一直是团队重点关注的方向。

美团搜索粗排优化探索

美团搜索粗排优化主要从精排联动和效果性能联合优化两方面入手。

1. 精排联动优化

精排联动优化是指将粗排和精排紧密结合,相互协同优化。粗排为精排提供候选集,精排对候选集进行二次排序。粗排和精排之间存在着强烈的相关性,粗排的效果直接影响到精排的效率和最终的排序结果。因此,我们可以通过优化粗排和精排之间的联动,来提升粗排的效果。

2. 效果性能联合优化

效果性能联合优化是指在提升粗排效果的同时,也要兼顾粗排的性能。粗排作为整个排序流程的上游模块,其性能直接影响到整个排序流程的效率。因此,我们在优化粗排效果的同时,也要注意控制粗排的复杂度,避免对性能造成过大的影响。

美团搜索粗排优化实践

美团搜索粗排优化主要包括以下几个方面的实践:

1. 粗排模型优化

粗排模型优化是指对粗排模型的结构、参数和训练方法进行优化,以提升粗排模型的准确率和召回率。美团搜索粗排模型优化主要包括以下几个方面:

  • 模型结构优化: 我们通过尝试不同的模型结构,如深度神经网络、决策树、逻辑回归等,来寻找最适合美团搜索粗排任务的模型结构。
  • 模型参数优化: 我们通过调整模型的参数,如学习率、正则化系数等,来优化模型的性能。
  • 模型训练方法优化: 我们通过尝试不同的模型训练方法,如梯度下降法、随机梯度下降法、AdaGrad等,来优化模型的训练速度和收敛性。

2. 粗排数据优化

粗排数据优化是指对粗排模型的训练数据进行优化,以提升粗排模型的准确率和召回率。美团搜索粗排数据优化主要包括以下几个方面:

  • 数据清洗: 我们对粗排模型的训练数据进行清洗,去除其中错误或不准确的数据,以提高训练数据的质量。
  • 数据增强: 我们通过对粗排模型的训练数据进行增强,如数据采样、数据合成等,来增加训练数据的数量和多样性,以提升模型的泛化能力。

3. 粗排召回优化

粗排召回优化是指优化粗排模型的召回率,以确保粗排模型能够召回更多的候选商品。美团搜索粗排召回优化主要包括以下几个方面:

  • 召回策略优化: 我们通过优化召回策略,如贪心策略、随机策略等,来提升粗排模型的召回率。
  • 召回过滤优化: 我们通过优化召回过滤策略,如阈值过滤、置信度过滤等,来提升粗排模型的召回率。

美团搜索粗排优化经验和教训

美团搜索粗排优化过程中积累了一些经验和教训,现总结如下:

1. 经验

  • 业务理解是关键: 粗排优化需要对业务有深入的理解,才能真正优化粗排的效果。
  • 数据是基础: 粗排优化需要大量的数据来训练模型,数据质量直接影响到粗排的效果。
  • 模型选择要谨慎: 粗排模型的选择需要根据业务场景和数据特点来决定,没有一劳永逸的最佳模型。
  • 优化方法要多样: 粗排优化不能只依赖单一的方法,需要结合多种优化方法,才能取得更好的效果。

2. 教训

  • 不要过度优化: 粗排优化不能过度优化,否则可能导致模型过拟合,影响最终的排序效果。
  • 不要忽视性能: 粗排优化也要注意控制粗排的复杂度,避免对性能造成过大的影响。
  • 不要盲目跟风: 粗排优化不能盲目跟风,要根据自己的业务场景和数据特点来选择合适的优化方法。