PDN:淘宝新一代召回范式,引领搜索革命
2023-10-20 19:31:21
导言
信息爆炸的时代,搜索引擎扮演着不可或缺的角色,将浩瀚的信息海洋呈现在我们面前。然而,传统的搜索范式在面对海量数据时,却显得捉襟见肘,无法满足用户对高效、精准搜索体验的需求。
淘宝作为全球领先的电商平台,一直走在搜索技术创新的前沿。近日,淘宝团队在SIGIR 2021大会上重磅推出PDN(Product Description Network)模型,开启了搜索召回的新纪元,为用户带来了前所未有的搜索体验。
###超越I2I和向量内积
传统的搜索召回范式大多基于I2I(Item-to-Item)技术或向量内积计算,这些方法虽然能够在一定程度上满足用户需求,但随着数据规模的不断增长,其局限性也逐渐显露:
- I2I技术 :容易陷入同质化召回,难以挖掘用户潜在兴趣。
- 向量内积计算 :忽略了商品中的语义信息,难以捕捉用户查询和商品之间的细微差别。
###PDN模型的创新突破
PDN模型应运而生,以其创新的理念和精湛的算法,突破了传统召回范式的瓶颈。PDN模型将商品作为网络节点,构建了一个语义关联网络,通过图神经网络技术,充分挖掘商品描述中的语义信息,实现商品之间的语义匹配。
与传统的召回范式相比,PDN模型具有以下三大优势:
- 更深入的语义理解 :PDN模型不仅关注关键词的匹配,更注重语义信息的挖掘,能够理解商品描述背后的深层含义。
- 更全面的召回结果 :PDN模型通过语义网络的构建,打破了同质化召回的限制,能够挖掘出更多相关但非同质的商品,满足用户的多元化搜索需求。
- 更精准的个性化推荐 :PDN模型充分利用用户历史行为数据,构建个性化语义网络,实现更精准的个性化推荐,为用户提供量身定制的搜索体验。
###实践应用与显著成效
目前,PDN模型已经在手淘首页内容信息流场景上全量应用,成为线上最主要的召回源。与之前的召回范式相比,PDN模型带来了显著的提升:
- 点击率提升20%
- GMV(商品交易总额)提升20%
- 搜索结果多样性提升20%
这些数据充分证明了PDN模型的优越性能,为淘宝用户提供了更加高效、精准和个性化的搜索体验。
###展望未来
PDN模型的提出标志着搜索召回技术的新纪元。淘宝团队将继续深入研究和完善PDN模型,不断提升其语义理解能力、召回全面性和个性化推荐效果,为用户打造更智能、更便捷的搜索体验。
PDN模型的成功应用也为其他领域的信息检索提供了启发。未来,PDN模型有望在推荐系统、问答系统等领域发挥更大的作用,推动信息检索技术不断发展,为用户带来更加美好的信息获取体验。