返回

地理文本处理技术在高德的演进(上)

人工智能

地图搜索技术的演进

地图App的功能可以简单概括为定位,搜索,导航三部分,分别解决在哪里,去哪里,和怎么去的问题。

高德地图的搜索场景下,输入的是,地理相关的检索query,用户位置,App图面等信息,输出的是,用户想要的POI。如何能够更加精准地找到用户想要的POI,提高满意度,是评价搜索效果的最重要指标之一。

随着移动互联网的发展,人们获取信息的方式发生了巨大的变化,地图搜索也不例外。在过去的几年里,地图搜索经历了从传统的文本搜索到语义搜索的转变,这种转变主要得益于自然语言处理(NLP)技术的飞速发展。

文本搜索

文本搜索是地图搜索最传统的方式,用户通过输入关键词来搜索POI。文本搜索算法的核心是关键词匹配,即比较用户输入的关键词和POI的名称、地址、标签等信息,并根据匹配程度对POI进行排序。

文本搜索算法相对简单,易于实现,但是存在一些明显的缺点:

  • 查询结果相关性差。 文本搜索算法只考虑关键词的匹配,而忽略了用户的查询意图和POI的语义信息,这导致查询结果的相关性往往很差。
  • 查询结果不全面。 文本搜索算法只能找到与关键词完全匹配的POI,而忽略了那些与关键词语义相关的POI。这导致查询结果往往不全面,无法满足用户的需求。
  • 查询结果不准确。 文本搜索算法只能找到与关键词匹配的POI,而忽略了那些与关键词相关但名称或地址不同的POI。这导致查询结果往往不准确,给用户带来不好的体验。

语义搜索

语义搜索是地图搜索的最新发展趋势,它通过利用NLP技术来理解用户的查询意图和POI的语义信息,从而提供更加相关、全面和准确的查询结果。

语义搜索算法的核心是语义理解,即理解用户查询的含义和POI的含义,并建立两者之间的联系。语义理解可以分为两个步骤:

  • 查询意图理解。 查询意图理解是指理解用户查询的含义。这可以通过分析查询中的关键词、查询的上下文以及用户的历史查询记录来实现。
  • POI语义理解。 POI语义理解是指理解POI的含义。这可以通过分析POI的名称、地址、标签以及POI周围的环境信息来实现。

语义搜索算法比文本搜索算法更加复杂,但它能够提供更加相关、全面和准确的查询结果。

地理文本处理技术在高德的演进

高德地图是国内最早推出语义搜索功能的地图App之一,也是最早将NLP技术应用于地图搜索的企业之一。

高德地图的地理文本处理技术经历了从传统的文本搜索到语义搜索的转变,这一转变主要得益于NLP技术的飞速发展。

在传统的文本搜索阶段,高德地图主要采用关键词匹配算法来对POI进行排序。这种算法虽然简单易于实现,但是存在一些明显的缺点,例如查询结果相关性差、查询结果不全面、查询结果不准确等。

为了解决这些问题,高德地图开始将NLP技术应用于地图搜索。NLP技术可以帮助高德地图理解用户的查询意图和POI的语义信息,从而提供更加相关、全面和准确的查询结果。

高德地图的语义搜索算法主要包括以下几个步骤:

  • 查询意图理解。 高德地图通过分析查询中的关键词、查询的上下文以及用户的历史查询记录来理解用户的查询意图。
  • POI语义理解。 高德地图通过分析POI的名称、地址、标签以及POI周围的环境信息来理解POI的含义。
  • 查询意图和POI语义匹配。 高德地图将查询意图和POI语义进行匹配,并根据匹配程度对POI进行排序。

高德地图的语义搜索算法比传统的文本搜索算法更加复杂,但它能够提供更加相关、全面和准确的查询结果。

总结

地理文本处理技术在地图搜索中的应用是一个不断演进的过程,随着NLP技术的飞速发展,地图搜索技术也将不断发展,为用户提供更加便捷、准确和全面的服务。