巧用Google Play Scraper，轻松获取完整的应用评论

2024-03-15 14:08:42

从Google Play挖掘完整的应用评论：逐步指南

前言

作为一名资深开发者，我深知评论在应用程序开发中的重要性。它们是评估用户体验、改进应用程序质量和制定数据驱动决策的关键。然而，由于Google Play商店的限制，获取完整的应用评论一直是一项挑战。本文将深入探讨如何使用Google Play Scraper巧妙地克服这些限制，让你全面掌握评论信息。

获取评论的限制

Google Play商店限制一次获取多达200条评论。这对于拥有大量评论的应用程序来说，就成了一个障碍。为了解决这个问题，Google Play Scraper采用了一个巧妙的迭代方法。

迭代方法

该方法不断向Google Play服务器发出HTTP请求，直到检索到所有评论。它通过一个简单的while循环实现，循环持续，直到不再检索到任何评论为止。每次迭代中，它都会收集多达200条评论。

while True:
    reviews = reviews_all(
        'com.teladoc.members',
        sleep_milliseconds=0,  # 默认值为 0
        lang='en',  # 默认值为 'en'
        country='us',  # 默认值为 'us'
        sort=Sort.NEWEST,  # 默认值为 Sort.MOST_RELEVANT
        filter_score_with=None  # 默认值为 None(表示所有分数)
    )
    if len(reviews) == 0:
        break

优化和增强

为了提高评论获取效率，可以采取以下策略：

多线程或多进程： 通过并行发出HTTP请求来加速进程。
缓存机制： 避免重复请求同一批评论。
过滤和排序： 利用Google Play Scraper提供的强大过滤和排序选项。

代码示例

以下代码片段演示了如何使用多线程来并行获取评论：

from google_play_scraper import Sort, reviews_all

# 初始化多线程池
import concurrent.futures

def fetch_reviews(start, end):
    reviews = []
    for i in range(start, end):
        reviews.extend(reviews_all(
            'com.teladoc.members',
            sleep_milliseconds=0,  # 默认值为 0
            lang='en',  # 默认值为 'en'
            country='us',  # 默认值为 'us'
            sort=Sort.NEWEST,  # 默认值为 Sort.MOST_RELEVANT
            filter_score_with=None  # 默认值为 None(表示所有分数)
        ))
    return reviews

# 创建多线程池
with concurrent.futures.ThreadPoolExecutor() as executor:
    # 分割任务
    tasks = [executor.submit(fetch_reviews, i * 200, (i + 1) * 200) for i in range(10)]

    # 等待任务完成
    concurrent.futures.wait(tasks)

    # 合并结果
    reviews = []
    for task in tasks:
        reviews.extend(task.result())