轻松获取豆瓣电影排行榜TOP250，精彩电影尽收眼底！

闲谈

2023-12-06 20:57:11

豆瓣电影，作为国内知名的电影评论和评分平台，以其独特的评分体系和丰富的电影资源吸引了众多电影爱好者。豆瓣电影排名TOP250是根据豆瓣用户的评分和评论综合评定的结果，代表了最受欢迎、最值得观看的电影。

本篇文章将带领您轻松获取豆瓣电影排名TOP250，让您在茫茫的电影海洋中找到最值得观看的电影，让您的观影体验更加精彩。

一、观察分析

在开始爬取之前，我们需要对豆瓣电影排名TOP250的页面进行观察分析，以便制定出有效的爬取策略。

打开豆瓣电影排名TOP250页面，您可以看到电影列表，包括电影标题、评分、评论数、主演、上映时间等信息。
点击任意一部电影，进入电影详情页面，可以看到电影的详细信息，包括剧情简介、剧照、花絮、评论等。
注意观察每个电影的信息，以便在后面的代码中正确提取这些信息。

二、代码实现

了解了豆瓣电影排名TOP250页面的结构后，我们可以开始编写爬取代码。这里使用Python语言和BeautifulSoup库来实现爬取。

import requests
from bs4 import BeautifulSoup

# 设置请求头
headers = {
    "User-Agent": "Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/103.0.5060.114 Safari/537.36"
}

# 发起请求
response = requests.get("https://movie.douban.com/top250", headers=headers)

# 解析HTML
soup = BeautifulSoup(response.text, "html.parser")

# 获取电影列表
movie_list = soup.find("ol", class_="grid_view")

# 循环遍历电影列表
for movie in movie_list.find_all("li"):
    # 获取电影标题
    title = movie.find("span", class_="title").text

    # 获取电影评分
    rating = movie.find("span", class_="rating_num").text

    # 获取电影评论数
    comment_count = movie.find("span", class_="pl").text

    # 获取电影主演
    actors = movie.find("p", class_="star").text.strip().replace("\n", "")

    # 获取电影上映时间
    release_date = movie.find("p", class_="releasetime").text.strip().replace("\n", "")

    # 打印电影信息
    print(f"电影    print(f"电影评分：{rating}")
    print(f"电影评论数：{comment_count}")
    print(f"电影主演：{actors}")
    print(f"电影上映时间：{release_date}")
    print()