Python 爬虫网易云音乐，抓取不同类型歌手 Top 50 热门歌曲榜单！

2023-09-29 07:59:04

聆听音乐的乐趣，在于发现新歌

在繁忙的生活中，音乐扮演着重要的角色。它可以抚慰心灵，激发灵感，陪伴我们度过各种时刻。如果你是一位资深的音乐爱好者，那么你一定知道网易云音乐，这是一个拥有海量音乐资源的音乐平台。

随着音乐库的不断丰富，网易云音乐推出了各种榜单，帮助用户发现新音乐。其中，“Top 50”榜单是最受欢迎的榜单之一，它汇集了不同类型歌手的热门歌曲。这些歌曲往往都是当下最流行、最受用户喜爱的歌曲。

用 Python 爬虫，轻松获取 Top 50 榜单

如果你是一位 Python 开发者，并且对音乐数据感兴趣，那么你可以使用 Python 爬虫来抓取网易云音乐的 Top 50 榜单。通过爬虫，你可以获取到歌曲的名称、歌手、专辑、发行时间等信息。这些信息可以帮助你分析音乐趋势，发现新的音乐。

下面，我们就来一步一步地讲解如何使用 Python 爬虫来抓取网易云音乐的 Top 50 榜单。

1. 准备工作

在开始爬虫之前，你需要准备以下内容：

Python 3.6 或更高版本
requests 库
BeautifulSoup 库

你可以通过以下命令来安装这些库：

pip install requests
pip install beautifulsoup4

2. 确定请求 URL

网易云音乐的 Top 50 榜单可以通过以下 URL 获取：

https://music.163.com/discover/toplist?id=3779629&cat=%E5%85%A8%E9%83%A8

其中，id 参数表示榜单的 ID，cat 参数表示榜单的类型。你可以通过修改 id 和 cat 参数来获取不同类型歌手的 Top 50 榜单。例如，要获取华语男歌手的 Top 50 榜单，可以使用以下 URL：

https://music.163.com/discover/toplist?id=19723756&cat=%E5%8D%8E%E8%AF%AD%E7%94%B7%E6%AD%8C

3. 发送请求

使用 requests 库发送请求获取榜单页面内容：

import requests

url = "https://music.163.com/discover/toplist?id=3779629&cat=%E5%85%A8%E9%83%A8"
response = requests.get(url)

4. 解析页面内容

使用 BeautifulSoup 库解析页面内容，提取歌曲信息：

from bs4 import BeautifulSoup

soup = BeautifulSoup(response.text, "html.parser")

5. 提取歌曲信息

网易云音乐的 Top 50 榜单页面中，歌曲信息存储在 <li> 标签中。我们可以通过 soup.select() 方法来提取这些 <li> 标签：

songs = soup.select("li.item")

6. 保存歌曲信息

接下来，我们可以遍历这些 <li> 标签，提取歌曲的名称、歌手、专辑、发行时间等信息：

for song in songs:
    name = song.select_one("a.tit").text.strip()
    singer = song.select_one("p.singer a").text.strip()
    album = song.select_one("p.album a").text.strip()
    publish_time = song.select_one("p.time span").text.strip()
    
    print(f"歌曲名称：{name}")
    print(f"歌手：{singer}")
    print(f"专辑：{album}")
    print(f"发行时间：{publish_time}")
    print()