用Python 3.x从网易云音乐中提取歌曲列表：循序渐进指南

2024-01-02 14:33:49

引言

网易云音乐是中国最流行的音乐流媒体平台之一，拥有海量音乐库和庞大的用户群。该平台允许用户创建和分享歌单，其中包含他们精选的歌曲列表。对于希望分析音乐趋势、跟踪个人收听习惯或仅收集他们喜爱的歌曲的人来说，从网易云音乐中提取歌单对于多种目的而言都是有价值的。本文将详细介绍如何使用 Python 3.x 自动从网易云音乐中获取歌曲列表。

获取请求头

要从网易云音乐中抓取数据，我们需要获取请求头信息，其中包含访问特定 URL 所需的元数据。我们可以使用 Fiddler 或 Charles 等抓包工具获取此信息。抓取歌单请求时，我们将在请求标头中看到以下信息：

Host: music.163.com
User-Agent: Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/91.0.4472.124 Safari/537.36
...

分析歌单数据

有了请求头后，我们可以使用 Python 的 requests 库来发送 HTTP 请求并获取歌单数据。解析获取的数据后，我们将获得一个 JSON 响应，其中包含有关歌单和歌曲的信息。我们可以使用 BeautifulSoup 库来解析 HTML 数据，使用正则表达式来提取特定信息。

以下是提取歌曲信息的步骤：

使用 requests 库发送 HTTP 请求并获取响应。
使用 BeautifulSoup 解析响应中的 HTML 数据。
使用正则表达式从 HTML 数据中提取歌曲信息，包括歌曲名称、艺术家和专辑。
将提取的信息存储在数据结构中，例如列表或字典。

提取歌曲信息

提取歌曲信息后，我们可以使用 csv 或 json 模块将信息保存到文件中。这样，我们可以轻松访问和分析歌曲列表数据。以下是保存歌曲信息的步骤：

打开一个 CSV 或 JSON 文件进行写入。
遍历歌曲信息数据结构并将其写入文件。
关闭文件。

示例代码

以下示例代码演示了如何使用 Python 3.x 从网易云音乐中提取歌单：

import requests
from bs4 import BeautifulSoup
import re
import csv

# 设置请求头
headers = {
    'Host': 'music.163.com',
    'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/91.0.4472.124 Safari/537.36'
}

# 歌单 ID，替换为您的目标歌单 ID
playlist_id = '3778678'

# 发送 HTTP 请求并获取响应
response = requests.get(f'https://music.163.com/playlist?id={playlist_id}', headers=headers)

# 解析 HTML 数据
soup = BeautifulSoup(response.text, 'html.parser')

# 初始化歌曲信息列表
songs = []

# 提取歌曲信息
for song in soup.find_all('a', class_='tit f-thide s-fc0'):
    song_name = song.text
    song_artist = song.find_next('span', class_='s-fc3').text
    song_album = song.find_next('div', class_='text').text
    songs.append([song_name, song_artist, song_album])

# 将歌曲信息保存到 CSV 文件
with open('songs.csv', 'w', newline='') as csvfile:
    writer = csv.writer(csvfile)
    writer.writerows(songs)