还在一张张下载知乎图片？快使用爬虫高效获取！

2023-11-28 14:39:50

知乎是一个以问答为主的社交平台，聚集了大量优质内容，涵盖各种领域和话题。在浏览知乎的过程中，您是否也曾被各种图片所吸引，想要下载并保存下来呢？如果您使用的是python，那么您可以通过爬虫来实现这一目的，从而快速且高效地获取知乎回答中的所有图片。

为了帮助您更好地使用爬虫技术，我们将为您提供一个示例，使用Python爬虫从知乎回答中获取所有图片。请注意，我们仅提供爬虫技巧，并不鼓励您从事违反知乎平台规定的行为，例如批量下载他人版权图片或使用爬虫从事商业活动等。

获取图片步骤

导入必要的库

在开始编写爬虫之前，我们需要导入一些必要的库，包括requests、BeautifulSoup和tqdm。
```
import requests
from bs4 import BeautifulSoup
from tqdm import tqdm
```
获取知乎回答的URL

为了获取回答中的图片，我们需要先获取回答的URL。您可以通过以下步骤获得一个回答的URL：
1. 打开知乎网站，找到您想要爬取图片的回答。
2. 将鼠标悬停在回答上，然后点击右键，选择“复制链接地址”。
现在，您就可以将复制的URL粘贴到代码中，如下所示：
```
answer_url = 'https://www.zhihu.com/question/30099086/answer/133780549'
```
发送请求并获取HTML内容

使用requests库发送请求，获取回答的HTML内容。
```
response = requests.get(answer_url)
html_content = response.content
```
解析HTML内容

使用BeautifulSoup库解析HTML内容，从中提取图片URL。
```
soup = BeautifulSoup(html_content, 'html.parser')
```

提取图片URL

使用BeautifulSoup库的find_all()方法提取图片URL。

image_urls = soup.find_all('img', class_='origin_image zh-lightbox-thumb')

保存图片

使用tqdm库显示下载进度，并使用requests库下载图片并保存到本地。

for image_url in tqdm(image_urls):
    image_url = image_url['src']
    image_name = image_url.split('/')[-1]
    image_data = requests.get(image_url).content
    with open(image_name, 'wb') as f:
        f.write(image_data)