无需发愁，Python下载网络图片方法全揭秘！

2023-12-24 20:58:35

前言

在我们的日常工作和生活中，经常需要从网络上下载图片。比如，我们要制作一份PPT，需要从网上下载一些图片来作为素材；我们要写一篇博客文章，需要从网上下载一些图片来作为插图；我们要设计一个网站，需要从网上下载一些图片来作为背景图等等。

那么，在Python中，如何下载网络图片呢？其实，方法有很多种。本文将对这些方法进行全面的汇总和讲解，并提供详细的实现代码。同时，还将介绍一些相关的知识，如图像处理、网络爬虫、Requests库、Beautiful Soup库、正则表达式、os库、shutil库等。希望通过本文，您能掌握Python中下载网络图片的各种方法，并能根据自己的需要选择最合适的方法。

常用方法

1. 直接使用requests库

requests库是一个非常好用的Python网络请求库。我们可以使用它来发送HTTP请求，并获取服务器的响应。如果服务器的响应包含图片数据，那么我们就可以将这些数据保存到本地文件中。

import requests

# 要下载的图片链接
url = 'http://xyz.com/image.jpg'

# 发送HTTP请求
response = requests.get(url)

# 获取图片数据
image_data = response.content

# 将图片数据保存到本地文件
with open('image.jpg', 'wb') as f:
    f.write(image_data)

2. 使用Beautiful Soup库

Beautiful Soup库是一个非常流行的Python HTML解析库。我们可以使用它来解析HTML文档，并从中提取我们需要的数据。如果我们要从HTML文档中提取图片链接，那么我们可以使用Beautiful Soup库来实现。

from bs4 import BeautifulSoup

# 要解析的HTML文档
html_doc = """
<html>
<head>

</head>
<body>
<img src="http://xyz.com/image1.jpg" alt="图片1">
<img src="http://xyz.com/image2.jpg" alt="图片2">
<img src="http://xyz.com/image3.jpg" alt="图片3">
</body>
</html>
"""

# 创建Beautiful Soup对象
soup = BeautifulSoup(html_doc, 'html.parser')

# 提取图片链接
image_links = [img['src'] for img in soup.find_all('img')]

# 下载图片
for image_link in image_links:
    # 发送HTTP请求
    response = requests.get(image_link)

    # 获取图片数据
    image_data = response.content

    # 将图片数据保存到本地文件
    with open(image_link.split('/')[-1], 'wb') as f:
        f.write(image_data)

3. 使用正则表达式

正则表达式是一种非常强大的字符串匹配工具。我们可以使用它来从字符串中提取我们需要的数据。如果我们要从HTML文档中提取图片链接，那么我们可以使用正则表达式来实现。

import re

# 要解析的HTML文档
html_doc = """
<html>
<head>

</head>
<body>
<img src="http://xyz.com/image1.jpg" alt="图片1">
<img src="http://xyz.com/image2.jpg" alt="图片2">
<img src="http://xyz.com/image3.jpg" alt="图片3">
</body>
</html>
"""

# 提取图片链接
image_links = re.findall(r'src="(.*?)"', html_doc)

# 下载图片
for image_link in image_links:
    # 发送HTTP请求
    response = requests.get(image_link)

    # 获取图片数据
    image_data = response.content

    # 将图片数据保存到本地文件
    with open(image_link.split('/')[-1], 'wb') as f:
        f.write(image_data)

4. 使用os库和shutil库

os库和shutil库是Python的两个非常常用的库。我们可以使用os库来操作文件系统，我们可以使用shutil库来复制文件和目录。如果我们要从网络上下载图片，那么我们可以使用os库和shutil库来实现。

import os
import shutil

# 要下载的图片链接
url = 'http://xyz.com/image.jpg'

# 下载图片
response = requests.get(url)

# 获取图片数据
image_data = response.content

# 创建图片文件
with open('image.jpg', 'wb') as f:
    f.write(image_data)

# 将图片文件复制到指定目录
shutil.copy('image.jpg', '/tmp/images/')