PyTorch Tensor：深入浅出，驾驭张量创建与维度操作

2023-12-26 13:20:58

掌握 PyTorch 中的张量：深度学习模型的数据基础

在深度学习的世界中，张量是至关重要的数据结构，承载着模型训练和推理的关键数据。PyTorch 是一个领先的深度学习框架，它的张量操作能力赋予了其强大的灵活性和高效性。

想象一下张量就像一个多维数组，它可以存储各种类型的数据。与 NumPy 中的 ndarray 类似，PyTorch 的张量允许您操作复杂的数学运算和处理大数据集。

创建张量的途径多种多样：

import torch

# 创建一个包含数字的 2x3 张量
x = torch.tensor([[1, 2, 3], [4, 5, 6]])

# 创建一个 3x4 的全 1 张量
y = torch.ones((3, 4))

# 创建一个 2x2 的全 0 张量
z = torch.zeros((2, 2))

# 创建一个 5x5 的正态分布张量
a = torch.randn((5, 5))

# 创建一个 3x3 的均匀分布张量
b = torch.rand((3, 3))

import numpy as np

# 创建一个 NumPy 数组
arr = np.array([[1, 2, 3], [4, 5, 6]])

# 转换为张量
c = torch.from_numpy(arr)

张量的维度操作让您可以根据需要重新排列和调整张量的形状：

# 将 x 重塑为 1x6 张量
x_view = x.view(1, 6)

# 将 y 重塑为 2x3 张量
y_reshape = y.reshape((2, 3))

# 减少 z 的维度，从 2x2x1 到 2x2
z_squeeze = z.squeeze()

# 增加 a 的维度，从 5x5 到 1x5x5
a_unsqueeze = a.unsqueeze(0)

# 转置 x，从 2x3 到 3x2
x_transpose = x.transpose(0, 1)

# 重新排列 y，从 3x4 到 4x3
y_permute = y.permute(1, 0)

张量可以存储不同类型的数据，每种类型都有其特定的用途：

您可以通过 dtype 属性指定张量的数据类型，或使用转换函数（例如 float()) 进行转换。

张量可以存储在 CPU 或 GPU 上，这由 device 属性决定。默认情况下，张量存储在 CPU 上，但可以通过 to() 方法将其移动到 GPU。

GPU 具有强大的并行计算能力，可以显著提升深度学习模型的训练和推理速度。

张量之间可以轻松转换：

# 将 a 转换为 int 类型
a_int = a.int()

# 将 b 移动到 GPU
b_gpu = b.to('cuda')

# 将 c 转换为 NumPy 数组
c_numpy = c.numpy()

掌握 PyTorch 中的张量是深度学习的基础。通过了解创建、维度操作、数据类型、存储设备和转换张量的技巧，您可以充分利用其强大的功能，构建高效且准确的深度学习模型。

什么是张量？
张量是 PyTorch 中的多维数组，存储深度学习模型的数据。
如何创建张量？
您可以使用 torch.tensor(), torch.ones(), torch.zeros(), torch.randn(), torch.rand(), 或 torch.from_numpy() 函数创建张量。
如何操作张量的维度？
使用 view(), reshape(), squeeze(), unsqueeze(), transpose(), 和 permute() 函数进行维度操作。
张量支持哪些数据类型？
PyTorch 支持 float16, float32, float64, int8, int16, int32, int64, bool, complex64, 和 complex128 数据类型。
如何将张量移动到 GPU？
使用 to('cuda') 方法将张量移动到 GPU。