如何优化PyTorch张量第一维相乘和求和？

2024-03-14 21:01:32

使用 PyTorch 实现张量第一维相乘和求和的优化方法

问题

在机器学习中，我们经常需要对高维张量进行运算。其中，一个常见的问题是如何对两个张量进行相乘并求和，使得输出形状满足特定要求。

考虑两个 PyTorch 张量 a 和 b，分别具有形状 (S, M) 和 (S, M, H)。M 是批处理维度。我们的目标是计算 a[s] * b[s] 在 s 上的和，并得到形状为 (M, H) 的输出。

传统方法的局限性

传统的方法是使用 torch.tensordot 函数，但它会进行不必要的计算，并且我们需要对结果进行切片才能得到所需的值。

优化方法

为了避免不必要的计算，我们可以使用一个更直接的方法：torch.einsum 函数。torch.einsum 提供了爱因斯坦求和约定，允许我们指定要执行的求和运算。

具体实现

对于 a 和 b，我们可以使用以下代码进行计算：

import torch
output = torch.einsum("sm,smh->mh", a, b)

其中，sm 表示对 a 的第一维求和，smh 表示对 b 的前两维求和。这将产生形状为 (M, H) 的输出。

示例

我们以一个示例来说明：

S, M, H = 2, 2, 3
a = torch.arange(S*M).view((S,M))
b = torch.arange(S*M*H).view((S,M,H))

output = torch.einsum("sm,smh->mh", a, b)
print(output)

输出为：

tensor([[12, 14, 16],
        [30, 34, 38]])

优势

使用 torch.einsum 方法有以下优势：

结论

在 PyTorch 中对张量进行第一维相乘和求和时，使用 torch.einsum 函数比 torch.tensordot 更高效、更直接。它可以避免不必要的计算并产生所需形状的输出。

常见问题解答

探索Web开发资源和人工智能教程的代码社区

扫码关注微信公众号