NumPy Jit 编译函数并行模式错误结果：诊断与解决方案

python

2024-03-02 14:05:09

NumPy jit 编译函数并行模式下的错误结果：诊断和解决

问题概述

在 NumPy jit 编译函数的并行模式下，程序返回数组中出现了不一致的值。这篇文章将深入探讨导致此问题的原因，并提供有效解决方案，帮助你排查和修复此类问题。

并行模式下的差异

NumPy 的并行模式能够利用多核处理器并行执行代码，从而大幅提升计算速度。然而，在使用并行模式时，可能会遇到与串行模式不同的错误结果。这是因为并行模式引入了并发性，多个线程同时访问共享资源可能会导致竞争条件。

竞争条件的根源

在我们的案例中，错误结果是由以下因素造成的：

原子操作缺失： 函数中使用 += 累加操作更新数组元素，但未使用原子操作来确保只有单个线程可以同时修改特定元素。
数组初始化： 数组在函数开头被初始化为 0，当多个线程试图同时写入同一索引时，可能会导致竞争条件。

解决方案：引入原子操作和预分配数组

为了解决竞争条件并获得正确的结果，我们可以：

使用原子操作： 使用 NumPy 的 atomic.add 函数来原子更新数组元素，确保只有单个线程可以修改特定元素。
预分配数组： 在函数开头预分配数组，而不是使用初始化为 0 的数组。这将防止竞争条件，因为每个元素将由一个特定的线程写入，而不是由多个线程竞争。

修改后的代码

改进后的并行函数如下：

import numpy as np
import numba as nb

@nb.njit("float64[::1], float64[:, ::1], uint64[:, ::1]", parallel=True)
def ft_Caps_bb_minp(rad_, cap_, ends_ind_):
    cap_min = np.empty_like(rad_)
    cap_min[:] = np.finfo(cap_.dtype).max
    for i in nb.prange(cap_.shape[0]):
        for j in range(2):
            rad_id = ends_ind_[i, j]
            if cap_min[rad_id] > cap_[i, j]:  # 比较大于号
                nb.atomic.add(cap_min, rad_id, -cap_[i, j])  # 使用原子操作更新
    return cap_min