并发杀手：假共享给并发程序设置的隐形障碍

2023-09-27 23:03:25

假共享，一个潜藏在并发程序中的“隐形杀手”，可以轻而易举地让你的程序性能一落千丈。在这个数字时代，并发编程已经成为了一门必备技能，它可以大大提高程序的执行效率。然而，在并发编程的世界里，也存在着许多陷阱，而假共享就是其中之一。它会导致处理器缓存失效，从而降低程序的性能。

假共享的本质

假共享是指多个处理器共享同一个缓存行，但这些处理器对该缓存行中的数据进行读写时，却互不知道对方的存在。这种现象会导致处理器不断地从内存中重新加载数据，从而降低程序的性能。

产生假共享的原因

假共享产生的原因通常是由于数据结构的设计不当造成的。例如，如果一个数据结构中的成员变量被多个线程共享，那么当其中一个线程对该成员变量进行写操作时，其他线程可能会同时对该成员变量进行读操作。在这种情况下，处理器就会不断地从内存中重新加载该成员变量，从而导致假共享的产生。

避免假共享的方法

避免假共享的方法有多种，其中最常见的方法是使用“内存屏障”指令。内存屏障指令可以阻止处理器在执行某条指令之前或之后重新排序其他指令，从而确保处理器在执行内存访问指令之前，已经将所有对共享数据的修改都写入内存中。

除了使用内存屏障指令之外，还可以通过调整数据结构的设计来避免假共享。例如，可以将共享数据放置在不同的缓存行中，或者使用原子操作来访问共享数据。

总结

假共享是一个非常隐蔽的性能问题，它会导致处理器不断地从内存中重新加载数据，从而降低程序的性能。通过使用内存屏障指令和调整数据结构的设计，可以有效地避免假共享的产生，从而提高程序的性能。

代码示例

以下是一个演示假共享的代码示例：

#include <thread>
#include <atomic>

std::atomic<int> shared_variable = 0;

void thread_function() {
  for (int i = 0; i < 10000000; i++) {
    shared_variable++;
  }
}

int main() {
  std::thread t1(thread_function);
  std::thread t2(thread_function);

  t1.join();
  t2.join();

  std::cout << shared_variable << std::endl;

  return 0;
}

在这个代码示例中，两个线程同时对共享变量shared_variable进行递增操作。由于shared_variable是一个原子变量，因此不会出现数据竞争的问题。但是，由于shared_variable位于同一个缓存行中，因此当一个线程对shared_variable进行写操作时，另一个线程就会从内存中重新加载shared_variable的值。这会导致处理器不断地从内存中重新加载数据，从而降低程序的性能。

为了避免假共享，可以将shared_variable放置在不同的缓存行中。例如，可以将shared_variable定义为一个结构体的成员变量，如下所示：

struct SharedData {
  int shared_variable;
  int padding[63];
};

std::atomic<SharedData> shared_data;

void thread_function() {
  for (int i = 0; i < 10000000; i++) {
    shared_data.shared_variable++;
  }
}

int main() {
  std::thread t1(thread_function);
  std::thread t2(thread_function);

  t1.join();
  t2.join();

  std::cout << shared_data.shared_variable << std::endl;

  return 0;
}