深度剖析并发中的伪共享：现象、影响和解决方案

2024-01-12 12:56:48

并发不得不说的伪共享

引言

踏入并发编程的浩瀚领域，我们如同航行在茫茫大海之中，每深入一步，都发现自己离理解的彼岸更远。然而，在探索的途中，也不断收获着惊喜，领略着框架设计中的匠心独运。其中，伪共享这一概念尤为引人入胜。

什么是伪共享

伪共享是一种并发编程中可能遇到的问题，它发生在两个或多个线程同时访问位于同一缓存行中的不同变量时。缓存行是处理器架构中的一种优化机制，用于一次性从内存中加载多个相邻的字节。当不同的线程访问位于同一缓存行的不同变量时，可能会导致缓存行在多个处理器内核之间频繁地来回移动，从而产生额外的开销，影响性能。

伪共享产生的原因

伪共享产生的主要原因是处理器缓存的组织方式。现代处理器使用多级缓存层次结构，每个级别都比上一级更小、更快。当一个线程访问某个变量时，该变量所在的缓存行会被加载到处理器的缓存中。如果另一个线程随后访问位于同一缓存行中的不同变量，则该缓存行将从处理器的缓存中逐出，并重新加载到内存中。

伪共享的影响

伪共享会对应用程序性能产生负面影响。以下是伪共享的一些潜在后果：

缓存抖动： 由于伪共享，缓存行会在不同的处理器内核之间频繁地来回移动，导致额外的缓存未命中和性能下降。
总线争用： 当多个线程同时访问位于同一缓存行中的不同变量时，可能会导致总线争用，进而影响其他内存访问操作的性能。
死锁： 在某些情况下，伪共享甚至可能导致死锁，因为线程可能会无限期地等待访问同一缓存行中的不同变量。

伪共享的解决方案

识别和解决伪共享问题至关重要，以确保应用程序的最佳性能。以下是一些常见的解决方案：

对齐数据： 通过使用编译器指令或手动对齐数据结构，可以确保位于不同缓存行中的变量不会出现伪共享。
使用 padding： 在变量之间添加额外的字节或字段，以强制它们位于不同的缓存行中。
使用锁： 使用锁可以确保一次只有一个线程访问共享数据，从而消除伪共享。
使用无锁数据结构： 无锁数据结构，例如原子变量和无锁队列，专为避免伪共享而设计。

案例研究

让我们以一个具体的例子来说明伪共享的影响。考虑以下 C++ 代码段：

struct MyStruct {
  int a;
  int b;
};

int main() {
  MyStruct s;

  std::thread t1([&s] {
    while (true) {
      s.a++;
    }
  });

  std::thread t2([&s] {
    while (true) {
      s.b++;
    }
  });

  t1.join();
  t2.join();

  return 0;
}

在这个示例中，MyStruct 结构体中的变量 a 和 b 位于同一个缓存行中。当线程 t1 和 t2 同时对这些变量进行递增操作时，将导致缓存抖动，因为缓存行将在两个线程之间不断地来回移动。

解决伪共享

我们可以通过对 MyStruct 结构体进行对齐来解决伪共享问题：

#pragma pack(push, 1)
struct MyStruct {
  int a;
  int b;
};
#pragma pack(pop)

通过使用 #pragma pack 指令，我们可以强制编译器将 MyStruct 结构体中的变量对齐到 1 字节边界，确保它们位于不同的缓存行中。

结论

伪共享是并发编程中一个潜在的性能问题，但通过理解其原因、影响和解决方案，我们可以采取措施来避免它。对齐数据、使用 padding、使用锁或使用无锁数据结构，可以帮助我们消除伪共享，提高应用程序性能。不断学习并发编程中的新知识和技巧，将使我们能够编写出更强大、更高效的代码。

Kyle

探索Web开发资源和人工智能教程的代码社区

联系我

扫码关注微信公众号

深度剖析并发中的伪共享：现象、影响和解决方案

Kyle

Beat the Heat: Keep Your Mac Cool and Running Smoothly

《程序员的自我修养》-（4）静态链接 - 背后的原理与应用

让学历不再成为编程障碍：重新定义学习之路

敢问孙宇晨，能否和王小川好好说话？

无领导小组：从面试中获取成就，解开成功密码