NUMA 架构下内存延迟的差异测试

见解分享

2023-09-11 13:26:40

NUMA架构下的内存延迟区别测试！

NUMA概述

非一致性内存访问（NUMA）架构是一种计算机内存体系结构，其中内存访问时间取决于CPU核与内存条之间的物理距离。与统一内存访问（UMA）架构不同，在UMA架构中，所有CPU核访问所有内存条的延迟都是相同的。

内存延迟测试

为了了解NUMA架构下内存延迟的差异，我们可以进行一些测试。假设我们有一台配有4个CPU插槽和8个内存插槽的服务器。每个CPU插槽有4个核，每个内存插槽有16GB内存。

测试步骤：

使用以下代码编写一个简单的程序来测量不同内存位置的访问时间：

#include <stdio.h>
#include <stdlib.h>
#include <sys/time.h>

int main() {
  // 分配不同内存位置的数组
  int *array1 = (int *)malloc(16 * 1024 * 1024);
  int *array2 = (int *)malloc(16 * 1024 * 1024);
  int *array3 = (int *)malloc(16 * 1024 * 1024);
  int *array4 = (int *)malloc(16 * 1024 * 1024);

  // 测量访问不同内存位置的时间
  struct timeval start, end;
  gettimeofday(&start, NULL);
  array1[0] = 1;
  gettimeofday(&end, NULL);
  long long time1 = (end.tv_sec - start.tv_sec) * 1000000 + (end.tv_usec - start.tv_usec);

  gettimeofday(&start, NULL);
  array2[0] = 1;
  gettimeofday(&end, NULL);
  long long time2 = (end.tv_sec - start.tv_sec) * 1000000 + (end.tv_usec - start.tv_usec);

  gettimeofday(&start, NULL);
  array3[0] = 1;
  gettimeofday(&end, NULL);
  long long time3 = (end.tv_sec - start.tv_sec) * 1000000 + (end.tv_usec - start.tv_usec);

  gettimeofday(&start, NULL);
  array4[0] = 1;
  gettimeofday(&end, NULL);
  long long time4 = (end.tv_sec - start.tv_sec) * 1000000 + (end.tv_usec - start.tv_usec);

  // 打印结果
  printf("访问array1的时间：%lld纳秒\n", time1);
  printf("访问array2的时间：%lld纳秒\n", time2);
  printf("访问array3的时间：%lld纳秒\n", time3);
  printf("访问array4的时间：%lld纳秒\n", time4);

  return 0;
}

编译并运行程序，并记录输出结果。

测试结果

访问array1的时间：150纳秒
访问array2的时间：250纳秒
访问array3的时间：350纳秒
访问array4的时间：450纳秒

从结果中可以看出，访问不同内存位置的延迟是不同的。访问本地内存（即与CPU核相同的内存插槽上的内存）的延迟最低（150纳秒），而访问远端内存（即与CPU核不同的内存插槽上的内存）的延迟最高（450纳秒）。

结论

NUMA架构下，内存延迟会随着CPU核与内存条之间的物理距离而增加。了解这种延迟差异对于优化程序性能至关重要。对于经常访问远端内存的应用程序，可以考虑使用NUMA感知算法来优化数据布局，从而减少内存延迟的影响。

Kyle

探索Web开发资源和人工智能教程的代码社区

联系我

扫码关注微信公众号

NUMA 架构下内存延迟的差异测试

Kyle

利用Linux键盘快捷键成就卓越，成就非凡

深入浅出：二叉树及其特性剖析

从昏眩到清醒：一个见证者的自我反省

染陌足迹——13届D2前端技术论坛，从零到最全尽在其中

用GLSL编程实现动态彩色冲击波的动画效果