C语言 spawn会显著降低子进程执行大分配的速度

siotufzp  于 2023-04-05  发布在  其他
关注(0)|答案(1)|浏览(137)

Ruby Process.spawn显著降低了子进程的执行速度。
出现这种情况的最小程序是以下用-O0编译的C程序:

  1. #include <stdlib.h>
  2. #include <string.h>
  3. int main(void) {
  4. int n = 1024*1024*128;
  5. for (int i = 0; i < 100; ++i) {
  6. char *mem = malloc(n);
  7. memset(mem, 1, n);
  8. free(mem);
  9. }
  10. }

当通过bash或python或C作为子进程执行时,执行时间为1.8秒。
但是当使用下面的ruby脚本时,它需要5秒的时间来执行:

  1. Process.wait(Process.spawn("./a.out"))

为什么会发生这种情况,我该如何预防?
编辑:我使用的是Ruby版本3.1.2p20

uujelgoq

uujelgoq1#

原因是参考ruby实现在Linux上关闭了透明巨大页面(THP)。此设置在execve()中保留,如man page中所述:

  1. PR_SET_THP_DISABLE (since Linux 3.15)
  2. Set the state of the "THP disable" flag for the calling
  3. thread. If arg2 has a nonzero value, the flag is set, other
  4. wise it is cleared. Setting this flag provides a method for
  5. disabling transparent huge pages for jobs where the code can
  6. not be modified, and using a malloc hook with madvise(2) is
  7. not an option (i.e., statically allocated data). The setting
  8. of the "THP disable" flag is inherited by a child created via
  9. fork(2) and is preserved across execve(2).

关闭透明的大页面:

  1. $ echo never | sudo tee /sys/kernel/mm/transparent_hugepage/enabled

将使运行时一致。
添加

  1. prctl(PR_SET_THP_DISABLE, 0 /* or 1 */, 0, 0, 0);

测试程序也将使运行时一致。
The change that introduced this in ruby可能没有考虑到这个设置是跨execve()保留的,因此它会对子进程中的大分配重工作负载产生负面影响。

展开查看全部

相关问题