一、什么是GIL

GIL即全局解释锁(global interpreter lock)，这个锁环绕着Ruby代码的执行，在一个多线程上下文中，任何时候只有一个线程可以执行Ruby代码。因此即使在多核的机器上运行多线程应用，在特定时间点上也只有一个线程和一个核心在忙碌，GIL一直保护着Ruby内核，以免竞争条件造成数据混乱。

二、GIL产生原因

首先，Ruby线程依托于原生操作系统线程，所以Ruby线程的调度也是源于操作系统的线程调度程序。其次，对于Ruby来说其实没有什么操作是线程安全的，比如最简单的数组附加，如下：

arr =[]
arr << ‘str1’

Ruby中的数组附加其实包含许多步骤，在其底层实现上是包含一大堆代码：

VALUE rb_ary_push(VALUE ary, VALUE iterm)
{
    long idx =RARRAY_LEN(ary);
    ary_ensure_room_for_push(ary, 1);
    RARRAY_ASET(ary, idx, item);
    ARY_SET_LEN(ary, idx + 1);
    returnary;
}

这段代码揭示了数据附加包含以下几个步骤：

1. 获取数组当前长度；

2. 检查数组是否有空间容纳新的元素；

3. 将元素附加到数组；

4. 修改数据长度+1。

由于这么一系列操作不是线程安全的，所以在多线程应用中，会频繁发生上下文切换，这样就可能会发生一些匪夷所思的错误，为此，我们需要使这些操作具有原子性，所以我们需要使用GIL来解决这个问题。GIL保卫着系统的内部状态，使用GIL，就不需要在数据结构周围使用任何锁或者同步机制。如果两个线程不能够同时改变内部状态，也就不会有竞争条件发生了。

三、GIL的实现原理

Ruby的线程依托于原生的操作系统的线程，但是当一个Ruby线程希望在其原生操作系统线程中执行代码的时，必须要先获得GIL，如下图所示，在特定时间点上只有一个线程可以获取GIL，于是Ruby的代码执行是完全不能并行的。

那么Ruby如何保证GIL被线程独霸呢？Ruby提供了一个计时器线程，这个线程是仅存在于Ruby内部的原生线程，当Ruby启动并只有主线程运行时，定时器线程处于沉睡状态，但一旦有线程等待GIL，定时器线程就会被唤醒。定时器线程是用于避免一个线程独霸GIL的情况，每经过一定周期，定时器线程在当前持有GIL的线程上设置一个中断标志，Ruby会检查这些中断标志，被设置中断标志的线程会停止运行并释放GIL，这样，别的线程就可以获取GIL继而执行其代码。

四、总结

GIL是Ruby内部实现细节，是为了保证Ruby内部执行的安全，它保证了Ruby中C实现的底层方法的原子性。

PS：以上内容都是基于CRuby的，对于JRuby或者Rubinius来说，它们是可以真正做到多线程并发执行的。

Ruby的GIL

相关文章

热门标签

最新文章