Web 應(yīng)用大多是 IO 密集型的,利用 Ruby 多進(jìn)程+多線程模型將能大幅提升系統(tǒng)吞吐量。其原因在于:當(dāng)Ruby 某個(gè)線程處于 IO Block 狀態(tài)時(shí),其它的線程還可以繼續(xù)執(zhí)行。但由于存在 Ruby GIL (Global Interpreter Lock),MRI Ruby 并不能真正利用多線程進(jìn)行并行計(jì)算。JRuby 去除了 GIL,是真正意義的多線程,既能應(yīng)付 IO Block,也能充分利用多核 CPU 加快整體運(yùn)算速度。
上面說得比較抽象,下面就用例子一一加以說明。
Ruby 多線程和 IO Block
先看下面一段代碼(演示目的,沒有實(shí)際用途):
復(fù)制代碼 代碼如下:
# File: block_io1.rb
def func1
puts "sleep 3 seconds in func1\n"
sleep(3)
end
def func2
puts "sleep 2 seconds in func2\n"
sleep(2)
end
def func3
puts "sleep 5 seconds in func3\n"
sleep(5)
end
func1
func2
func3
代碼很簡單,3 個(gè)方法,用 sleep 模擬耗時(shí)的 IO 操作。 運(yùn)行代碼(環(huán)境 MRI Ruby 1.9.3) 結(jié)果是:
復(fù)制代碼 代碼如下:
$ time ruby block_io1.rb
sleep 3 seconds in func1
sleep 2 seconds in func2
sleep 5 seconds in func3
real 0m11.681s
user 0m3.086s
sys 0m0.152s
比較慢,時(shí)間都耗在 sleep 上了,總共花了 10 多秒。
采用多線程的方式,改寫如下:
復(fù)制代碼 代碼如下:
# File: block_io2.rb
def func1
puts "sleep 3 seconds in func1\n"
sleep(3)
end
def func2
puts "sleep 2 seconds in func2\n"
sleep(2)
end
def func3
puts "sleep 5 seconds in func3\n"
sleep(5)
end
threads = []
threads Thread.new { func1 }
threads Thread.new { func2 }
threads Thread.new { func3 }
threads.each { |t| t.join }
運(yùn)行的結(jié)果是:
復(fù)制代碼 代碼如下:
$ time ruby block_io2.rb
sleep 3 seconds in func1
sleep 2 seconds in func2
sleep 5 seconds in func3
real 0m6.543s
user 0m3.169s
sys 0m0.147s
總共花了 6 秒多,明顯快了許多,只比最長的 sleep 5 秒多了一點(diǎn)。
上面的例子說明,Ruby 的多線程能夠應(yīng)付 IO Block,當(dāng)某個(gè)線程處于 IO Block 狀態(tài)時(shí),其它的線程還可以繼續(xù)執(zhí)行,從而使整體處理時(shí)間大幅縮短。
Ruby GIL 的影響
還是先看一段代碼(演示目的):
復(fù)制代碼 代碼如下:
# File: gil1.rb
require 'securerandom'
require 'zlib'
data = SecureRandom.hex(4096000)
16.times { Zlib::Deflate.deflate(data) }
代碼先隨機(jī)生成一些數(shù)據(jù),然后對(duì)其進(jìn)行壓縮,壓縮是非常耗 CPU 的,在我機(jī)器(雙核 CPU, MRI Ruby 1.9.3)運(yùn)行結(jié)果如下:
復(fù)制代碼 代碼如下:
$ time ruby gil1.rb
real 0m8.572s
user 0m8.359s
sys 0m0.102s
更改為多線程版本,代碼如下:
復(fù)制代碼 代碼如下:
# File: gil2.rb
require 'securerandom'
require 'zlib'
data = SecureRandom.hex(4096000)
threads = []
16.times do
threads Thread.new { Zlib::Deflate.deflate(data) }
end
threads.each {|t| t.join}
多線程的版本運(yùn)行結(jié)果如下:
復(fù)制代碼 代碼如下:
$ time ruby gil2.rb
real 0m8.616s
user 0m8.377s
sys 0m0.211s
從結(jié)果可以看出,由于 MRI Ruby GIL 的存在,Ruby 多線程并不能重復(fù)利用多核 CPU,使用多線程后整體所花時(shí)間并不縮短,反而由于線程切換的影響,所花時(shí)間還略有增加。
JRuby 去除了 GIL
使用 JRuby (我的機(jī)器上是 JRuby 1.7.0)運(yùn)行 gil1.rb 和 gil2.rb,得到很不一樣的結(jié)果。
復(fù)制代碼 代碼如下:
$ time jruby gil1.rb
real 0m12.225s
user 0m14.060s
sys 0m0.615s
復(fù)制代碼 代碼如下:
$ time jruby gil2.rb
real 0m7.584s
user 0m22.822s
sys 0m0.819s
可以看到,JRuby 使用多線程時(shí),整體運(yùn)行時(shí)間有明顯縮短(7.58 比 12.22),這是由于 JRuby 去除了 GIL,可以真正并行的執(zhí)行多線程,充分利用了多核 CPU。
總結(jié):Ruby 多線程可以在某個(gè)線程 IO Block 時(shí),依然能夠執(zhí)行其它線程,從而降低 IO Block 對(duì)整體的影響,但由于 MRI Ruby GIL 的存在,MRI Ruby 并不是真正的并行執(zhí)行,JRuby 去除了 GIL,可以做到真正的多線程并行執(zhí)行。