Fiberは「ノンプリエンプティブな軽量スレッド」とRuby のマニュアルに記載されています。
ノンプリエンプティブ(non preemptive)とは、マルチタスク の切り替えをプログラム自身にまかせること
プリエンプティブ(preemptive)とは、マルチタスク の切り替えをOSが行うこと
preemptiveは金融の用語のようです。
「先買いの、先買権のある」と辞書にありますが(ジー ニアス英和辞典)、株式の売却時に優先的に買い取る権利を含む契約で、敵対勢力に株式を渡さないための方策だそうです。
このことについては、私は門外漢なので、正確な情報ではないことをお断りしておきます。
IT用語においては、「プリエンプティブ」はCPU時間を割り当てるときにOSが優先的にCPU時間を買取ってタスクに割り当てる、ということから使われるようになったのではないでしょうか。
さて、Fiberを使う場合、メインのプログラムとFiberのブロックの2つのタスクが動きます。
そして、プログラム中のresumeやyieldというメソッドがタスクの切り替えをします。
したがって、切り替えは完全にプログラムによってコントロール されており、その点でいつ切り替わるかはOS次第というプロセスとは異なります。
また、ここでいうタスクはRuby のThreadとは異なるので注意してください。
簡単なプログラム例
ファイバーの定義
ファイバーを定義するには、Fiber.new
を使い、ファイバー自体はそのブロックに記述します。
fiber = Fiber .new do
" abc " .each_char do |c|
print "#{ c}\n"
Fiber .yield
end
nil
end
このブロックはメインプログラムの中で呼ばれるfiber.resume
メソッドによって実行されます。
最初にfiber.resume
が呼ばれたとき、ブロックの最初からFiber.yeild
までが実行される
Fiber.yield
の実行により、ブロックは一旦実行が止まり、メインルーチンのfiber.resume
の次からに実行が移る
次にfiber.resume
が呼ばれたときは、ブロックのFiber.yield
から実行され、再びFiber.yield
に達するか、ブロックの最後に達するまでそれが続く
その後は実行はメインルーチンのfiber.resume
の次に移る
ブロックの最後まで達したファイバーはfield.resume
が呼ばれても実行できない。これはエラーになる
簡単なプログラム例
次の例は、メインとファイバーのブロックで交互にprint文を実行するメソッドです。
def example1
fiber = Fiber .new do
" abc " .each_char do |c|
print "#{ c}\n"
Fiber .yield
end
nil
end
101 .upto(103 ) do |j|
fiber.resume
print "#{ j}\n"
end
end
example1
このプログラムの実行順を図にしました。
Fiberの実行順
実行結果はつぎのようになります。
$ ruby _example/example39.rb
a
101
b
102
c
103
$
ポイントは、Fiber.yield
とfiber.resume
で切り替わるところです。
ファイバーの使いどころ
ファイバーはどのようなプログラムに適しているのでしょうか?
ファイバーはコルーチンと呼ばれることもありますが、ウィキペディア のコルーチン では、
サブルーチンと異なり、状態管理を意識せずに行えるため、協調的処理、イテレータ 、無限リスト、パイプなど、継続状況を持つプログラムが容易に記述できる。
と書かれています。
ここでは、このうちイテレータ とパイプについて考えてみたいと思います。
なお、ここでの記述については、誤りを含んでいるかもしれませんので、ご注意ください。
また、誤りにお気づきの方はコメントでご指摘いただければありがたいです。
イテレータ というと、Ruby のeachメソッドを思い浮かべるのではないでしょうか。
eachメソッドは、そのオブジェクトの要素を取り出してブロック・パラメータに代入し、繰り返しブロックを実行します。
このような繰り返し処理を「イテレータ 」といいます。
eachメソッドの方式は「内部イテレータ 」といいます。
これに対して「外部イテレータ 」というのがあります。Enumeratorクラスのnextメソッドはその例です。
nextメソッドは呼ばれるたびに「次のデータ」を返します。
def example2
a = [1 ,2 ,3 ].to_enum
p a.next
p a.next
p a.next
end
example2
このプログラムでは配列[1,2,3]
をto_enum
メソッドでEnumeratorオブジェクトに変換しています。
Enumeratorオブジェクトのnextメソッドは呼ばれるたびに、1,2,3と順にその要素を返していきます。
ひとつのメソッド「next」が呼ばれるたびに異なる要素を返すので、これもイテレータ と呼ばれるのです。
より正確には「外部イテレータ 」です。
外部イテレータ はFiberで簡単に実装できます。
def example3
fiber = Fiber .new do
[1 ,2 ,3 ].each do |i|
Fiber .yield(i)
end
end
p fiber.resume
p fiber.resume
p fiber.resume
end
example3
Fiber.yieldに引数をつけると、その引数の値が対応するfiber.resumeの値になります。
これによって、ファイバーから外部にデータを渡すことができます。
この例では、ファイバー外部でresumeを呼ぶたびにファイバー内部のイテレータ が繰り返し処理をするので、順に要素が返されます。
なお、Rubyのドキュメント に
Enumerator(の外部イテレータ )は Fiber を用いて実装されています。
と書かれています。
パイプ
パイプというのは、Bash などのシェルプログラムで2つのプロセスをつなぎ、片方の出力を他方の入力につなげる機能です。
例えば
cat: ファイルを読み込み、標準出力に書き出す
wc: 文字数、単語数、行数などを計算して書き出す
をパイプ「|
」で結びつけると、
$ cat example3.rb | wc
39 59 455
となり、ファイルexample3.rbは
行数が39
単語数が59(単語は空白や改行で区切られる文字列)
文字数が455
であることがわかります。
このとき
catによってexample3.rbの内容が標準出力に送られ
その出力はパイプ「|
」によって次のコマンドの標準入力に結び付けられ
それはwcによって行数、単語数、文字数として標準出力に出力される
ということになります。
一般にあるプロセスの出力をバッファに保存し、それを別のプロセスの入力につなげる問題を「生産者ー消費者問題 」といいます。
並行動作するプロセスでこれを行う場合、セマフォ を使って実現します。
セマフォ は一般に短いプログラムで、セマフォ の実行中は他のタスクに切り替わらないことが保証されています。
ファイバーを使う場合は、タスクが切り替えのタイミングを決められるのでセマフォ は不要で、プログラムも簡単になります。
また、消費者側をメインにし生産者側をファイバーにする「消費者起動方式」が理解しやすいです。
catとwcに相当するプログラムをFiberで作ってみましょう。
ただし、単純化 するためwc部分は行数のみをカウントすることにします。
def example4 filename
fiber = Fiber .new do
File .open(filename) do |file|
while (s = file.gets)
Fiber .yield(s)
end
end
nil
end
nline = 0
while fiber.resume
nline +=1
end
print "#{ nline}\n"
end
example4(" example39.rb " )
ファイバー側はファイルをオープン後、一行入力してはyieldします。
EOFになるとfile.gets
はnil を返すのでwhileループが終了します。
ですから、最後にfiber.resume
で呼ばれたときは、whileループを脱出するのでFiber.yield
は実行されません。
そのときにはFiber.new
のブロックの値(ブロックの最後に評価された値)がfiber.resume
の値として返されます。
すなわち、nil が返ります。
メインルーチンはfiber.resume
の値をチェックして真(この場合は文字列が返っている)ならばnline
をカウントアップします。
最後にnil が返ってきてwhileループを抜け、nlineの値をプリントします。
ファイバーとメソッド
ファイバーはイテレータ やパイプなどを分かりやすく表現することができるのですが、同様のことはインスタンス 変数とメソッドで実現することができます。
そのため、あまりファイバーは使われないのが実情ではないでしょうか。
しかし、最後の例のようなファイルをオープンするケースをメソッドで実装する場合、オープンとクローズは別メソッドで行うのが多いです。
つまり、オープン、一行読込、クローズの3つのメソッドを用いることになります。
Fiberは、その中でオープン、クローズも行えるので一つで済み、実装が簡単です。
ファイバーは他の言語ではコルーチンと呼ばれることもあります。
例えば、Lua ではコルーチンと呼んでいます。
ネットでもファイバーよりもコルーチンで検索するほうが多くの情報にヒットします。