Keyboard shortcuts

Press or to navigate between chapters

Press S or / to search in the book

Press ? to show this help

Press Esc to hide this help

[インデックス 18300] ファイルの概要

このコミットは、Goランタイムにおけるデータ競合検出器(Race Detector)の挙動を修正し、チャネル送信(chansend)操作によって読み取られるオブジェクトに対しても適切にリード操作を記録するように変更を加えるものです。これにより、チャネルを介したデータフローにおける潜在的なデータ競合をより正確に検出できるようになります。

コミット

  • コミットハッシュ: abd588aa835fa3f462640cc8eba6d192a8462667
  • Author: Keith Randall khr@golang.org
  • Date: Tue Jan 21 11:17:44 2014 +0400

GitHub上でのコミットページへのリンク

https://github.com/golang/go/commit/abd588aa835fa3f462640cc8eba6d192a8462667

元コミット内容

runtime: fix race detector by recording read by chansend.

R=golang-codereviews, dvyukov, khr
CC=golang-codereviews
https://golang.org/cl/54060043

変更の背景

Goのデータ競合検出器は、並行処理におけるデータ競合(複数のGoroutineが同時に同じメモリ位置にアクセスし、少なくとも一方が書き込み操作である場合に発生する競合)を特定するための強力なツールです。しかし、チャネルを介したデータの受け渡しは、一見すると安全に見えるものの、内部的にはメモリの読み書きを伴います。

このコミット以前のGoランタイムのデータ競合検出器は、チャネル送信操作(chansend)において、送信される値がメモリから読み取られることを適切に記録していませんでした。これにより、あるGoroutineがチャネルに値を送信する際に、その値が別のGoroutineによって競合的に書き込まれていたとしても、データ競合検出器がそれを検出できないという問題がありました。

具体的には、チャネル送信は、送信元から値のコピーを行うため、送信元のメモリ領域に対する「読み取り」操作と見なすことができます。この読み取り操作がデータ競合検出器に記録されないと、以下のようなシナリオで問題が発生します。

  1. Goroutine Aが共有変数xに値を書き込む。
  2. Goroutine Bがxの値をチャネルに送信する。
  3. Goroutine Aがxに別の値を書き込む。

もしGoroutine Bのチャネル送信がxの読み取りとして記録されていなければ、Goroutine Aの2回目の書き込みとGoroutine Bの読み取り(チャネル送信)の間にデータ競合が存在しても、検出器はそれを報告しませんでした。このコミットは、このギャップを埋め、チャネル送信が伴う暗黙的な読み取り操作を明示的に記録することで、データ競合検出器の精度と信頼性を向上させることを目的としています。

前提知識の解説

Goのデータ競合検出器 (Race Detector)

Goのデータ競合検出器は、Goプログラムの実行中にデータ競合を動的に検出するツールです。go run -racego build -racego test -raceなどのコマンドで有効にできます。データ競合は、以下の3つの条件がすべて満たされたときに発生します。

  1. 少なくとも2つのGoroutineが同じメモリ位置にアクセスする。
  2. 少なくとも1つのアクセスが書き込みである。
  3. アクセスが同期メカニズムによって保護されていない。

データ競合は、プログラムの予測不可能な動作やバグ(例: 競合状態、デッドロック)の原因となるため、Goのデータ競合検出器は並行プログラムのデバッグにおいて非常に重要な役割を果たします。検出器は、各メモリアクセスを監視し、アクセス履歴を記録することで、競合パターンを特定します。

Goのチャネル (Channels)

Goのチャネルは、Goroutine間で値を安全に受け渡しするための主要な同期メカニズムです。チャネルは、GoのCSP(Communicating Sequential Processes)モデルの中心的な概念であり、共有メモリによる同期ではなく、通信による同期を推奨します。

  • 送信操作: ch <- value は、valueをチャネルchに送信します。
  • 受信操作: value := <-ch は、チャネルchから値を受信し、valueに代入します。

チャネルは、デフォルトでバッファなし(unbuffered)の場合、送信と受信が同期します。つまり、送信Goroutineは受信Goroutineが値を受け取るまでブロックされ、受信Goroutineは送信Goroutineが値を送信するまでブロックされます。バッファ付き(buffered)チャネルの場合、バッファが満杯になるか空になるまでブロックされません。

チャネルを介した値の受け渡しは、Goのメモリモデルにおいて「happens-before」関係を確立します。つまり、チャネルへの送信操作は、そのチャネルからの受信操作よりも前に発生することが保証されます。これにより、チャネルを介して渡された値は、受信側で安全に読み取れることが保証されます。しかし、このコミットが対処しているのは、チャネルに値を「送信する前」に、その値がどこから読み取られるかという点です。チャネル送信は、送信される値をメモリからコピーする操作であり、このコピー元へのアクセスが競合検出の対象となります。

runtime·racereadobjectpc

これはGoランタイム内部で使用される関数で、データ競合検出器がメモリの読み取り操作を記録するために呼び出されます。この関数は、読み取られたオブジェクトのアドレス、そのサイズ、および読み取りを行ったプログラムカウンタ(PC)などの情報を受け取ります。データ競合検出器はこれらの情報を用いて、並行して行われる他のメモリ操作との競合を検出します。

技術的詳細

このコミットの技術的な核心は、runtime·chansend関数内にruntime·racereadobjectpcの呼び出しを追加した点にあります。

runtime·chansendは、Goのチャネルに値を送信する際のランタイム関数です。この関数は、送信される値(epが指すメモリ領域)をチャネルの内部バッファまたは受信Goroutineのスタックにコピーします。このコピー操作は、実質的にepが指すメモリ領域からの「読み取り」です。

コミット前の実装では、この読み取り操作がデータ競合検出器に明示的に通知されていませんでした。そのため、epが指すメモリ領域が別のGoroutineによって同時に書き込まれていた場合でも、データ競合検出器はその競合を検出できませんでした。

追加されたコードは以下の通りです。

+ if(raceenabled)
+   runtime·racereadobjectpc(ep, t->elem, runtime·getcallerpc(&t), runtime·chansend);

このコードスニペットは、raceenabled(データ競合検出器が有効になっているかどうかを示すフラグ)が真の場合にのみ実行されます。

  • ep: 送信される値が格納されているメモリ領域へのポインタです。これが読み取りの対象となるオブジェクトです。
  • t->elem: チャネルの要素の型情報(サイズなど)を含みます。runtime·racereadobjectpcは、読み取られるオブジェクトのサイズを知る必要があります。
  • runtime·getcallerpc(&t): この呼び出しが行われた場所のプログラムカウンタ(PC)を取得します。これは、データ競合が検出された際に、どのコードが読み取り操作を行ったかを特定するために使用されます。
  • runtime·chansend: これは、読み取り操作の「コンテキスト」または「タグ」として使用される関数ポインタです。データ競合検出器は、この情報を使用して、競合が発生した操作の種類をより詳細に報告できます。

この変更により、チャネル送信操作が、送信される値のメモリからの読み取りとして正確に記録されるようになります。これにより、チャネル送信に関連するデータ競合が、データ競合検出器によって適切に検出されるようになり、Goプログラムの並行処理の安全性が向上します。

また、runtime·chanrecv関数には、// raceenabled: don't need to check ep, as it is always on the stack.というコメントが追加されています。これは、チャネル受信操作においては、受信される値が常にスタック上に配置されるため、ep(受信バッファ)に対する競合検出の必要がないことを示しています。スタック上のメモリは通常、そのGoroutineにプライベートであり、他のGoroutineとの競合は発生しないためです。

コアとなるコードの変更箇所

--- a/src/pkg/runtime/chan.c
+++ b/src/pkg/runtime/chan.c
@@ -159,6 +159,9 @@ runtime·chansend(ChanType *t, Hchan *c, byte *ep, bool *pres, void *pc)\n 	G* gp;\n 	int64 t0;\n \n+\tif(raceenabled)\n+\t\truntime·racereadobjectpc(ep, t->elem, runtime·getcallerpc(&t), runtime·chansend);\n+\n \tif(c == nil) {\n \t\tUSED(t);\n \t\tif(pres != nil) {\
@@ -292,6 +295,8 @@ runtime·chanrecv(ChanType *t, Hchan* c, byte *ep, bool *selected, bool *receive\n 	G *gp;\n 	int64 t0;\n \n+\t// raceenabled: don\'t need to check ep, as it is always on the stack.\n+\n \tif(debug)\n \t\truntime·printf(\"chanrecv: chan=%p\\n\", c);\

コアとなるコードの解説

変更は主にsrc/pkg/runtime/chan.cファイルにあります。

  1. runtime·chansend関数への追加: runtime·chansend関数の冒頭に、以下の3行が追加されました。

    + if(raceenabled)
    +   runtime·racereadobjectpc(ep, t->elem, runtime·getcallerpc(&t), runtime·chansend);
    

    このコードブロックは、Goのデータ競合検出器が有効になっている場合(raceenabledが真の場合)にのみ実行されます。 runtime·racereadobjectpc関数が呼び出され、epが指すメモリ領域(チャネルに送信される値)が読み取られたことをデータ競合検出器に通知します。

    • ep: 送信される値のデータが格納されているメモリのアドレス。
    • t->elem: チャネルの要素の型情報。これにより、runtime·racereadobjectpcは読み取られたデータの正確なサイズを把握できます。
    • runtime·getcallerpc(&t): このruntime·racereadobjectpcの呼び出し元のプログラムカウンタ(PC)を取得します。これは、競合が報告された際に、どのコードパスが関与したかを特定するのに役立ちます。
    • runtime·chansend: この引数は、この読み取り操作がchansend関数内で行われたことを示すコンテキスト情報として使用されます。

    この追加により、チャネル送信操作が、送信元メモリからの読み取りとしてデータ競合検出器に正確に記録されるようになり、チャネルを介したデータフローにおける潜在的なデータ競合の検出精度が向上しました。

  2. runtime·chanrecv関数へのコメント追加: runtime·chanrecv関数には、以下のコメントが追加されました。

    +\t// raceenabled: don\'t need to check ep, as it is always on the stack.\
    

    このコメントは、チャネル受信操作においては、受信される値が常にGoroutineのスタック上に配置されるため、ep(受信バッファ)に対するデータ競合検出の必要がないことを説明しています。スタック上のメモリは通常、そのGoroutineにプライベートであり、他のGoroutineとの競合は発生しないため、runtime·racereadobjectpcのような呼び出しは不要です。

これらの変更は、Goのデータ競合検出器がチャネル操作をより正確に理解し、並行プログラムにおける隠れたデータ競合を効果的に特定できるようにするために不可欠でした。

関連リンク

参考にした情報源リンク