[インデックス 17148] ファイルの概要

このコミットは、Goコンパイラのコード生成部分（cmd/gc）において、関数のエントリ時に戻り値とローカル変数のポインタ部分をゼロクリアする変更を導入します。これは、Goのガベージコレクション（GC）がより正確に動作するための重要な中間ステップであり、特にインターフェース値の正確なコレクションを可能にするための基盤となります。

コミット

commit 7910cd68b55c445f2babae683aea97ba20daffbb
Author: Russ Cox <rsc@golang.org>
Date:   Fri Aug 9 23:10:58 2013 -0400

    cmd/gc: zero pointers on entry to function
    
    On entry to a function, zero the results and zero the pointer
    section of the local variables.
    
    This is an intermediate step on the way to precise collection
    of Go frames.
    
    This can incur a significant (up to 30%) slowdown, but it also ensures
    that the garbage collector never looks at a word in a Go frame
    and sees a stale pointer value that could cause a space leak.
    (C frames and assembly frames are still possibly problematic.)
    
    This CL is required to start making collection of interface values
    as precise as collection of pointer values are today.
    Since we have to dereference the interface type to understand
    whether the value is a pointer, it is critical that the type field be
    initialized.
    
    A future CL by Carl will make the garbage collection pointer
    bitmaps context-sensitive. At that point it will be possible to
    remove most of the zeroing. The only values that will still need
    zeroing are values whose addresses escape the block scoping
    of the function but do not escape to the heap.
    
    benchmark                         old ns/op    new ns/op    delta
    BenchmarkBinaryTree17            4420289180   4331060459   -2.02%
    BenchmarkFannkuch11              3442469663   3277706251   -4.79%
    BenchmarkFmtFprintfEmpty                100          142  +42.00%
    BenchmarkFmtFprintfString               262          310  +18.32%
    BenchmarkFmtFprintfInt                  213          281  +31.92%
    BenchmarkFmtFprintfIntInt               355          431  +21.41%
    BenchmarkFmtFprintfPrefixedInt          321          383  +19.31%
    BenchmarkFmtFprintfFloat                444          533  +20.05%
    BenchmarkFmtManyArgs                   1380         1559  +12.97%
    BenchmarkGobDecode                 10240054     11794915  +15.18%
    BenchmarkGobEncode                 17350274     19970478  +15.10%
    BenchmarkGzip                     455179460    460699139   +1.21%
    BenchmarkGunzip                   114271814    119291574   +4.39%
    BenchmarkHTTPClientServer             89051        89894   +0.95%
    BenchmarkJSONEncode                40486799     52691558  +30.15%
    BenchmarkJSONDecode                94193361    112428781  +19.36%
    BenchmarkMandelbrot200              4747060      4748043   +0.02%
    BenchmarkGoParse                    6363798      6675098   +4.89%
    BenchmarkRegexpMatchEasy0_32            129          171  +32.56%
    BenchmarkRegexpMatchEasy0_1K            365          395   +8.22%
    BenchmarkRegexpMatchEasy1_32            106          152  +43.40%
    BenchmarkRegexpMatchEasy1_1K            952         1245  +30.78%
    BenchmarkRegexpMatchMedium_32           198          283  +42.93%
    BenchmarkRegexpMatchMedium_1K         79006       101097  +27.96%
    BenchmarkRegexpMatchHard_32            3478         5115  +47.07%
    BenchmarkRegexpMatchHard_1K          110245       163582  +48.38%
    BenchmarkRevcomp                  777384355    793270857   +2.04%
    BenchmarkTemplate                 136713089    157093609  +14.91%
    BenchmarkTimeParse                     1511         1761  +16.55%
    BenchmarkTimeFormat                     535          850  +58.88%
    
    benchmark                          old MB/s     new MB/s  speedup
    BenchmarkGobDecode                    74.95        65.07    0.87x
    BenchmarkGobEncode                    44.24        38.43    0.87x
    BenchmarkGzip                         42.63        42.12    0.99x
    BenchmarkGunzip                      169.81       162.67    0.96x
    BenchmarkJSONEncode                   47.93        36.83    0.77x
    BenchmarkJSONDecode                   20.60        17.26    0.84x
    BenchmarkGoParse                       9.10         8.68    0.95x
    BenchmarkRegexpMatchEasy0_32         247.24       186.31    0.75x
    BenchmarkRegexpMatchEasy0_1K        2799.20      2591.93    0.93x
    BenchmarkRegexpMatchEasy1_32         299.31       210.44    0.70x
    BenchmarkRegexpMatchEasy1_1K        1074.71       822.45    0.77x
    BenchmarkRegexpMatchMedium_32          5.04         3.53    0.70x
    BenchmarkRegexpMatchMedium_1K         12.96        10.13    0.78x
    BenchmarkRegexpMatchHard_32            9.20         6.26    0.68x
    BenchmarkRegexpMatchHard_1K            9.29         6.26    0.67x
    BenchmarkRevcomp                     326.95       320.40    0.98x
    BenchmarkTemplate                     14.19        12.35    0.87x
    
    R=cshapiro
    CC=golang-dev
    https://golang.org/cl/12616045

GitHub上でのコミットページへのリンク

https://github.com/golang/go/commit/7910cd68b55c445f2babae683aea97ba20daffbb

元コミット内容

このコミットは、Goコンパイラ（cmd/gc）において、関数のエントリ時に以下の処理を行うように変更します。

関数の戻り値をゼロクリアする。
ローカル変数のポインタを含む部分をゼロクリアする。

これは、GoのガベージコレクタがGoフレーム内のメモリを検査する際に、古いポインタ値を見てしまい、結果としてメモリリーク（スペースリーク）を引き起こす可能性を防ぐための中間的なステップです。この変更は、最大で30%のパフォーマンス低下を引き起こす可能性がありますが、ガベージコレクタの正確性を保証するために必要とされています。

特に、インターフェース値のコレクションをポインタ値のコレクションと同程度に正確にするために、この変更は不可欠です。インターフェースの型を逆参照して、その値がポインタであるかどうかを判断する必要があるため、型フィールドが初期化されていることが重要になります。

将来的には、Carlによる別の変更（コンテキストに応じたガベージコレクションポインタビットマップの導入）によって、このゼロクリアの大部分を削除できるようになる予定です。その際、ゼロクリアが必要となるのは、関数のブロックスコープからアドレスがエスケープするものの、ヒープにはエスケープしない値のみとなります。

ベンチマーク結果を見ると、多くのベンチマークで実行時間が延びており、特にFmtFprintf*、JSONEncode/Decode、RegexpMatch*などで顕著なパフォーマンス低下が見られます。

変更の背景

Goのガベージコレクタは、プログラムが使用しなくなったメモリを自動的に解放する役割を担っています。このプロセスを効率的かつ正確に行うためには、ガベージコレクタがメモリ上のどの値がポインタであり、どの値がポインタでないかを正確に識別できる必要があります。

従来のGoのガベージコレクタは、スタックフレーム上のポインタを「保守的」に扱っていました。これは、あるメモリ領域がポインタであるかどうかが不明な場合でも、それがポインタである可能性があれば、その領域が指すオブジェクトを「生きている」とみなすアプローチです。この保守的なアプローチは、ガベージコレクタの実装を簡素化する一方で、実際には到達不能なオブジェクトであっても、スタック上の古い（無効な）ポインタ値がそれを指していると誤認され、メモリが解放されない「スペースリーク」を引き起こす可能性がありました。

このコミットの主な背景は、Goのガベージコレクタを「正確なコレクション（Precise Collection）」に移行させるための一歩です。正確なコレクションとは、ガベージコレクタがメモリ上のすべてのポインタを正確に識別し、到達可能なオブジェクトのみを保持し、到達不能なオブジェクトは確実に解放する能力を指します。これにより、スペースリークを防ぎ、メモリ使用量を最適化することができます。

特に、インターフェース値のコレクションにおいて、このゼロクリアは重要です。Goのインターフェースは、内部的に型情報と値（データ）を保持しています。ガベージコレクタがインターフェース値を正確に処理するためには、その値がポインタであるかどうかを判断するために、まず型情報が正しく初期化されている必要があります。もし型情報が古い、あるいは未初期化のままだと、ガベージコレクタはインターフェースの内部構造を正しく解釈できず、誤ったメモリを保持したり、クラッシュを引き起こしたりする可能性があります。

関数のエントリ時に戻り値とローカル変数のポインタ部分をゼロクリアすることで、これらのメモリ領域が常に既知の（ゼロ）状態から始まることが保証されます。これにより、ガベージコレクタがこれらの領域をスキャンする際に、古い、無効なポインタ値に遭遇するリスクがなくなります。一時的なパフォーマンス低下を許容してでも、ガベージコレクタの正確性と信頼性を向上させるための戦略的な変更と言えます。

前提知識の解説

このコミットを理解するためには、以下のGoの内部動作とガベージコレクションに関する知識が必要です。

Goのガベージコレクション (GC):
- Goは自動メモリ管理を採用しており、ガベージコレクタが不要になったメモリを自動的に解放します。
- GCは、プログラムが使用しているオブジェクト（到達可能なオブジェクト）を特定し、それ以外のオブジェクト（到達不能なオブジェクト）を解放します。
- スペースリーク (Space Leak): プログラムが不要になったメモリを解放しないために、メモリ使用量が増加し続ける現象。ガベージコレクタがポインタを誤って解釈することで発生することがあります。
- 正確なコレクション (Precise Collection): ガベージコレクタがメモリ上のすべてのポインタを正確に識別し、到達可能なオブジェクトのみを保持する能力。これにより、スペースリークを防ぎ、メモリ使用量を最適化できます。対義語は「保守的なコレクション」。
スタックフレーム (Stack Frame):
- 関数が呼び出されるたびに、その関数に必要な情報（ローカル変数、引数、戻りアドレスなど）を格納するために、スタック上に確保されるメモリ領域。
- Goの関数は、スタック上にローカル変数や戻り値を配置します。
ポインタ (Pointer):
- メモリ上の特定のアドレスを指し示す変数。GoのGCは、ポインタをたどって到達可能なオブジェクトを識別します。
インターフェース値 (Interface Values):
- Goのインターフェースは、内部的に2つの要素（itabとdata）で構成されます。
  - itab (interface table): インターフェースが保持する具体的な型の情報（メソッドセットなど）を指すポインタ。
  - data: インターフェースが保持する具体的な値（データ）を指すポインタ。
- ガベージコレクタがインターフェース値を正確に処理するためには、itabとdataの両方を正しく解釈できる必要があります。特にdataがポインタであるかどうかを判断するためには、itabが指す型情報が正しく初期化されていることが不可欠です。
Goコンパイラ (cmd/gc):
- Goのソースコードを機械語に変換するツール。
- ggen.c (generate code): 各アーキテクチャ（5g: ARM, 6g: x86-64, 8g: x86）向けのコード生成を担当するファイル。関数のプロローグ（エントリ時の処理）やエピローグ（終了時の処理）を生成します。
- pgen.c (program generation): プログラム全体の生成に関わる処理。ガベージコレクション関連のメタデータ（ポインタビットマップなど）の生成も行います。
- walk.c: 抽象構文木（AST）を走査し、最適化やコード生成のための変換を行うファイル。
ポインタビットマップ (Pointer Bitmaps):
- ガベージコレクタがメモリ領域内のどこにポインタが存在するかを効率的に識別するために使用するデータ構造。ビットマップの各ビットは、対応するメモリワードがポインタであるかどうかを示します。
- 「コンテキストに応じたポインタビットマップ」とは、同じメモリ領域であっても、プログラムの実行コンテキスト（例えば、特定の関数内での使用状況）に応じて、ポインタであるかどうかの解釈を変えることができる、より高度なビットマップを指します。これにより、不要なゼロクリアを減らし、パフォーマンスを向上させることが期待されます。
Bvec (Bit Vector):
- ビットの配列を効率的に表現するためのデータ構造。このコミットでは、スタックフレーム上のポインタ位置を示すために使用されます。

これらの概念を理解することで、このコミットがGoのランタイムとガベージコレクションの進化においてどのような役割を果たすのかが明確になります。

技術的詳細

このコミットの技術的詳細を掘り下げると、Goコンパイラがどのようにスタックフレームを管理し、ガベージコレクタがそれをどのように利用するか、そしてその間の連携を強化するためにどのようなコードが追加されたかが明らかになります。

1. 関数のプロローグにおけるゼロクリアの導入

主要な変更は、Goコンパイラのコード生成バックエンド（src/cmd/5g/ggen.c, src/cmd/6g/ggen.c, src/cmd/8g/ggen.c）にあるdefframe関数に集中しています。defframe関数は、Go関数のスタックフレームのセットアップと、関数のプロローグ（関数が呼び出された直後に実行されるコード）の生成を担当します。

このコミットでは、defframe関数にBvec *bvという新しい引数が追加されました。このbvは、スタックフレーム上のどのオフセットにポインタが含まれているかを示すビットベクトルです。

defframe内で、以下のロジックが追加されました。

戻り値のゼロクリア: src/cmd/gc/walk.cの変更により、戻り値が常にゼロクリアされるようになりました。これは、paramstoheap関数内で、out && (1 || (v == N && hasdefer))という条件が追加されたことによります。1 ||という部分は、常に真となるため、戻り値が常にゼロクリアされることを意味します。これは、ガベージコレクタが戻り値を常に「生きている」と仮定するため、初期化されていない値がGCに誤解釈されるのを防ぐためです。
ローカル変数のポインタ部分のゼロクリア:
- stkptrsize（スタック上のポインタを含む領域のサイズ）が8*widthptr（8ワード分）以上の場合、最適化されたループを使用して、その領域全体をゼロクリアします。これは、AMOVQ（6g/8g）やAMOVW（5g）命令とREP STOSQ/L（繰り返しストア）命令の組み合わせによって実現されます。
  - AMOVQ D_CONST, 0, D_AX, 0 (6g/8g): AXレジスタに0をロード。
  - AMOVQ D_CONST, stkptrsize/widthptr, D_CX, 0 (6g/8g): CXレジスタにゼロクリアするワード数をロード。
  - ALEAQ D_SP+D_INDIR, frame-stkptrsize, D_DI, 0 (6g/8g): DIレジスタにゼロクリアを開始するスタック上のアドレスをロード。
  - AREP D_NONE, 0, D_NONE, 0 と ASTOSQ/L D_NONE, 0, D_NONE, 0: CXで指定された回数だけ、AXの値をDIが指すメモリにストアし、DIをインクリメントする。
- stkptrsizeが小さい場合、またはポインタが散在している場合は、bvget(bv, i/widthptr)を使用してビットベクトルをチェックし、ポインタが存在するオフセットのみを個別にゼロクリアします。これは、AMOVQ D_CONST, 0, D_SP+D_INDIR, frame-stkptrsize+iのような命令で、スタック上の特定のオフセットに0をストアすることで行われます。

2. `dumpgclocals`関数の変更

src/cmd/gc/pgen.cのdumpgclocals関数は、ローカル変数内のポインタを含む位置を記述するビットベクトルを計算し、その情報をシンボルとして出力する役割を担っていました。このコミットでは、dumpgclocalsがBvec*を返すように変更されました。

変更前: static void dumpgclocals(Node*, Sym*);
変更後: static Bvec* dumpgclocals(Node*, Sym*);

これにより、compile関数内でdumpgclocalsが返したBvecをdefframeに渡し、スタックフレームのゼロクリアに利用できるようになりました。また、compile関数内でdefframe呼び出し後にfree(bv)が追加され、動的に確保されたビットベクトルが適切に解放されるようになりました。

3. `go.h`の関数プロトタイプ変更

src/cmd/gc/go.hでは、defframe関数のプロトタイプが変更され、新しいBvec*引数を受け取るようになったことが反映されています。

変更前: void defframe(Prog*);
変更後: void defframe(Prog*, Bvec*);

4. パフォーマンスへの影響

コミットメッセージに記載されているベンチマーク結果は、この変更がパフォーマンスに与える影響を明確に示しています。多くのベンチマークで実行時間が延びており、特にFmtFprintf*、JSONEncode/Decode、RegexpMatch*など、文字列処理やデータエンコーディング/デコーディング、正規表現マッチングといった、頻繁に新しいスタックフレームが作成され、ローカル変数や戻り値が使用されるような処理で顕著なパフォーマンス低下が見られます。これは、関数のエントリ時に追加されたゼロクリア処理のオーバーヘッドによるものです。

しかし、BenchmarkBinaryTree17やBenchmarkFannkuch11のように、一部のCPU集中型ベンチマークではわずかな改善が見られるものもあります。これは、GCの正確性が向上したことによる間接的なメリット（例えば、GCの実行頻度が減る、GCの処理時間が短縮されるなど）が、ゼロクリアのオーバーヘッドを上回った可能性を示唆しています。

まとめ

このコミットは、Goのガベージコレクタの正確性を向上させるための重要な一歩であり、特にスタックフレーム上のポインタの扱いをより厳密にすることで、スペースリークを防ぎ、インターフェース値の正確なコレクションを可能にすることを目的としています。一時的なパフォーマンス低下は伴いますが、これはGoランタイムの長期的な安定性と効率性の向上に向けた投資と見なすことができます。将来的には、より洗練されたGCポインタビットマップの導入により、このゼロクリアの大部分が不要になる予定です。

コアとなるコードの変更箇所

このコミットにおけるコアとなるコードの変更は、主にGoコンパイラのコード生成部分と、ガベージコレクション関連のメタデータ生成部分にあります。

src/cmd/5g/ggen.c, src/cmd/6g/ggen.c, src/cmd/8g/ggen.c:
- defframe関数のシグネチャが変更され、Bvec *bv引数が追加されました。
- defframe関数内に、スタックフレームのポインタ部分をゼロクリアするためのアセンブリコード生成ロジックが追加されました。
  - stkptrsize（スタック上のポインタを含む領域のサイズ）が一定以上の場合、ループとREP STOS命令（x86/x86-64）または同等の命令（ARM）を使用して高速にゼロクリアするコードが生成されます。
  - それ以外の場合、bvget(bv, i/widthptr)でビットベクトルを参照し、ポインタが存在するオフセットのみを個別にゼロクリアするコードが生成されます。
- ヘルパー関数appendpが追加され、アセンブリ命令をプログラムリストに効率的に追加できるようになりました。
src/cmd/gc/go.h:
- defframe関数のプロトタイプが、新しいBvec *引数を含むように更新されました。
src/cmd/gc/pgen.c:
- dumpgclocals関数の戻り値の型がvoidからBvec*に変更されました。これにより、計算されたビットベクトルを呼び出し元（compile関数）に返すことができるようになりました。
- compile関数内で、dumpgclocalsの戻り値がdefframeに渡され、その後free(bv)で解放されるようになりました。
- defframeの呼び出し位置が、dumpgcargsとdumpgclocalsの後に移動しました。
src/cmd/gc/walk.c:
- paramstoheap関数内で、戻り値が常にゼロクリアされるように条件が変更されました。具体的には、if(out && (1 || (v == N && hasdefer)))という条件が追加され、1 ||によって常にゼロクリアが強制されるようになりました。

これらの変更は、Goコンパイラのバックエンドとガベージコレクタの連携を強化し、スタックフレームのポインタの正確な管理を実現するためのものです。

コアとなるコードの解説

ここでは、主要な変更点であるdefframe関数内のゼロクリアロジックと、dumpgclocalsの変更について詳しく解説します。

`defframe`関数（`src/cmd/5g/ggen.c`, `src/cmd/6g/ggen.c`, `src/cmd/8g/ggen.c`）

defframe関数は、Go関数のスタックフレームのレイアウトを決定し、関数のプロローグ（エントリコード）を生成するGoコンパイラの重要な部分です。このコミットでは、この関数にBvec *bvという引数が追加され、スタックフレーム内のポインタの位置情報が渡されるようになりました。

変更の目的: ガベージコレクタがスタックフレームをスキャンする際に、初期化されていないメモリ領域に存在する可能性のある「古いポインタ値」を誤って参照し、それが指すオブジェクトを「生きている」と誤認するのを防ぐためです。これにより、スペースリークを防ぎ、GCの正確性を向上させます。

ゼロクリアのロジック:

// src/cmd/5g/ggen.c の例 (ARMアーキテクチャ向け)
void
defframe(Prog *ptxt, Bvec *bv) // bv が追加された
{
    // ... (既存のスタックフレームサイズ計算など) ...

    // insert code to clear pointered part of the frame,
    // so that garbage collector only sees initialized values
    // when it looks for pointers.
    p = ptxt;
    // p を関数の最初の実行可能な命令の直後に移動
    while(p->link->as == AFUNCDATA || p->link->as == APCDATA || p->link->as == ATYPE)
        p = p->link;

    if(stkptrsize >= 8*widthptr) { // ポインタ領域が大きい場合
        // 高速なループによるゼロクリア (例: REP STOSQ/L に相当するアセンブリ)
        p = appendp(p, AMOVW, D_CONST, NREG, 0, D_REG, 0, 0); // レジスタに0をロード
        p = appendp(p, AADD, D_CONST, NREG, 4+frame-stkptrsize, D_REG, 1, 0); // スタック上の開始アドレスを計算
        p->reg = REGSP; // SPレジスタをベースにする
        p = appendp(p, AADD, D_CONST, NREG, stkptrsize, D_REG, 2, 0); // 終了アドレスを計算
        p->reg = 1;
        p1 = p = appendp(p, AMOVW, D_REG, 0, 0, D_OREG, 1, 4); // ゼロをメモリにストア
        p->scond |= C_PBIT; // ループ条件 (ARM固有)
        p = appendp(p, ACMP, D_REG, 1, 0, D_NONE, 0, 0); // 終了アドレスと比較
        p->reg = 2;
        p = appendp(p, ABNE, D_NONE, NREG, 0, D_BRANCH, NREG, 0); // ループ
        patch(p, p1); // ループのジャンプ先をパッチ
    } else { // ポインタ領域が小さい、または散在している場合
        first = 1;
        for(i=0; i<stkptrsize; i+=widthptr) {
            if(bvget(bv, i/widthptr)) { // ビットベクトルでポインタの有無をチェック
                if(first) {
                    p = appendp(p, AMOVW, D_CONST, NREG, 0, D_REG, 0, 0); // 0をレジスタにロード (一度だけ)
                    first = 0;
                }
                // 個別にゼロをストア
                p = appendp(p, AMOVW, D_REG, 0, 0, D_OREG, REGSP, 4+frame-stkptrsize+i);
            }
        }
    }
}

ptxt: 関数のプロローグの開始点を示すProg（プログラム命令）構造体へのポインタ。
bv: スタックフレーム内のポインタ位置を示すビットベクトル。bvget(bv, index)は、指定されたインデックス（ワード単位のオフセット）にポインタが存在するかどうかを返します。
stkptrsize: スタックフレーム内でポインタを含む領域の合計サイズ。
widthptr: ポインタのサイズ（バイト単位、通常は4または8）。
appendp: 新しいアセンブリ命令をプログラムリストに追加するためのヘルパー関数。

このコードは、スタックフレーム内のポインタを含む領域を効率的にゼロクリアするためのアセンブリ命令を生成します。大きな領域の場合はループを使って一括で、小さな領域や散在している場合は個別にゼロクリアします。

`dumpgclocals`関数（`src/cmd/gc/pgen.c`）

dumpgclocals関数は、ローカル変数内のポインタを含む位置を特定し、その情報をビットベクトルとして表現します。このビットベクトルは、ガベージコレクタがスタックフレームをスキャンする際に使用されます。

変更の目的: 以前は、この関数はビットベクトルを計算し、それを直接シンボルとして出力していましたが、このコミットでは計算されたBvecを呼び出し元に返すように変更されました。これにより、compile関数がこのBvecをdefframeに渡し、スタックフレームのゼロクリアに利用できるようになります。

変更点:

// src/cmd/gc/pgen.c
// Compute a bit vector to describes the pointer containing locations
// in local variables and dumps the bitvector length and data out to
// the provided symbol. Returns the vector for use and freeing by caller.
static Bvec* // 戻り値の型が Bvec* に変更
dumpgclocals(Node* fn, Sym *sym)
{
    Bvec *bv;
    int i;
    int32 off;

    // ... (ビットベクトルの計算ロジック) ...

    // ビットベクトルの長さとデータをシンボルに出力
    off = duint32(sym, 0, bv->n); // ビットベクトルの長さ
    for(i = 0; i < bv->n; i += 32) {
        off = duint32(sym, off, bv->b[i/32]); // ビットベクトルのデータ
    }
    ggloblsym(sym, off, 0, 1);

    // free(bv); // 以前はここで解放していたが、呼び出し元で解放するように変更
    return bv; // 計算されたビットベクトルを返す
}

この変更により、compile関数はdumpgclocalsから返されたBvecを受け取り、それをdefframeに渡すことで、スタックフレームのゼロクリア処理に正確なポインタ位置情報を提供できるようになりました。

これらのコアとなるコードの変更は、Goのガベージコレクタがスタックフレームをより「正確」にスキャンできるようにするための基盤を築くものです。一時的なパフォーマンスのオーバーヘッドはありますが、これはメモリリークのリスクを低減し、将来的なGCの改善（例えば、コンテキストに応じたポインタビットマップ）のための重要なステップとなります。

参考にした情報源リンク

Goの公式ドキュメント
Goのソースコード
ガベージコレクションに関する一般的な知識
コンパイラのコード生成に関する一般的な知識

comemo