Keyboard shortcuts

Press or to navigate between chapters

Press S or / to search in the book

Press ? to show this help

Press Esc to hide this help

[インデックス 1303] ファイルの概要

このコミットは、Goコンパイラ(gc)におけるunsafe.Pointerの変換に関するバグ修正を目的としています。具体的には、unsafe.Pointer型が関わる型変換やコピー処理において、コンパイラが正しく動作しない問題に対処しています。この修正により、unsafe.Pointerの利用が関わるコードの安定性と正確性が向上します。

コミット

commit 92a1190c6c97aeeae50a2579ba0f23e257719e02
Author: Ken Thompson <ken@golang.org>
Date:   Tue Dec 9 13:00:50 2008 -0800

    robs bug converting unsafe.pointer
    
    R=r
    OCL=20834
    CL=20834

GitHub上でのコミットページへのリンク

https://github.com/golang/go/commit/92a1190c6c97aeeae50a2579ba0f23e257719e02

元コミット内容

このコミットは、Go言語の初期開発段階におけるGoコンパイラ(gc)のバグ修正です。コミットメッセージ「robs bug converting unsafe.pointer」が示す通り、unsafe.Pointer型の変換処理に存在した問題に対処しています。このバグは、unsafe.Pointerが関わる特定の操作において、コンパイラが誤ったコードを生成したり、予期せぬ動作を引き起こしたりする可能性があったことを示唆しています。

変更内容は以下の2つのファイルに及びます。

  • src/cmd/gc/go.h: Goコンパイラの内部で使用される型定義のヘッダファイル。Type構造体にcopyanyという新しいフィールドが追加されています。
  • src/cmd/gc/subr.c: Goコンパイラのサブルーチンを含むC言語のソースファイル。loop関数とdeep関数内で、TANY型(コンパイラ内部で任意の型を表す)の処理に関連するロジックが修正されています。特に、TANY型がcopyanyフラグを持つ場合に特定の処理を行うよう変更されています。

変更の背景

このコミットが行われた2008年12月は、Go言語がまだ一般に公開される前の初期開発段階でした。unsafe.Pointerは、Goの型安全性をバイパスして任意の型のポインタとして扱える特殊な型であり、低レベルのメモリ操作やC言語との相互運用性を提供するために設計されました。しかし、その性質上、コンパイラがunsafe.Pointerを正しく扱わないと、メモリ破壊や未定義動作といった深刻なバグにつながる可能性があります。

「robs bug」という記述は、おそらく当時のGo開発チームのメンバーであるRob Pike氏が発見した、または報告したバグであることを示唆しています。このバグは、unsafe.Pointerが関わる型変換や値のコピーにおいて、コンパイラが内部的な型表現(TANY)を適切に処理できていなかったことに起因すると考えられます。特に、unsafe.Pointerのような「何でもあり」のポインタ型を扱う際には、コンパイラがそのポインタが指すメモリ領域の特性(例えば、ガベージコレクションの対象となるか、コピー時に特別な処理が必要かなど)を正確に把握し、適切なコードを生成する必要があります。このコミットは、そのための内部的なフラグ(copyany)と処理ロジックを追加することで、この問題を解決しようとしています。

前提知識の解説

Goコンパイラ (gc) の初期構造

Go言語の初期のコンパイラは、C言語で書かれていました。src/cmd/gcディレクトリは、Go言語の公式コンパイラであるgcのソースコードを格納していました。このコンパイラは、Goのソースコードを解析し、中間表現に変換し、最終的に実行可能なバイナリを生成する役割を担っていました。

  • go.h: コンパイラの内部で使用されるデータ構造、特に型システムに関する定義が含まれるヘッダファイルです。Type構造体は、Go言語の様々な型(整数、文字列、構造体、ポインタなど)をコンパイラが内部で表現するための重要なデータ構造です。
  • subr.c: コンパイラの様々なサブルーチン(補助関数)が実装されているファイルです。型チェック、型変換、コード生成など、コンパイラの多様な機能がここに集約されています。

unsafe.Pointer

unsafe.PointerはGo言語のunsafeパッケージで提供される特殊な型です。Goは通常、厳格な型システムを持ち、異なる型のポインタ間の変換を制限することで型安全性を保証します。しかし、unsafe.Pointerは以下の点でこの原則を破ります。

  1. 任意の型のポインタへの変換: *T型のポインタをunsafe.Pointerに変換でき、またunsafe.Pointerを任意の*T型のポインタに変換できます。
  2. uintptrとの相互変換: unsafe.Pointeruintptr(符号なし整数型)に変換でき、またuintptrunsafe.Pointerに変換できます。これにより、ポインタを整数として扱い、ポインタ演算を行うことが可能になります。

unsafe.Pointerは、主に以下のような高度な用途で使用されます。

  • C言語との相互運用: Cのライブラリ関数が特定のメモリレイアウトを期待する場合など。
  • 低レベルのメモリ操作: メモリを直接読み書きしたり、アラインメントを調整したりする場合。
  • 特定の最適化: 型システムをバイパスしてパフォーマンスを向上させる場合(ただし、非常に注意が必要)。

unsafe.Pointerを使用すると、Goの型安全性やメモリ安全性の保証が失われるため、非常に危険であり、特別な理由がない限り使用すべきではありません。このコミットのバグは、まさにこのunsafe.Pointerの危険な性質がコンパイラの内部処理で適切に扱われていなかったことに起因しています。

TANY型 (コンパイラ内部表現)

Goコンパイラの内部では、Go言語の型は特定の内部表現にマッピングされます。TANYは、コンパイラが「任意の型」または「型が不明なポインタ」を表現するために使用する内部的な型定数であったと考えられます。unsafe.Pointerは、Goの型システムから見ると「任意の型のポインタ」として振る舞うため、コンパイラ内部ではTANYとして扱われることがあったと推測されます。

deep関数とloop関数 (コンパイラ内部処理)

Goコンパイラにおけるdeep関数やloop関数は、型システムに関連する処理、特に型のコピー、比較、または正規化を行う際に使用されるサブルーチンであった可能性が高いです。

  • deep関数: 型の「深いコピー」を作成する役割を担っていたと考えられます。これは、ポインタが指す先のデータ構造まで含めて完全に複製する必要がある場合に重要です。
  • loop関数: 型の走査や特定の条件に基づく処理をループで行うための関数であった可能性があります。

これらの関数がTANY型を処理する際に、unsafe.Pointerの特性(例えば、ガベージコレクションの対象外であるか、特別なアラインメント要件があるかなど)を考慮していなかったことが、バグの原因となったと推測されます。

技術的詳細

このコミットの技術的詳細は、Goコンパイラの型システムとunsafe.Pointerの内部的な取り扱いに関するものです。

  1. Type構造体へのcopyanyフィールドの追加: src/cmd/gc/go.hType構造体にuchar copyany;が追加されました。 Type構造体はコンパイラがGoの型を表現するための中心的なデータ構造です。copyanyというフィールド名は、「任意の型(TANY)のコピーに関連する」ことを示唆しています。これは、TANY型、特にunsafe.Pointerが関わる型がコピーされる際に、特別な処理が必要であることを示すフラグとして導入されたと考えられます。例えば、unsafe.Pointerはガベージコレクタによって追跡されないメモリ領域を指す可能性があるため、そのコピー時には通常のポインタとは異なる挙動が求められる場合があります。

  2. subr.cにおけるTANY型の処理の変更:

    • loop関数内の変更:

      case TANY:
      	if(!st->copyany)
      		return 0;
      	*stp = t;
      	break;
      

      loop関数内でTANY型を処理する際に、新しく追加されたst->copyanyフラグがチェックされるようになりました。もしcopyanyフラグがセットされていない場合、return 0;が実行されます。これは、TANY型がcopyanyフラグを持たない場合、その型に対する特定のループ処理(おそらくコピーや走査)をスキップするか、エラーとして扱うことを意味します。これにより、unsafe.Pointerのような特殊なTANY型が、意図しない方法で処理されるのを防ぎます。

    • deep関数内の変更:

      case TANY:
      	nt = shallow(t);
      	nt->copyany = 1;
      	break;
      

      deep関数内でTANY型を処理する際に、まずshallow(t)を呼び出して型のシャローコピー(浅いコピー)を作成し、その新しい型ntcopyanyフラグを1に設定しています。deep関数は型の深いコピーを作成する役割を担っていたと推測されるため、TANY型の場合には、そのコピーがunsafe.Pointerのような特殊な性質を持つことをcopyanyフラグで明示的にマークしていると考えられます。これにより、後続の処理(例えば、loop関数など)がこのcopyanyフラグを認識し、unsafe.Pointerの特性を考慮した適切な処理を行うことができるようになります。

これらの変更は、Goコンパイラがunsafe.Pointerのような型安全性をバイパスするポインタを扱う際に、その特殊な性質を内部的に追跡し、適切なコンパイル時動作を保証するためのものです。特に、unsafe.Pointerが関わる値のコピーや変換において、コンパイラがメモリレイアウトやガベージコレクションの挙動を正しく考慮できるようにするための重要な修正と言えます。

コアとなるコードの変更箇所

src/cmd/gc/go.h

--- a/src/cmd/gc/go.h
+++ b/src/cmd/gc/go.h
@@ -156,6 +156,7 @@ struct	Type
 	uchar	embedded;	// TFIELD embedded type
 	uchar	siggen;
 	uchar	funarg;
+	uchar	copyany;
 
 	// TFUNCT
 	uchar	thistuple;

src/cmd/gc/subr.c

--- a/src/cmd/gc/subr.c
+++ b/src/cmd/gc/subr.c
@@ -1779,6 +1779,8 @@ loop:
 		goto loop;
 
 	case TANY:
+		if(!st->copyany)
+			return 0;
 		*stp = t;
 		break;
 
@@ -1841,6 +1843,11 @@ deep(Type *t)
 		nt = t;	// share from here down
 		break;
 
+	case TANY:
+		nt = shallow(t);
+		nt->copyany = 1;
+		break;
+
 	case TPTR32:
 	case TPTR64:
 	case TCHAN:

コアとなるコードの解説

src/cmd/gc/go.h の変更

Type構造体は、GoコンパイラがGo言語の型を内部的に表現するための中心的なデータ構造です。この構造体にuchar copyany;という1バイトのフィールドが追加されました。

  • copyany: このフィールドは、そのTypeTANY型であり、かつコピー時に特別な考慮が必要な場合にセットされるフラグとして機能します。unsafe.Pointerのような型は、コンパイラ内部でTANYとして扱われることがあり、そのコピーは通常のポインタのコピーとは異なるセマンティクスを持つ可能性があります(例: ガベージコレクションの対象外のメモリを指す場合など)。このフラグは、そのような特殊なTANY型を識別し、適切な処理を促すために導入されました。

src/cmd/gc/subr.c の変更

loop 関数内の変更

loop関数は、コンパイラが型を走査したり、特定の条件に基づいて処理を行ったりする際に使用されるサブルーチンの一部です。

	case TANY:
		if(!st->copyany)
			return 0;
		*stp = t;
		break;
  • case TANY:: TANY型を処理するブロックです。
  • if(!st->copyany): ここで、現在の型(stが指す型)のcopyanyフラグがチェックされます。
    • もしcopyany0(偽)であれば、return 0;が実行されます。これは、このTANY型がcopyanyフラグを持たない場合、このloop関数での処理を中断するか、その型に対する特定の操作をスキップすることを示唆しています。これにより、unsafe.PointerではないTANY型、またはunsafe.Pointerであってもコピー時に特別な処理が不要なケースを区別し、誤った処理を防ぎます。
  • *stp = t;: copyanyフラグがセットされている場合、またはreturn 0;が実行されなかった場合に、型t*stpに代入しています。これは、型のコピーまたは参照の更新の一部であると考えられます。

この変更により、loop関数はTANY型を処理する際に、そのcopyanyフラグの状態に応じて異なる挙動を取るようになり、unsafe.Pointerの特殊なコピーセマンティクスを尊重するようになりました。

deep 関数内の変更

deep関数は、型の「深いコピー」を作成する役割を担っていたと考えられます。これは、ポインタが指す先のデータ構造まで含めて完全に複製する必要がある場合に重要です。

	case TANY:
		nt = shallow(t);
		nt->copyany = 1;
		break;
  • case TANY:: TANY型を処理するブロックです。
  • nt = shallow(t);: まず、元の型tの「浅いコピー」をshallow関数を使って作成し、それをntに代入しています。shallow関数は、型構造体自体をコピーするが、それが参照する他の型構造体はコピーしない、といった動作をする可能性があります。
  • nt->copyany = 1;: 新しく作成された浅いコピーntcopyanyフラグを1に設定しています。これは、このTANY型がunsafe.Pointerのような特殊な性質を持つことを明示的にマークしています。

この変更により、deep関数がTANY型(特にunsafe.Pointer)の深いコピーを作成する際に、そのコピーされた型がcopyanyフラグを持つようにすることで、後続のコンパイラ処理(例えば、loop関数など)がこのフラグを認識し、unsafe.Pointerの特性を考慮した適切なコード生成や最適化を行うことができるようになります。

これらの変更は全体として、Goコンパイラがunsafe.Pointerのような型安全性をバイパスするポインタを扱う際に、その特殊な性質を内部的に追跡し、コピーや変換の際に発生しうるバグを防ぐための重要なメカニズムを導入したことを示しています。

関連リンク

  • Go言語のunsafeパッケージに関する公式ドキュメント(現代のGo言語における情報ですが、概念は共通しています):
  • Go言語の初期の歴史に関する情報(Go言語の誕生と初期開発の背景を理解するのに役立ちます):

参考にした情報源リンク

  • Go言語の公式リポジトリ: https://github.com/golang/go
  • Go言語のunsafeパッケージに関する一般的な知識
  • Goコンパイラの内部構造に関する一般的な知識(特に初期のC言語で書かれたバージョンについて)
  • コミットメッセージとコード差分から読み取れる情報