Keyboard shortcuts

Press or to navigate between chapters

Press S or / to search in the book

Press ? to show this help

Press Esc to hide this help

[インデックス 13828] ファイルの概要

このコミットは、Go言語のビルドプロセスにおいて、ソースファイルの読み込み方法を最適化するものです。具体的には、go/buildパッケージがGoソースファイルを解析する際に、不要なI/Oを削減するためにカスタムのファイルリーダーを導入しています。これにより、Goファイルからはインポートブロックまで、非Goファイルからは先頭のコメントのみを読み込むように変更され、ビルドの効率が向上します。

コミット

commit ab224094d0bf035aff5e70cbd818fe29666cc0d1
Author: Russ Cox <rsc@golang.org>
Date:   Fri Sep 14 12:22:45 2012 -0400

    go/build: use custom file readers to avoid I/O
    
    When reading Go files, read through import block.
    When reading non-Go files, read only leading comments.
    
    R=nigeltao, adg, r
    CC=golang-dev
    https://golang.org/cl/6493068

GitHub上でのコミットページへのリンク

https://github.com/golang/go/commit/ab224094d0bf035aff5e70cbd818fe29666cc0d1

元コミット内容

このコミットは、Goのビルドシステムにおけるファイル読み込みの振る舞いを変更します。主な目的は、Goソースファイルを処理する際のI/O操作を最小限に抑えることです。

具体的には、以下の2つのケースで読み込み範囲を制限します。

  1. Goファイル (.go): ファイルの先頭からインポートブロックの終わりまでを読み込みます。Goのビルドツールがパッケージの依存関係を解決するために必要な情報は、通常この範囲に含まれています。
  2. 非Goファイル (例: .c, .s, .h など): ファイルの先頭にあるコメントブロックのみを読み込みます。これらのファイルには、Cgoディレクティブやビルド制約(build tags)などの情報が含まれている可能性があり、それらを効率的に抽出するためです。

これにより、go/buildパッケージがファイル全体を読み込む必要がなくなり、特に大規模なファイルや多数のファイルを扱う場合に、ビルド時間の短縮とリソース消費の削減に貢献します。

変更の背景

Goのビルドプロセスでは、ソースファイルを解析してパッケージの依存関係を特定したり、ビルド制約を評価したりする必要があります。従来のioutil.ReadAllのような汎用的なファイル読み込み関数を使用すると、ファイル全体をメモリに読み込むことになり、特に大きなファイルや多数のファイルが存在する場合に、不必要なI/Oオーバーヘッドとメモリ消費が発生していました。

このコミットの背景には、ビルドパフォーマンスの改善という明確な目的があります。go/buildパッケージは、Goのツールチェイン(go build, go installなど)の基盤となる部分であり、その効率性はGo開発全体のユーザーエクスペリエンスに直結します。必要な情報(パッケージ宣言、インポートパス、ビルドタグなど)がファイルの先頭部分に集中しているというGo言語の特性を活かし、それ以外の部分を読み込まないことで、I/O操作を最小限に抑え、ビルド時間を短縮することが目指されました。

前提知識の解説

このコミットを理解するためには、以下のGo言語およびビルドシステムに関する知識が役立ちます。

  • Go言語のパッケージとインポート: Goのソースファイルはpackage宣言で始まり、その後にimport宣言が続きます。import宣言は、そのファイルが依存する他のパッケージを指定します。Goのビルドツールは、これらのインポートパスを解析して依存関係グラフを構築します。
  • ビルド制約 (Build Tags): Goのソースファイルには、// +build tagのような形式でビルド制約を記述できます。これにより、特定の環境や条件でのみコンパイルされるコードブロックを指定できます。これらの制約は通常、ファイルの先頭のコメントブロックに記述されます。
  • go/buildパッケージ: Go標準ライブラリの一部であり、Goソースファイルの解析、パッケージ情報の取得、ビルド制約の評価など、Goのビルドプロセスの中核を担う機能を提供します。go buildコマンドなどが内部でこのパッケージを利用しています。
  • io.Readerbufio.Reader: GoのI/Oインターフェースの基本です。io.Readerはデータを読み込むための汎用インターフェースであり、bufio.Readerはバッファリングされた読み込みを提供し、I/O操作の効率を向上させます。
  • ioutil.ReadAll: io/ioutilパッケージ(Go 1.16でioosパッケージに移行)の関数で、io.ReaderからEOF(End Of File)まで全てのデータを読み込み、[]byteスライスとして返します。このコミットでは、この関数がファイル全体を読み込むため、より効率的なカスタムリーダーに置き換えられています。
  • Goの字句解析と構文解析の基本: Goのソースコードは、字句解析器(lexer)によってトークンに分割され、その後、構文解析器(parser)によって抽象構文木(AST)が構築されます。このコミットで導入されるカスタムリーダーは、完全な構文解析を行うわけではなく、インポートブロックやコメントブロックといった特定の構文要素を効率的に識別するための簡易的な字句解析ロジックを含んでいます。

技術的詳細

このコミットの核心は、src/pkg/go/build/read.goに新しく追加されたimportReader構造体と、それを利用したreadCommentsおよびreadImports関数です。

importReader構造体

importReaderは、Goソースファイルの特定のセクション(コメントやインポートブロック)を効率的に読み込むためのカスタムリーダーです。

type importReader struct {
	b    *bufio.Reader // Underlying buffered reader
	buf  []byte        // Buffer to store read bytes
	peek byte          // Peeking byte (for lookahead)
	err  error         // Error encountered during reading
	eof  bool          // End of file reached
	nerr int           // Counter for error loops (panic prevention)
}
  • b *bufio.Reader: 実際のファイル読み込みを行うbufio.Readerインスタンス。バッファリングにより効率的な読み込みを可能にします。
  • buf []byte: 読み込んだバイトを蓄積するバッファ。最終的にこのバッファの内容が返されます。
  • peek byte: 次に読み込むバイトを一時的に保持するためのフィールド。peekByteメソッドで使用され、実際にバイトを消費せずに先読みを可能にします。
  • err error: 読み込み中に発生したエラーを記録します。
  • eof bool: ファイルの終端に達したかどうかを示すフラグ。
  • nerr int: 無限ループを防ぐためのエラーカウンター。

importReaderの主要メソッド

  • readByte() byte: bufio.Readerから1バイトを読み込み、r.bufに追加します。エラーが発生した場合はr.errに記録します。ヌルバイト (\x00) を検出した場合はerrNULエラーを発生させます。
  • peekByte(skipSpace bool) byte: 次のバイトを先読みしますが、リーダーの現在位置は進めません。skipSpacetrueの場合、空白文字(スペース、タブ、改行、セミコロン)やGoのコメント(///* */)をスキップします。これにより、意味のあるトークンに素早く到達できます。
  • nextByte(skipSpace bool) byte: peekByteと同様に次のバイトを先読みしますが、読み込んだバイトを消費し、リーダーの現在位置を進めます。
  • readKeyword(kw string): 指定されたキーワード(例: "package", "import")を読み込みます。キーワードが期待通りに存在しない場合や、キーワードの直後に識別子の一部となる文字が続く場合は、構文エラーを記録します。
  • readIdent(): 識別子(変数名、関数名など)を読み込みます。Goの識別子のルール(文字、数字、アンダースコア)に従って読み進めます。
  • readString(): Goの文字列リテラル(バッククォート またはダブルクォート " で囲まれた文字列)を読み込みます。エスケープシーケンスや改行の処理も行います。
  • readImport(): 単一のインポート宣言(例: "fmt"_ "net/http")を解析します。オプションの識別子(. やエイリアス)と、それに続く文字列リテラルを読み込みます。

readComments(f io.Reader) ([]byte, error)

この関数は、Go以外のファイル(またはGoファイルであっても先頭コメントのみが必要な場合)の先頭コメントブロックのみを読み込みます。

  1. importReaderを初期化します。
  2. r.peekByte(true)を呼び出し、先頭の空白やコメントをスキップします。
  3. もしEOFに達していない場合、つまりコメント以外の意味のあるバイトが見つかった場合、そのバイトはr.bufから削除されます。これは、コメントブロックの終わりを示すバイトであるため、最終的な出力には含めないためです。
  4. r.bufに蓄積されたコメントの内容と、発生したエラーを返します。

readImports(f io.Reader, reportSyntaxError bool) ([]byte, error)

この関数は、Goソースファイルのpackage宣言からimportブロックの終わりまでを読み込みます。

  1. importReaderを初期化します。
  2. package宣言の読み込み:
    • r.readKeyword("package")packageキーワードを読み込みます。
    • r.readIdent()でパッケージ名を読み込みます。
  3. importブロックの読み込み:
    • for r.peekByte(true) == 'i'ループで、次の意味のある文字がiimportの先頭)である限り繰り返します。
    • r.readKeyword("import")importキーワードを読み込みます。
    • インポートがグループ化されている場合(例: import (...))、( を読み込み、() の間の各インポート宣言をr.readImport()で読み込みます。
    • 単一のインポート宣言の場合、直接r.readImport()を呼び出します。
  4. 読み込みの終了:
    • もしエラーなくEOFに達していない場合、つまりインポートブロックの直後に意味のあるバイトが見つかった場合、そのバイトはr.bufから削除されます。これは、インポートブロックの終わりを示すバイトであり、それ以降のコードは不要なためです。
    • 構文エラーが発生した場合、reportSyntaxErrorfalseであれば、エラーを無視してファイル全体を読み込みます。これは、go/parserが後でより正確なエラーを報告できるようにするためです。
  5. r.bufに蓄積された内容と、発生したエラーを返します。

これらのカスタムリーダーは、Goの字句解析の非常に軽量なサブセットを実装しており、完全なASTを構築することなく、必要な情報(コメントやインポートパス)を効率的に抽出することを可能にしています。

コアとなるコードの変更箇所

このコミットによる主要なコード変更は以下の3つのファイルにわたります。

  1. src/pkg/go/build/build.go:

    • readImportsreadCommentsという新しいカスタムリーダー関数を呼び出すように変更されました。
    • 以前はioutil.ReadAll(f)でファイル全体を読み込んでいましたが、ファイルの拡張子(.goかどうか)に基づいて、readImportsまたはreadCommentsを条件付きで呼び出すようになりました。
    --- a/src/pkg/go/build/build.go
    +++ b/src/pkg/go/build/build.go
    @@ -512,7 +512,13 @@ Found:
     		if err != nil {
     			return p, err
     		}
    -		data, err := ioutil.ReadAll(f)
    +
    +		var data []byte
    +		if strings.HasSuffix(filename, ".go") {
    +			data, err = readImports(f, false)
    +		} else {
    +			data, err = readComments(f)
    +		}
     		f.Close()
     		if err != nil {
     			return p, fmt.Errorf("read %s: %v", filename, err)
    
  2. src/pkg/go/build/read.go:

    • このファイルは新規作成されました。
    • importReader構造体とそのヘルパーメソッド(readByte, peekByte, nextByte, readKeyword, readIdent, readString, readImport)が定義されています。
    • readComments関数とreadImports関数が実装されています。
  3. src/pkg/go/build/read_test.go:

    • このファイルも新規作成されました。
    • readCommentsreadImports関数の動作を検証するための単体テストが記述されています。
    • 様々なGoコードスニペットやコメントパターンをテストケースとして含み、期待される読み込み結果とエラーハンドリングを検証しています。

コアとなるコードの解説

src/pkg/go/build/build.goの変更

このファイルでは、go/buildパッケージがファイルを読み込む際のロジックが変更されています。

		var data []byte
		if strings.HasSuffix(filename, ".go") {
			data, err = readImports(f, false)
		} else {
			data, err = readComments(f)
		}
  • strings.HasSuffix(filename, ".go")によって、現在処理しているファイルがGoソースファイルであるかどうかを判定します。
  • もしGoファイルであれば、readImports(f, false)が呼び出されます。この関数は、ファイルのpackage宣言からimportブロックの終わりまでを読み込みます。第二引数のfalseは、構文エラーが発生した場合に、readImportsがエラーを報告せずにファイル全体を読み込むように指示します。これは、go/parserが後でより詳細な構文エラーを報告するためです。
  • Goファイルでなければ(例: .c, .s, .hなど)、readComments(f)が呼び出されます。この関数は、ファイルの先頭にあるコメントブロックのみを読み込みます。これは、Cgoディレクティブやビルド制約が通常コメントとして記述されるためです。

この変更により、go/buildパッケージは、ファイルの種類に応じて必要な最小限のデータのみを読み込むようになり、I/O効率が大幅に向上します。

src/pkg/go/build/read.goの新規追加

このファイルは、カスタムファイルリーダーの具体的な実装を提供します。

  • importReader: 前述の通り、バッファリングされた読み込み、先読み、エラーハンドリング、そして読み込んだバイトの蓄積を行うための状態を管理します。
  • readByte(), peekByte(), nextByte(): これらは低レベルのバイト読み込みと先読みのメカニズムを提供します。特にpeekByteは、空白やコメントをスキップするロジックを含んでおり、Goの字句構造を効率的にナビゲートするために重要です。
  • readKeyword(), readIdent(), readString(), readImport(): これらはGoの特定の構文要素(キーワード、識別子、文字列リテラル、インポート宣言)を解析するための高レベルなヘルパー関数です。これらはpeekBytenextByteを組み合わせて使用し、期待されるパターンに一致しない場合はsyntaxErrorを記録します。
  • readComments(): importReaderを使用して、ファイルの先頭にあるコメントブロックを読み込みます。peekByte(true)でコメント以外の最初の文字を見つけたら、それまでのバッファ内容を返します。
  • readImports(): importReaderを使用して、package宣言からimportブロックの終わりまでを読み込みます。readKeyword, readIdent, readImportなどのヘルパー関数を順次呼び出し、Goファイルの構造を模倣した簡易的な解析を行います。インポートグループ(import (...))の処理も含まれます。

これらの関数は、Goのパーサー(go/parser)が提供する完全な構文解析機能とは異なり、go/buildパッケージが必要とする最小限の情報(パッケージ名、インポートパス、ビルドタグ)を効率的に抽出することに特化しています。これにより、ビルドプロセスにおけるオーバーヘッドを削減しています。

関連リンク

参考にした情報源リンク

  • Go言語のソースコード(特にgo/buildパッケージ)
  • Go言語の公式ドキュメント
  • Go言語のビルドシステムに関する一般的な知識