Keyboard shortcuts

Press or to navigate between chapters

Press S or / to search in the book

Press ? to show this help

Press Esc to hide this help

[インデックス 15052] ファイルの概要

このコミットは、Go言語の標準ライブラリであるfmtパッケージにおける、バイト派生配列(byte-derived arrays)およびスライス(slices)のGo構文(Go syntax)ハンドリングを改善するものです。具体的には、fmt.Print系の関数がこれらの型を整形する際の挙動を修正し、より直感的で期待される出力になるように変更されています。

コミット

commit 92bc89690988f30863fdafa4a2e353a99edf5ef1
Author: Robert Daniel Kortschak <dan.kortschak@adelaide.edu.au>
Date:   Wed Jan 30 17:53:53 2013 -0800

    fmt: improve go syntax handling of byte-derived arrays and slices
    
    Fixes #4685.
    
    R=golang-dev, adg, remyoudompheng, rsc
    CC=golang-dev
    https://golang.org/cl/7205047

GitHub上でのコミットページへのリンク

https://github.com/golang/go/commit/92bc89690988f30863fdafa4a2e353a99edf5ef1

元コミット内容

fmt: improve go syntax handling of byte-derived arrays and slices

Fixes #4685.

R=golang-dev, adg, remyoudompheng, rsc
CC=golang-dev
https://golang.org/cl/7205047

変更の背景

この変更は、Go言語のfmtパッケージが、byte型から派生したカスタム型(例えば、type renamedUint8 byteのような型)の配列やスライスを整形する際に、期待されるGo構文での出力(%#vフォーマット指定子を使用した場合など)を提供していなかった問題(Issue #4685)を修正するために行われました。

従来のfmtパッケージでは、[]byte型や[N]byte型は特別扱いされ、%#vで整形すると[]byte{...}[N]byte{...}のような形式で出力されていました。しかし、type MyBytes []byteのようにbyteを基底とするカスタム型の場合、fmtパッケージはこれを一般的なスライスや配列として扱い、[]uint8{...}[N]uint8{...}のように出力していました。これは、Goのソースコードでこれらの型を宣言する際の構文と一致せず、デバッグやコード生成の際に不便でした。

このコミットは、このようなバイト派生型に対しても、その元の型名(例: fmt_test.renamedUint8)を正確に反映したGo構文での出力を行うようにfmtパッケージの挙動を改善することを目的としています。

前提知識の解説

Go言語のfmtパッケージ

fmtパッケージは、Go言語におけるフォーマットI/Oを実装するための標準パッケージです。C言語のprintfscanfに似た機能を提供し、様々なデータ型を文字列に変換して出力したり、文字列からデータを読み込んだりすることができます。

  • フォーマット指定子: fmtパッケージでは、出力の形式を制御するためにフォーマット指定子を使用します。
    • %v: 値のデフォルトフォーマット。
    • %#v: Go構文での値の表現。構造体や配列、スライスなどの内部構造を詳細に表示する際に便利です。
    • %T: 値の型名。
    • %x: 16進数表現。
    • %s: 文字列表現。
    • %q: クォートされた文字列。

reflectパッケージ

reflectパッケージは、Go言語の実行時リフレクション機能を提供します。これにより、プログラムは自身の構造(型、フィールド、メソッドなど)を検査し、実行時にそれらを操作することができます。

  • reflect.Type: Goの型を表すインターフェースです。型の名前、基底型、要素型などを取得できます。
  • reflect.Kind: 型の基本的なカテゴリ(例: reflect.Int, reflect.Slice, reflect.Arrayなど)を表す定数です。
  • reflect.Value: Goの値を表す構造体です。値の型、内容、アドレス可能性などを取得し、操作することができます。
  • f.Type().Elem().Kind() == reflect.Uint8: これは、リフレクションを使って、スライスや配列の要素の型がuint8(Go言語におけるbyteのエイリアス)であるかどうかをチェックする一般的なパターンです。
  • f.Bytes(): reflect.Valueがバイトスライス([]byte)を表す場合に、その内容を[]byteとして取得するメソッドです。
  • f.Slice(0, f.Len()).Bytes(): 配列の場合に、その内容をバイトスライスとして取得するためのテクニックです。配列がアドレス可能(CanAddr()がtrue)である必要があります。

バイト派生型

Go言語では、既存の型を基底として新しい型を宣言することができます。これを「型定義(type definition)」と呼びます。例えば、type renamedUint8 byteのように宣言すると、renamedUint8byteとは異なる新しい型として扱われますが、その基底となる型はbyteです。

このコミットの文脈では、byteを基底とする配列やスライス(例: []renamedUint8[5]renamedUint8)が「バイト派生配列およびスライス」と呼ばれています。

技術的詳細

このコミットの主要な変更点は、src/pkg/fmt/print.goファイル内のpp.fmtBytes関数と、pp.printArg関数(特にreflect.Arrayおよびreflect.Sliceのケース)のロジックにあります。

pp.fmtBytes関数の変更

変更前は、pp.fmtBytes関数は[]byte型の値を受け取り、Go構文(goSyntaxがtrueの場合)で整形する際に常にbytesBytes[]byte{というバイト列)を出力していました。

変更後は、pp.fmtBytes関数にreflect.Type型の引数typが追加されました。このtypは、整形対象の元の型情報を含んでいます。

// 変更前
func (p *pp) fmtBytes(v []byte, verb rune, goSyntax bool, depth int) {
    if verb == 'v' || verb == 'd' {
        if goSyntax {
            p.buf.Write(bytesBytes) // 常に []byte{ を出力
        } else {
            p.buf.WriteByte('[')
        }
        // ...
    }
    // ...
}

// 変更後
func (p *pp) fmtBytes(v []byte, verb rune, goSyntax bool, typ reflect.Type, depth int) {
    if verb == 'v' || verb == 'd' {
        if goSyntax {
            if typ == nil { // typがnilの場合は従来の []byte{ を出力
                p.buf.Write(bytesBytes)
            } else { // typが指定されている場合はその型名を出力
                p.buf.WriteString(typ.String())
                p.buf.WriteByte('{')
            }
        } else {
            p.buf.WriteByte('[')
        }
        // ...
    }
    // ...
}

この変更により、typnilでない場合(つまり、バイト派生型である場合)、fmt[]byte{ではなく、その型の完全な名前(例: []fmt_test.renamedUint8{)を出力できるようになりました。

pp.printArg関数の変更

pp.printArg関数は、fmtパッケージの整形ロジックの核心部分であり、様々な型の値をどのように整形するかを決定します。特に、reflect.Arrayおよびreflect.Sliceのケースが変更されました。

変更前は、要素の型がreflect.Uint8である配列やスライスに対して、常に[]byteとして扱い、fmtBytesを呼び出す際にtyp引数を渡していませんでした。これは、type MyBytes []byteのようなカスタム型であっても、[]byteとして整形されてしまう原因となっていました。

変更後は、以下の点が改善されました。

  1. 型情報の取得: typ := f.Type()として、整形対象のreflect.Valueからその型情報を取得するようになりました。
  2. バイトスライスの効率的な取得:
    • f.Kind() == reflect.Sliceの場合、f.Bytes()を直接呼び出してバイトスライスを取得します。これは、[]byte型やその派生スライス型に対して最も効率的な方法です。
    • f.CanAddr()がtrueの場合(つまり、配列がアドレス可能である場合)、f.Slice(0, f.Len()).Bytes()を使用して配列の内容をバイトスライスとして取得します。これにより、配列全体をコピーすることなく、効率的にバイトスライスとして扱えます。
    • 上記いずれにも該当しない場合(非アドレス可能な配列など)、従来通りmake([]byte, f.Len())で新しいスライスを作成し、要素を一つずつコピーしてバイトスライスを構築します。これは稀なケースですが、互換性を保つために残されています。
  3. fmtBytesへのtypの引き渡し: 最終的にp.fmtBytes(bytes, verb, goSyntax, typ, depth)を呼び出す際に、取得したtyp情報を渡すようになりました。これにより、fmtBytes関数が正しい型名を出力できるようになります。
// 変更前 (抜粋)
case reflect.Array, reflect.Slice:
    // Byte slices are special.
    if f.Type().Elem().Kind() == reflect.Uint8 {
        // ... バイトスライスを構築するロジック ...
        bytes := make([]byte, f.Len())
        for i := range bytes {
            bytes[i] = byte(f.Index(i).Uint())
        }
        p.fmtBytes(bytes, verb, goSyntax, depth) // typを渡していない
        // ...
    }
    // ...

// 変更後 (抜粋)
case reflect.Array, reflect.Slice:
    // Byte slices are special.
    if typ := f.Type(); typ.Elem().Kind() == reflect.Uint8 {
        var bytes []byte
        if f.Kind() == reflect.Slice {
            bytes = f.Bytes()
        } else if f.CanAddr() {
            bytes = f.Slice(0, f.Len()).Bytes()
        } else {
            // We have an array, but we cannot Slice() a non-addressable array,
            // so we build a slice by hand. This is a rare case but it would be nice
            // if reflection could help a little more.
            bytes = make([]byte, f.Len())
            for i := range bytes {
                bytes[i] = byte(f.Index(i).Uint())
            }
        }
        p.fmtBytes(bytes, verb, goSyntax, typ, depth) // typを渡すようになった
        wasString = verb == 's'
        break
    }
    // ...

これらの変更により、fmtパッケージは、byteを基底とするカスタム型の配列やスライスを%#vで整形する際に、そのカスタム型名を含むGo構文で出力できるようになりました。

コアとなるコードの変更箇所

src/pkg/fmt/fmt_test.go

  • renamedUint8というbyteのエイリアス型を定義し、それを用いた配列barrayとスライスbsliceを追加。
  • fmttests変数に、barraybsliceに対する%vおよび%#vフォーマットのテストケースを追加。特に%#vの場合に、期待される出力が[5]fmt_test.renamedUint8{...}[]fmt_test.renamedUint8{...}となるように修正。
  • %x, %s, %qフォーマットに対する[]renamedUint8のテストケースも追加。

src/pkg/fmt/print.go

  • func (p *pp) fmtBytes(v []byte, verb rune, goSyntax bool, depth int)のシグネチャをfunc (p *pp) fmtBytes(v []byte, verb rune, goSyntax bool, typ reflect.Type, depth int)に変更し、reflect.Type型のtyp引数を追加。
  • fmtBytes関数内で、goSyntaxがtrueの場合にtyp == nilであれば従来の[]byte{を出力し、typ != nilであればtyp.String()(型名)と{を出力するようにロジックを変更。
  • pp.printField関数内でcase []byte:の箇所でp.fmtBytesを呼び出す際に、typ引数にnilを渡すように変更(既存の[]byte型は従来通りの挙動を維持するため)。
  • pp.printArg関数内のcase reflect.Array, reflect.Slice:のブロックで、要素の型がreflect.Uint8である場合の処理を大幅に修正。
    • reflect.Valueからreflect.Typeを取得し、typ変数に格納。
    • バイトスライスを取得するロジックを、f.Bytes()f.Slice().Bytes()、手動コピーの3パターンに分岐させ、より効率的かつ正確にバイトスライスを取得できるように改善。
    • p.fmtBytesを呼び出す際に、取得したtypを引数として渡すように変更。

コアとなるコードの解説

src/pkg/fmt/print.go の変更点

fmtBytes関数のシグネチャ変更と内部ロジック

// 変更前: func (p *pp) fmtBytes(v []byte, verb rune, goSyntax bool, depth int)
// 変更後: func (p *pp) fmtBytes(v []byte, verb rune, goSyntax bool, typ reflect.Type, depth int)

// 変更後の fmtBytes 関数内の関連部分
if goSyntax {
    if typ == nil {
        p.buf.Write(bytesBytes) // []byte{ を出力
    } else {
        p.buf.WriteString(typ.String()) // 型名 (例: []fmt_test.renamedUint8) を出力
        p.buf.WriteByte('{')
    }
}

この変更は、fmtBytes関数が単なる[]byteだけでなく、byteを基底とするカスタムスライスや配列の型情報も受け取れるようにするためのものです。typnilの場合は、従来の[]byteの整形挙動を維持します。typnilでない場合は、その型名(例: []fmt_test.renamedUint8)を文字列として出力し、その後に{を続けることで、Go構文に沿った出力を実現します。

printArg関数内の配列・スライス処理の改善

// 変更後の printArg 関数内の関連部分
case reflect.Array, reflect.Slice:
    if typ := f.Type(); typ.Elem().Kind() == reflect.Uint8 {
        var bytes []byte
        if f.Kind() == reflect.Slice {
            bytes = f.Bytes() // []byte またはその派生スライスの場合
        } else if f.CanAddr() {
            bytes = f.Slice(0, f.Len()).Bytes() // アドレス可能な配列の場合
        } else {
            // 非アドレス可能な配列の場合、手動でコピー
            bytes = make([]byte, f.Len())
            for i := range bytes {
                bytes[i] = byte(f.Index(i).Uint())
            }
        }
        p.fmtBytes(bytes, verb, goSyntax, typ, depth) // ここで typ を渡す
        wasString = verb == 's'
        break
    }

この部分は、fmtパッケージがGoの配列やスライスを整形する際の中心的なロジックです。

  1. if typ := f.Type(); typ.Elem().Kind() == reflect.Uint8: まず、整形対象のreflect.Value fからその型情報typを取得し、その要素の型がuint8(つまりbyte)であるかどうかをチェックします。これにより、バイトスライスやバイト配列、およびそれらの派生型を特別扱いします。
  2. バイトスライスの取得ロジック:
    • f.Kind() == reflect.Slice: freflect.Sliceの種類([]byte[]renamedUint8など)である場合、f.Bytes()メソッドを直接呼び出して、その内容を[]byteとして取得します。これは最も効率的な方法です。
    • f.CanAddr(): fがアドレス可能である場合(通常、変数として宣言された配列など)、f.Slice(0, f.Len()).Bytes()を使用して、配列全体をカバーするスライスを作成し、その内容を[]byteとして取得します。これにより、配列のコピーを避けることができます。
    • それ以外の場合(例: 非アドレス可能な配列)、make([]byte, f.Len())で新しいバイトスライスを作成し、ループを使って元の配列の各要素を新しいスライスにコピーします。これは、リフレクションで直接バイトスライスとして扱えない場合のフォールバックです。
  3. p.fmtBytes(bytes, verb, goSyntax, typ, depth): 最後に、取得したバイトスライスbytesと、元の型情報typfmtBytes関数に渡して整形処理を行います。このtypを渡すことで、fmtBytesは正しいGo構文の型名を出力できるようになります。

これらの変更により、fmtパッケージは、byteを基底とするカスタム型の配列やスライスに対しても、そのカスタム型名を正確に反映したGo構文での出力(%#v)を提供できるようになり、デバッグやコードの可読性が向上しました。

関連リンク

参考にした情報源リンク