[インデックス 1692] ファイルの概要
このコミットは、Go言語の標準ライブラリの一部であるflag
パッケージと、そのテストファイルに影響を与えています。
src/lib/flag.go
: Goプログラムがコマンドライン引数を解析するための機能を提供するflag
パッケージの主要な実装ファイルです。このファイルには、フラグの定義、値のパース、デフォルト値の表示などのロジックが含まれています。src/lib/flag_test.go
:flag
パッケージの機能が正しく動作するかを検証するための単体テストファイルです。
コミット
このコミットは、flag
パッケージにおける文字列から数値への変換処理を、自前の実装からGo標準ライブラリのstrconv
パッケージに移行し、それに伴いテストを強化することを目的としています。特に、数値型フラグのパース処理の堅牢性を向上させ、文字列型フラグのデフォルト値表示をより適切にする変更が含まれています。
GitHub上でのコミットページへのリンク
https://github.com/golang/go/commit/575257d503432be3a1195919203262289f2c328c
元コミット内容
commit 575257d503432be3a1195919203262289f2c328c
Author: Rob Pike <r@golang.org>
Date: Mon Feb 16 21:55:37 2009 -0800
use proper strconv in string values.
make test a little stronger.
R=rsc
DELTA=94 (27 added, 39 deleted, 28 changed)
OCL=25085
CL=25087
変更の背景
このコミットが行われた2009年2月は、Go言語がまだ一般に公開される前の初期開発段階でした。当時のflag
パッケージには、文字列から整数への変換を行うためのctoi
(文字を整数に変換)、atoi
(文字列を整数に変換)といった独自のヘルパー関数が実装されていました。
しかし、自前で数値変換ロジックを実装することは、以下のような問題を引き起こす可能性があります。
- 堅牢性の欠如: エラーハンドリング、基数(10進数、8進数、16進数など)の自動判別、符号付き/符号なし整数の扱い、オーバーフローチェックなど、数値変換には多くの考慮事項があります。これらをすべて自前で完璧に実装するのは困難であり、バグやセキュリティ脆弱性の原因となる可能性があります。
- 冗長性: 標準ライブラリに同等の機能が提供される場合、自前で実装することはコードの冗長性を生み、メンテナンスコストを増加させます。
- 非効率性: 専門的に最適化された標準ライブラリの実装と比較して、パフォーマンスが劣る可能性があります。
- Goらしいコードの原則: Go言語では、可能な限り標準ライブラリを活用し、シンプルで慣用的なコードを書くことが推奨されます。
このコミットは、これらの問題を解決し、より堅牢でGoらしいコードベースを構築するために、flag
パッケージの数値変換処理をGo標準ライブラリのstrconv
パッケージに移行することを決定しました。また、この変更に伴い、変換ロジックの変更が正しく機能することを保証するために、テストケースも強化されています。
前提知識の解説
Go言語のflag
パッケージ
flag
パッケージは、Goプログラムがコマンドライン引数を解析するための機能を提供します。これにより、ユーザーはプログラムの実行時にオプションや設定値を指定できます。
- フラグの定義:
flag.Bool
,flag.Int
,flag.String
などの関数を使用して、コマンドラインフラグを定義します。これらの関数は、フラグの名前、デフォルト値、および使用方法の文字列を受け取ります。 - 値の取得: 定義されたフラグは、対応する型のポインタを返します。プログラム内でそのポインタを逆参照することで、ユーザーが指定した値(またはデフォルト値)を取得できます。
- パース:
flag.Parse()
関数を呼び出すことで、コマンドライン引数が実際に解析され、定義されたフラグに値が設定されます。 flag.Value
インターフェース:flag
パッケージは、カスタム型をフラグとして使用するためのflag.Value
インターフェースを定義しています。このインターフェースを実装することで、任意の型をコマンドライン引数としてパースできるようになります。このコミットでは、intValue
,int64Value
,uintValue
,uint64Value
,stringValue
といった内部型がこのインターフェースを実装しています。
Go言語のstrconv
パッケージ
strconv
パッケージは、"string conversion"(文字列変換)の略で、Go言語の標準ライブラリの一部です。このパッケージは、プリミティブ型(整数、浮動小数点数、真偽値など)と文字列との間の変換機能を提供します。
Atoi(s string) (int, error)
: 文字列s
を符号付き10進整数に変換します。変換できない場合はエラーを返します。ParseInt(s string, base int, bitSize int) (int64, error)
: 文字列s
を、指定された基数(base
、例: 2, 8, 10, 16)とビットサイズ(bitSize
、例: 0, 8, 16, 32, 64)の符号付き整数に変換します。ParseUint(s string, base int, bitSize int) (uint64, error)
:ParseInt
と同様ですが、符号なし整数に変換します。FormatInt(i int64, base int) string
: 整数i
を指定された基数の文字列に変換します。FormatUint(i uint64, base int) string
: 符号なし整数i
を指定された基数の文字列に変換します。ParseBool(str string) (bool, error)
: 文字列を真偽値に変換します。"1", "t", "T", "true", "TRUE", "True" はtrue
に、"0", "f", "F", "false", "FALSE", "False" はfalse
に変換されます。
strconv
パッケージを使用することで、数値変換における様々なエッジケース(無効な入力、オーバーフローなど)を適切に処理でき、堅牢なコードを記述できます。
文字列フォーマット指定子 %#q
と %s
Go言語のfmt
パッケージでは、文字列のフォーマットを指定するための様々な動詞(verb)が提供されています。
%s
: 値をデフォルトの形式で文字列として出力します。文字列の場合、そのままの文字列が出力されます。%q
: Goの構文で引用符で囲まれた文字列として出力します。非ASCII文字や特殊文字はエスケープされます。%#q
:%q
と同様ですが、構造体やマップなどの複合型の場合、フィールド名も表示されます。文字列の場合、%q
と同じ挙動になります。
このコミットでは、stringValue
のString()
メソッドで%#q
から%s
に変更されており、これは文字列フラグのデフォルト値が引用符なしで表示されるように影響します。しかし、PrintDefaults
関数では、文字列フラグに対しては明示的に引用符で囲むように変更されており、これはユーザーにとってより分かりやすい出力にするための調整です。
技術的詳細
このコミットの技術的な変更は、主に以下の3つの側面に分けられます。
-
自前実装の数値変換関数の削除と
strconv
への移行:src/lib/flag.go
から、ctoi
およびatoi
関数が完全に削除されました。これらの関数は、文字列から整数への変換を独自に実装したものでした。intValue
,int64Value
,uintValue
,uint64Value
のset
メソッド内で、atoi
の呼び出しがそれぞれstrconv.Atoi
,strconv.Atoi64
,strconv.Atoui
,strconv.Atoui64
に置き換えられました。これにより、Go標準ライブラリの堅牢な変換機能が利用されるようになりました。strconv
パッケージの関数は、変換に失敗した場合にエラーを返すため、set
メソッドの戻り値もok
(ブール値)からerr == nil
(エラーがnilかどうか)に変わっています。
-
stringValue
のString()
メソッドの変更:stringValue
型(文字列フラグの値を保持する内部型)のString()
メソッドが、fmt.Sprintf("%#q", *s.p)
からfmt.Sprintf("%s", *s.p)
に変更されました。- この変更により、
stringValue
のString()
メソッドが返す文字列は、Goの構文で引用符で囲まれた形式ではなく、純粋な文字列値そのものになります。これは、flag
パッケージが内部で値を文字列として扱う際の表現に影響します。
-
PrintDefaults()
関数における文字列フラグの表示改善:PrintDefaults()
関数は、定義されているすべてのフラグのデフォルト値を表示する役割を担っています。- 以前はすべてのフラグに対して一律に
print(" -", f.Name, "=", f.DefValue, ": ", f.Usage, "\n")
という形式で出力していました。 - 変更後、
f.Value
が*stringValue
型であるかどうかをチェックし、もしそうであれば、format
文字列を" -%s=%q: %s\\n"
に変更しています。これにより、文字列型のフラグのデフォルト値は、出力時に明示的に二重引用符で囲まれて表示されるようになります。これは、ユーザーがコマンドラインで文字列を渡す際の慣習に合わせた、より分かりやすい表示形式です。
-
テストの強化:
src/lib/flag_test.go
では、テスト用のフラグの初期値がゼロ値(false
,0
,"0"
)に変更されました。これにより、フラグが正しく設定されていない場合にテストが失敗しやすくなり、より厳密な検証が可能になります。TestEverything
関数内で、flag.Visit
を使用してすべてのフラグを巡回し、その値が期待されるデフォルト値(または設定後の値)と一致するかを検証するロジックが追加されました。特に、test_bool
フラグについては、boolString
ヘルパー関数を用いて"0"が"false"に、"1"が"true"に変換されることを確認しています。flag.Set
を呼び出した後に、すべてのフラグが正しく更新されているかを検証する部分が追加され、テストの網羅性が向上しました。
これらの変更は、flag
パッケージの内部実装をより標準的で堅牢なものにし、同時にユーザーに対するコマンドラインフラグの表示を改善し、テストの品質を高めるものです。
コアとなるコードの変更箇所
src/lib/flag.go
--- a/src/lib/flag.go
+++ b/src/lib/flag.go
@@ -42,50 +42,12 @@ package flag
*\tBoolean flags may be 1, 0, t, f, true, false, TRUE, FALSE, True, False.\n */
\n-import "fmt"\n-\n-// BUG: ctoi, atoi, atob belong elsewhere
-func ctoi(c int64) int64 {\n-\tif '0' <= c && c <= '9' {\n-\t\treturn c - '0'\n-\t}\n-\tif 'a' <= c && c <= 'f' {\n-\t\treturn c - 'a'\n-\t}\n-\tif 'A' <= c && c <= 'F' {\n-\t\treturn c - 'A'\n-\t}\n-\treturn 1000 // too large for any base\n-}\n-\n-func atoi(s string) (value int64, ok bool) {\n-\tif len(s) == 0 {\n-\t\treturn 0, false\n-\t}\n-\tif s[0] == '-' {\n-\t\tn, t := atoi(s[1:len(s)]);\n-\t\treturn -n, t\n-\t}\n-\tvar base int64 = 10;\n-\ti := 0;\n-\tif s[0] == '0' {\n-\t\tbase = 8;\n-\t\tif len(s) > 1 && (s[1] == 'x' || s[1] == 'X') {\n-\t\t\tbase = 16;\n-\t\t\ti += 2;\n-\t\t}\n-\t}\n-\tvar n int64 = 0;\n-\tfor ; i < len(s); i++ {\n-\t\tk := ctoi(int64(s[i]));\n-\t\tif k >= base {\n-\t\t\treturn 0, false\n-\t\t}\n-\t\tn = n * base + k\n-\t}\n-\treturn n, true
-}\
+import (
+\t"fmt";
+\t"strconv"
+)
\n+// BUG: atob belongs elsewhere
func atob(str string) (value bool, ok bool) {
\tswitch str {
\t\tcase "1", "t", "T", "true", "TRUE", "True":
@@ -136,9 +98,9 @@ func newIntValue(val int, p *int) *intValue {
}\n \n func (i *intValue) set(s string) bool {
-\tv, ok := atoi(s);\n+\tv, err := strconv.Atoi(s);\n \t*i.p = int(v);\n-\treturn ok
+\treturn err == nil
}\n \n func (i *intValue) String() string {
@@ -156,9 +118,9 @@ func newInt64Value(val int64, p *int64) *int64Value {
}\n \n func (i *int64Value) set(s string) bool {
-\tv, ok := atoi(s);\n+\tv, err := strconv.Atoi64(s);\n \t*i.p = v;\n-\treturn ok;
+\treturn err == nil;
}\n \n func (i *int64Value) String() string {
@@ -176,9 +138,9 @@ func newUintValue(val uint, p *uint) *uintValue {
}\n \n func (i *uintValue) set(s string) bool {
-\tv, ok := atoi(s);\t// TODO(r): want unsigned
+\tv, err := strconv.Atoui(s);\n \t*i.p = uint(v);\n-\treturn ok;
+\treturn err == nil;
}\n \n func (i *uintValue) String() string {
@@ -196,9 +158,9 @@ func newUint64Value(val uint64, p *uint64) *uint64Value {
}\n \n func (i *uint64Value) set(s string) bool {
-\tv, ok := atoi(s);\t// TODO(r): want unsigned
+\tv, err := strconv.Atoui64(s);\n \t*i.p = uint64(v);\n-\treturn ok;
+\treturn err == nil;
}\n \n func (i *uint64Value) String() string {
@@ -221,7 +183,7 @@ func (s *stringValue) set(val string) bool {
}\n \n func (s *stringValue) String() string {
-\treturn fmt.Sprintf("%#q", *s.p)
+\treturn fmt.Sprintf("%s", *s.p)
}\n \n // -- FlagValue interface
@@ -283,7 +245,12 @@ func Set(name, value string) bool {
\n func PrintDefaults() {
\tVisitAll(func(f *Flag) {
-\t\tprint(" -", f.Name, "=", f.DefValue, ": ", f.Usage, "\n");
+\t\tformat := " -%s=%s: %s\\n";
+\t\tif s, ok := f.Value.(*stringValue); ok {
+\t\t\t// put quotes on the value
+\t\t\tformat = " -%s=%q: %s\\n";
+\t\t}\n+\t\tfmt.Printf(format, f.Name, f.DefValue, f.Usage);
\t})
}\n
src/lib/flag_test.go
--- a/src/lib/flag_test.go
+++ b/src/lib/flag_test.go
@@ -11,21 +11,37 @@ import (
)
var (
-\ttest_bool = flag.Bool("test_bool", true, "bool value");
-\ttest_int = flag.Int("test_int", 1, "int value");
-\ttest_int64 = flag.Int64("test_int64", 1, "int64 value");
-\ttest_uint = flag.Uint("test_uint", 1, "uint value");
-\ttest_uint64 = flag.Uint64("test_uint64", 1, "uint64 value");
-\ttest_string = flag.String("test_string", "1", "string value");
+\ttest_bool = flag.Bool("test_bool", false, "bool value");
+\ttest_int = flag.Int("test_int", 0, "int value");
+\ttest_int64 = flag.Int64("test_int64", 0, "int64 value");
+\ttest_uint = flag.Uint("test_uint", 0, "uint value");
+\ttest_uint64 = flag.Uint64("test_uint64", 0, "uint64 value");
+\ttest_string = flag.String("test_string", "0", "string value");
)
-// Because this calls flag.Parse, it needs to be the only Test* function
+func boolString(s string) string {
+\tif s == "0" {
+\t\treturn "false"
+\t}
+\treturn "true"
+}
+\n func TestEverything(t *testing.T) {
-\tflag.Parse();
\tm := make(map[string] *flag.Flag);
+\tdesired := "0";
\tvisitor := func(f *flag.Flag) {
\t\tif len(f.Name) > 5 && f.Name[0:5] == "test_" {
-\t\t\tm[f.Name] = f
+\t\t\tm[f.Name] = f;
+\t\t\tok := false;
+\t\t\tswitch {
+\t\t\tcase f.Value.String() == desired:
+\t\t\t\tok = true;
+\t\t\tcase f.Name == "test_bool" && f.Value.String() == boolString(desired):
+\t\t\t\tok = true;
+\t\t\t}\n+\t\t\tif !ok {
+\t\t\t\tt.Error("flag.Visit: bad value", f.Value.String(), "for", f.Name);\n+\t\t\t}\
\t\t}\
\t};\n \tflag.VisitAll(visitor);\
@@ -43,11 +59,16 @@ func TestEverything(t *testing.T) {
\t\t\tt.Log(k, *v)\n \t\t}\n \t}\n-\t// Now set some flags\n-\tflag.Set("test_bool", "false");
-\tflag.Set("test_uint", "1234");
+\t// Now set all flags\n+\tflag.Set("test_bool", "true");
+\tflag.Set("test_int", "1");
+\tflag.Set("test_int64", "1");
+\tflag.Set("test_uint", "1");
+\tflag.Set("test_uint64", "1");
+\tflag.Set("test_string", "1");
+\tdesired = "1";
\tflag.Visit(visitor);\n-\tif len(m) != 2 {\n+\tif len(m) != 6 {\n \t\tt.Error("flag.Visit fails after set");\n \t\tfor k, v := range m {\n \t\t\tt.Log(k, *v)\n```
## コアとなるコードの解説
### `src/lib/flag.go`の変更点
1. **`ctoi`および`atoi`関数の削除**:
* Go言語の初期段階では、`flag`パッケージ内に文字列から数値への変換を行うための独自のヘルパー関数`ctoi`と`atoi`が存在していました。これらは、文字を整数に、文字列を整数にそれぞれ変換する役割を担っていました。
* このコミットでは、これらの自前実装の関数が削除され、代わりにGo標準ライブラリの`strconv`パッケージが使用されるようになりました。これは、標準ライブラリの関数がより堅牢で、効率的であり、Goの慣用的なコーディングスタイルに合致するためです。
2. **`strconv`パッケージのインポート**:
* `import "fmt"`に加えて、`import "strconv"`が追加されました。これにより、`flag`パッケージ内で`strconv`の機能を利用できるようになります。
3. **`set`メソッドにおける`strconv`への移行**:
* `intValue`, `int64Value`, `uintValue`, `uint64Value`といった数値型フラグの内部表現に対応する`set`メソッド(文字列値を実際の数値型に変換して設定する役割)が変更されました。
* 変更前は`atoi(s)`を呼び出していましたが、変更後はそれぞれの型に対応する`strconv`パッケージの関数(`strconv.Atoi`, `strconv.Atoi64`, `strconv.Atoui`, `strconv.Atoui64`)を呼び出すようになりました。
* `strconv`の関数は、変換が成功したかどうかをブール値ではなくエラーオブジェクトで返すため、`return ok`が`return err == nil`に変更されています。これにより、エラーハンドリングがよりGoらしくなりました。
4. **`stringValue.String()`メソッドの変更**:
* `stringValue`型(文字列フラグの値を保持する内部型)の`String()`メソッドは、その値の文字列表現を返します。
* 変更前は`fmt.Sprintf("%#q", *s.p)`を使用していました。これは、文字列をGoの構文で引用符で囲み、特殊文字をエスケープした形式で出力します。例えば、`"hello"`は`"\"hello\""`と出力されます。
* 変更後は`fmt.Sprintf("%s", *s.p)`となりました。これは、文字列をそのままの形式で出力します。これにより、`stringValue`の`String()`メソッドが返す値は、純粋な文字列値そのものになります。この変更は、主に内部的な値の表現に影響しますが、後述の`PrintDefaults`の変更と合わせて、より一貫した出力挙動を実現します。
5. **`PrintDefaults()`関数における文字列フラグの表示改善**:
* `PrintDefaults()`関数は、プログラムがサポートするすべてのフラグのデフォルト値と使用方法を表示します。
* 変更前は、すべてのフラグに対して一律に`print(" -", f.Name, "=", f.DefValue, ": ", f.Usage, "\n")`という形式で出力していました。この`print`関数は、Goの初期バージョンで存在した組み込み関数で、現在の`fmt.Print`に相当します。
* 変更後、`fmt.Printf`を使用するように変更され、さらに文字列型のフラグ(`f.Value`が`*stringValue`型である場合)に対しては、そのデフォルト値を`%q`フォーマット指定子(引用符で囲む)で出力するように条件分岐が追加されました。
* これにより、例えば`-name="default_name"`のように、文字列フラグのデフォルト値が引用符で囲まれて表示されるようになり、コマンドラインで文字列を渡す際の慣習と一致し、ユーザーにとってより分かりやすい出力となります。
### `src/lib/flag_test.go`の変更点
1. **テスト用フラグの初期値の変更**:
* `test_bool`, `test_int`, `test_int64`, `test_uint`, `test_uint64`, `test_string`といったテスト用のフラグの初期値が、それぞれ`true`や`1`、`"1"`から、`false`や`0`、`"0"`といったゼロ値に変更されました。
* これにより、テストがより厳密になり、フラグが正しく初期化されていない場合や、デフォルト値が期待通りでない場合に、テストが失敗しやすくなります。
2. **`boolString`ヘルパー関数の追加**:
* `boolString`関数は、文字列"0"を"false"に、それ以外の文字列を"true"に変換するシンプルなヘルパーです。これは、ブール型フラグの`String()`メソッドが返す値("0"または"1")を、より人間が読みやすい"false"または"true"に変換するために使用されます。
3. **`TestEverything`関数の強化**:
* `flag.Parse()`の呼び出しが削除されました。これは、`TestEverything`がフラグのパースだけでなく、デフォルト値の検証や`Set`後の値の検証も行うため、テストの独立性を高めるためと考えられます。
* `flag.VisitAll`を使用して、すべてのフラグを巡回し、その`Value.String()`メソッドが返す値が期待される`desired`値(初期状態では"0")と一致するかを検証するロジックが追加されました。特に`test_bool`フラグについては、`boolString`関数を使ってブール値の文字列表現を比較しています。これにより、フラグの初期値が正しく設定されていることを確認します。
* すべてのテスト用フラグに対して`flag.Set`を呼び出し、値を"1"に設定する部分が追加されました。
* `flag.Set`後に再度`flag.Visit`を呼び出し、フラグの値が正しく更新されているかを検証するロジックが追加されました。これにより、`flag.Set`関数の動作と、フラグの値が正しく反映されることを確認します。
* `if len(m) != 2`が`if len(m) != 6`に変更されました。これは、テスト対象のフラグの数が2つから6つに増えたことに対応しています。
これらのテストの強化は、`flag`パッケージの変更が正しく機能し、堅牢性が向上したことを保証するために不可欠です。
## 関連リンク
* Go言語 `flag`パッケージ公式ドキュメント: [https://pkg.go.dev/flag](https://pkg.go.dev/flag)
* Go言語 `strconv`パッケージ公式ドキュメント: [https://pkg.go.dev/strconv](https://pkg.go.dev/strconv)
* Go言語 `fmt`パッケージ公式ドキュメント: [https://pkg.go.dev/fmt](https://pkg.go.dev/fmt)
## 参考にした情報源リンク
* Go言語の公式ドキュメント(`flag`, `strconv`, `fmt`パッケージ)
* Go言語のソースコード(コミット履歴と関連ファイル)
* Go言語の初期開発に関する一般的な知識