[インデックス 12720] ファイルの概要
このコミットは、Go言語の標準ライブラリ sort
パッケージにおける Sort
関数のドキュメントに、その時間計算量に関する記述を追加するものです。具体的には、ソートアルゴリズムの時間計算量が O(n log n)
であること、および data.Less
と data.Swap
の呼び出し回数に関する情報が追記されました。
コミット
Go言語の sort
パッケージの Sort
関数について、その時間計算量が O(n log n)
であることをドキュメントに明記する変更です。これにより、Goのソートが効率的なアルゴリズムを使用していることが公式に示されます。また、data.Less
と data.Swap
の呼び出し回数についても言及されています。
GitHub上でのコミットページへのリンク
https://github.com/golang/go/commit/08959defa89f3a37775f744a52bfbbff93e742d6
元コミット内容
sort: add time complexity to doc
Let's tell the world that Go's sort is O(n log n).
Surely this is a feature we intend to keep.
R=golang-dev, gri
CC=golang-dev
https://golang.org/cl/5867045
変更の背景
この変更の背景には、Go言語の sort
パッケージが提供するソート機能の性能特性を、より明確にユーザーに伝えるという意図があります。以前のドキュメントでは、ソートが「安定ソートではない」という点のみが言及されており、その時間計算量については触れられていませんでした。
ソートアルゴリズムの効率性を示す上で、時間計算量は非常に重要な指標です。O(n log n)
という記述は、Goの sort
パッケージが、データ量 n
が増加しても、非常に効率的に動作するアルゴリズム(例えばクイックソートやヒープソートなど)を採用していることを示唆します。開発者にとって、使用するライブラリの性能特性を事前に把握できることは、アプリケーションの設計やパフォーマンスチューニングにおいて不可欠です。
このコミットは、Goの sort
パッケージが提供するソート機能が、実用上十分な効率性を持っていることを公式に保証し、その特性をドキュメントとして明文化することで、ユーザーの信頼性を高めることを目的としています。
前提知識の解説
時間計算量 O(n log n)
時間計算量(Time Complexity)は、アルゴリズムの実行時間が入力サイズ n
に対してどのように増加するかを示す指標です。O
記法(Big O Notation)は、アルゴリズムの効率性を大まかに分類するために用いられます。
O(n log n)
は、効率的なソートアルゴリズムの典型的な時間計算量です。これは、入力サイズ n
が大きくなるにつれて、実行時間が n
に log n
を掛けた値に比例して増加することを意味します。例えば、n
が1000の場合、log n
は約10(底が2の場合)なので、実行時間は約 1000 * 10 = 10000
に比例します。n^2
のようなアルゴリズム(例:バブルソート、選択ソート)と比較すると、n log n
ははるかに高速です。
代表的な O(n log n)
のソートアルゴリズムには、マージソート、ヒープソート、そして平均的にはクイックソートがあります。これらのアルゴリズムは、大規模なデータセットを効率的にソートするために広く利用されています。
安定ソート (Stable Sort)
安定ソートとは、ソート対象の要素に同じ値を持つものが複数存在する場合に、それらの相対的な順序がソート後も維持されるソートアルゴリズムを指します。
例:
元のリスト: [(5, "apple"), (2, "banana"), (5, "orange")]
ここで、数値がソートキーだとします。
安定ソートの場合の出力例: [(2, "banana"), (5, "apple"), (5, "orange")]
(元のリストで "apple" が "orange" より前にあったため、ソート後もその順序が維持される)
不安定ソートの場合の出力例: [(2, "banana"), (5, "orange"), (5, "apple")]
("apple" と "orange" の相対的な順序が入れ替わる可能性がある)
Goの sort.Sort
関数は、ドキュメントに明記されている通り「安定ソートではない」ため、同じ値を持つ要素の相対的な順序は保証されません。これは、内部でクイックソートのような不安定なアルゴリズムが使用されている可能性があることを示唆しています。
Go言語の sort
パッケージと Interface
Go言語の sort
パッケージは、任意のデータ型をソートするための汎用的なインターフェースを提供します。ソート可能な型は、sort.Interface
インターフェースを実装する必要があります。このインターフェースは以下の3つのメソッドを定義しています。
Len() int
: ソート対象の要素数を返します。Less(i, j int) bool
: インデックスi
の要素がインデックスj
の要素よりも小さい場合にtrue
を返します。Swap(i, j int)
: インデックスi
とj
の要素を入れ替えます。
sort.Sort
関数は、この sort.Interface
を実装した任意のデータを受け取り、ソートを実行します。これにより、ユーザーは独自の比較ロジックやデータ構造に対して、Go標準の効率的なソートアルゴリズムを適用できます。
技術的詳細
Go言語の sort
パッケージの Sort
関数は、内部的にハイブリッドなソートアルゴリズムを採用しています。具体的には、クイックソートを主に使用し、再帰の深さが一定以上になった場合や、小さなサブ配列に対してはヒープソートや挿入ソートに切り替えることで、最悪ケースの性能を保証しつつ、平均的な性能を最適化しています。
このコミットで追加された O(n log n)
という時間計算量は、このようなハイブリッドなアプローチによって達成される平均および最悪ケースの性能保証を反映しています。クイックソートは平均的には O(n log n)
ですが、最悪ケースでは O(n^2)
になる可能性があります。しかし、Goの sort
パッケージでは、再帰の深さを制限し、深くなりすぎた場合にヒープソート(常に O(n log n)
)に切り替えることで、最悪ケースでも O(n log n)
の性能を保証しています。
また、ドキュメントに追加された It makes one call to data.Len to determine n, and O(n*log(n)) calls to data.Less and data.Swap.
という記述は、ソートアルゴリズムが Len
メソッドを1回だけ呼び出して要素数を取得し、比較 (Less
) と交換 (Swap
) の操作を O(n log n)
回行うことを具体的に示しています。これは、sort.Interface
を実装する際に、これらのメソッドの効率性がソート全体のパフォーマンスに直接影響することを示唆しています。特に Less
と Swap
はソート処理の内部で頻繁に呼び出されるため、これらの操作が定数時間 (O(1)
) で実行されることが、全体の O(n log n)
の時間計算量を維持するために重要です。
Sort
関数が安定ソートではないという特性は、内部で要素の相対的な順序を維持しないアルゴリズム(例えば、クイックソートの典型的な実装)が使用されていることを裏付けています。安定ソートが必要な場合は、sort.SliceStable
や sort.Stable
といった別の関数を使用する必要があります。
コアとなるコードの変更箇所
--- a/src/pkg/sort/sort.go
+++ b/src/pkg/sort/sort.go
@@ -184,7 +184,8 @@ func quickSort(data Interface, a, b, maxDepth int) {
}
// Sort sorts data.
-// The algorithm used is not guaranteed to be a stable sort.
+// It makes one call to data.Len to determine n, and O(n*log(n)) calls to
+// data.Less and data.Swap. The sort is not guaranteed to be stable.
func Sort(data Interface) {
// Switch to heapsort if depth of 2*ceil(lg(n+1)) is reached.
n := data.Len()
コアとなるコードの解説
変更は src/pkg/sort/sort.go
ファイルの Sort
関数のドキュメントコメントにあります。
-
変更前:
// Sort sorts data. // The algorithm used is not guaranteed to be a stable sort.
以前のドキュメントでは、
Sort
関数がデータをソートすることと、使用されるアルゴリズムが安定ソートではないことのみが記述されていました。 -
変更後:
// Sort sorts data. // It makes one call to data.Len to determine n, and O(n*log(n)) calls to // data.Less and data.Swap. The sort is not guaranteed to be stable.
変更後には、以下の2つの重要な情報が追加されました。
It makes one call to data.Len to determine n
:Sort
関数がdata.Len()
メソッドを1回だけ呼び出して、ソート対象の要素数n
を取得することを示しています。これは、Len()
メソッドが頻繁に呼び出されることを心配する必要がないことを示唆しています。and O(n*log(n)) calls to data.Less and data.Swap
:data.Less
とdata.Swap
メソッドがO(n log n)
回呼び出されることを明記しています。これは、ソートアルゴリズムの主要な操作である比較と交換の回数が、全体の時間計算量O(n log n)
に直接対応していることを示しています。この情報は、sort.Interface
を実装する際に、Less
とSwap
の実装が効率的であることの重要性を強調しています。
この変更により、Sort
関数の性能特性がより明確になり、開発者がGoのソート機能を利用する際の判断材料が増えました。
関連リンク
- Go言語
sort
パッケージの公式ドキュメント: https://pkg.go.dev/sort - Big O Notation (Wikipedia): https://en.wikipedia.org/wiki/Big_O_notation
- Sorting algorithm (Wikipedia): https://en.wikipedia.org/wiki/Sorting_algorithm
参考にした情報源リンク
- Go言語の公式ドキュメント
- ソートアルゴリズムに関する一般的な情報源(Wikipediaなど)
- Go言語の
sort
パッケージのソースコード(コミット履歴を含む) - Go言語の
sort
パッケージの内部実装に関する技術記事や解説