Keyboard shortcuts

Press or to navigate between chapters

Press S or / to search in the book

Press ? to show this help

Press Esc to hide this help

[インデックス 1117] ファイルの概要

コミット

temp fix for map not multiple of 8

このコミットは、Go言語のランタイムにおけるハッシュマップの実装において、データサイズが8の倍数でない場合に発生する問題に対する一時的な修正を導入しています。具体的には、datasize変数を8の倍数に丸める処理を追加することで、メモリのアライメントに関する潜在的な問題を回避しています。

GitHub上でのコミットページへのリンク

https://github.com/golang/go/commit/9795c9e72735efdf717df38f9ffe1ca1b0e9c0cb

元コミット内容

commit 9795c9e72735efdf717df38f9ffe1ca1b0e9c0cb
Author: Ken Thompson <ken@golang.org>
Date:   Thu Nov 13 13:20:18 2008 -0800

    temp fix for map not multiple of 8
    
    R=r
    OCL=19166
    CL=19166

変更の背景

このコミットは、Go言語の初期開発段階におけるランタイムの最適化と安定化の一環として行われました。特に、ハッシュマップ(Goにおけるmap型)の内部実装において、メモリ割り当ての際にデータサイズが特定のバイト境界(この場合は8バイト)にアライメントされていない場合に、パフォーマンスの低下や、場合によってはクラッシュなどの予期せぬ動作を引き起こす可能性がありました。

多くのCPUアーキテクチャでは、メモリへのアクセスは特定のバイト境界にアライメントされている場合に最も効率的です。例えば、64ビットシステムでは8バイト境界にアライメントされていることが一般的です。アライメントされていないメモリにアクセスしようとすると、CPUが追加のサイクルを費やしたり、アライメント例外を発生させたりすることがあります。この「一時的な修正」は、このような問題を回避し、ハッシュマップの安定性とパフォーマンスを確保するための初期の対応策として導入されました。

前提知識の解説

メモリのアライメント

メモリのアライメントとは、コンピュータのメモリ上でデータが配置される際の、特定のバイト境界への整列を指します。CPUは通常、ワードサイズ(例えば32ビットシステムでは4バイト、64ビットシステムでは8バイト)の倍数のアドレスからデータを読み書きする方が効率的です。データがこの境界に整列していない場合、CPUは複数のメモリ読み出し操作を行う必要があったり、アライメント例外を発生させたりすることがあります。これにより、プログラムの実行速度が低下したり、クラッシュしたりする可能性があります。

ハッシュマップ(Goにおけるmap

ハッシュマップは、キーと値のペアを格納するためのデータ構造です。Go言語ではmap型として組み込みでサポートされており、非常に高速なキーによる値の検索、挿入、削除が可能です。内部的には、キーのハッシュ値に基づいてメモリ上の特定の位置に値が格納されます。ハッシュマップの効率的な動作には、メモリの効率的な利用とアクセスが不可欠であり、メモリのアライメントは重要な要素となります。

Goランタイム

Goランタイムは、Goプログラムの実行を管理するシステムです。これには、ガベージコレクタ、スケジューラ、メモリ管理、そしてmapのような組み込み型の内部実装などが含まれます。src/runtime/hashmap.cは、Goランタイムの一部として、ハッシュマップの低レベルな実装をC言語で記述したものです。Go言語自体は高レベルな言語ですが、その基盤となるランタイムの多くは、パフォーマンスとシステムリソースへの直接的なアクセスを目的としてCやアセンブリ言語で書かれています。

技術的詳細

このコミットの技術的詳細は、メモリのアライメント要件を満たすために、ハッシュマップのデータサイズを調整することにあります。

src/runtime/hashmap.c内のhash_init関数は、新しいハッシュマップを初期化する際に呼び出されます。この関数内で、ハッシュマップが格納するデータのサイズ(datasize)が計算されます。元のコードでは、datasizesizeof (void *)(ポインタのサイズ、通常は4バイトまたは8バイト)よりも小さい場合に調整するロジックはありましたが、それが8の倍数であることを保証するものではありませんでした。

追加されたdatasize = rnd(datasize, 8);という行は、datasizeを8の倍数に切り上げる役割を果たします。rnd関数は、おそらくGoランタイム内で定義されているユーティリティ関数で、第一引数を第二引数の倍数に切り上げる(ラウンドアップする)機能を持つと推測されます。これにより、ハッシュマップの各エントリがメモリ上で8バイト境界に適切にアライメントされるようになり、CPUが効率的にデータにアクセスできるようになります。

この修正は「temp fix」(一時的な修正)とされていますが、これはGo言語の初期段階において、より洗練されたメモリ管理やアライメントの仕組みが導入されるまでの暫定的な措置であったことを示唆しています。しかし、その基本的な考え方(メモリのアライメントを保証する)は、その後のGoランタイムの設計にも引き継がれています。

コアとなるコードの変更箇所

--- a/src/runtime/hashmap.c
+++ b/src/runtime/hashmap.c
@@ -125,6 +125,7 @@ hash_init (struct hash *h,
 
 	if(datasize < sizeof (void *))
 		datasize = sizeof (void *);
+	datasize = rnd(datasize, 8);
 	init_sizes (hint, &init_power, &max_power);
 	h->datasize = datasize;
 	h->max_power = max_power;

コアとなるコードの解説

変更はsrc/runtime/hashmap.cファイルのhash_init関数内の一行です。

元のコードでは、datasizesizeof (void *)(ポインタのサイズ)よりも小さい場合に、datasizesizeof (void *)に設定していました。これは、少なくともポインタサイズ分のメモリを確保するという基本的な要件を満たすためのものでした。

追加された行 datasize = rnd(datasize, 8); は、このdatasizeの値を、次に利用される前に8の倍数に丸めることを保証します。

  • datasize: ハッシュマップの各要素が占めるメモリのバイト数。
  • rnd(datasize, 8): datasizeを8の倍数に切り上げる関数呼び出し。例えば、datasizeが10であれば16に、15であれば16に、8であれば8のままになります。

この変更により、ハッシュマップのデータ構造がメモリ上で常に8バイト境界にアライメントされるようになり、メモリへのアクセス効率が向上し、アライメント関連の潜在的な問題が解消されます。これは、特に64ビットシステムにおいて、パフォーマンスと安定性を確保するために非常に重要です。

関連リンク

参考にした情報源リンク

  • Go言語のソースコード(特にsrc/runtime/hashmap.cの周辺コード)
  • メモリのアライメントに関する一般的なコンピュータサイエンスの知識
  • Go言語の初期のコミット履歴と開発メーリングリスト(公開されている場合)
  • Go言語のmap実装に関する技術記事やブログ(一般的な情報源として)