今日はまたちょっと将来の話。 リリース時期・本当にリリースされるか未定の機能で、メモリ管理がらみの話をまとめて。

ヒープ確保の負担を減らしたい

メモリの管理方法にはスタックヒープがあって、 一般的にはスタックの方が高速です。 スタックの方が制限がきついので、遅くてもしょうがなくヒープを使う場面がでてきます。

ヒープ管理は結構大きな負担なので、これを減らせば結構なパフォーマンス改善になります。 いくつか方向性があって、以下のような最適化が考えられます。

  • ヒープ管理自体を賢くする
  • ヒープを避ける
    • 手作業でヒープを避ける
    • 自動でヒープを避ける
      • → Object Stack Allocation (後述)

ガベージ コレクション

一般的に、こまごまと個別に処理をするよりも、ある程度まとまった単位でごっそり処理する方が効率がよかったりします。 ガベージ コレクションというメモリ管理手法はまさにそんな感じで、 「ごみはしばらくほったらかし」→「定期的にごっそりまとめてゴミ集め」とかやっていて、 これがスループット的には結構有利だったりします。 「まとめてゴミ集め」の瞬間に負荷が集中するという問題はあるものの、 トータルでみると低負荷なメモリ管理手法です。

メモリ管理が手動(alloc したものは開発者が責任をもって free しないといけない)な言語でも、内部的にガベージ コレクション的な挙動をしているものがあるくらいです。 gperftoolsの tcmalloc なんかはそうみたいです。 小さいオブジェクトの場合だけですが、freeした瞬間に即座にその領域を解放するのではなくて、 メモリが足りなくなってきたときにまとめて解放処理をします。

ガベージ コレクション以外のヒープ管理手法は、 たびたび提案されては、 そのたび「世代別 GCに性能で勝てなかった」的な結論に達したりします。 .NET でも、Project Snowflakeという研究プロジェクトがありました (Rustみたいに、メモリの所有権をはっきりさせればヒープ管理が速くなるんじゃないかという原理に基づく提案)。 結構賢そうなことをやっているんですが、それでも結論は「利益がコストに見合わない」でした。

Arena Allocation

Project Snowflake に代わって1つ有望視されているのは、 Arena Allocation という手法です。

Protocol Buffers の C++ 版がこの手法によるメモリ管理を提供しているんですが、それを .NET にも導入できないかという調査をしているみたいです。 まだあんまりドキュメントがなく、QConSFの登壇で軽く紹介された程度ですが。

これも、「ある程度まとまった単位でごっそり処理する方が高効率」という原理に則ったものです。 以下のように、「ごっそり消す」タイミングを明示するような方式。 メモリ放棄のまとまった単位を指して arena (舞台、競技場、界)と呼んでいます。

Arena arena = new Arena();
using (arena.Activate())
{
    // この内側で new したものは「arena」内に確保される
}
// arena 内のオブジェクトは arena の Dispose 時にまとめて解放
arena.Dispose();

この方式はトランザクションのスコープがはっきりしているものに対して有効です。 Protocol Buffers が採用していることからわかるように、シリアライズ・デシリアライズが好例です。 シリアライズの途中でしか使わない一時的なバッファーを Arena 中に確保して、 シリアライズ完了時にまとめて解放すれば効率よくゴミを片付けられます。

Object Stack Allocation

クラスのインスタンスは基本的にはヒープ上に確保するものなんですが、 「メソッド内で完結している」(引数にも渡さないし、戻り値にも返さない)という状況に限って、 スタック上に領域確保しても問題なく動いたりします。

そこで、JITコンパイラーが「メソッド内で完結している」かどうかを判定して、 完結していればクラスのインスタンスであってもスタック上に確保する最適化手法(Object Stack Allocation)があります。 「メソッド内から逃げ出していないかを解析する」という意味で、Escape Analysis と呼ばれたりもします。

Java SE では Java SE 6 の頃から Escape Analysis を実装しています。 Go なんかは最初から Escape Analysis ありきで作られています。 (要するに、結構昔からある最適化手法。) それがこの度、.NET にも入りそうです。

Java と比べてずいぶん採用が遅いですが、 要は、C# は値型を持っているのでそもそも手作業でヒープを避ける手段があるからです。 挙句、「Span<T> 利用による最適化」で説明したような手動最適化がの方が断然効果的なので、そっちの方が優先されています。 (Escape Analysis は「メソッド内から逃げ出していない」という条件が思いのほか厳しいので、適用できる割合はそんなに高くない。)

「コンパイラーとかランタイムが頑張るよりも手作業の方がまだまだ高効率」という話なので、 あんまり夢はない感じ… (Span<T>も、「ガベコレで追えるものを増やす」という作業は必要だったので、 ランタイムが何もしていないわけではないんですが。)