オブジェクト指向プログラムが動く仕組み

Java 等、ほとんどのオブジェクト指向プログラミング言語は、実際に計算機上でどのような機構によって動作しているかをプログラマは知っている必要はないように設計されています。しかし、それら言語は特にメモリの使い方に特徴がありますので、内部機構を全く知らずにプログラミングしていると、メモリを浪費してマシンパワーを圧迫したり、バグが出た時に対応ができないことがあり得ます。

ということで、プログラムの動作機構について最低限のことは理解しておく必要があると思いますので、ここで簡単にみていきます。

中間コード方式としての Java実行環境

既にみたように、プログラミング言語の実行には、事前に機械語におとして一括実行するコンパイラ方式と、１ステップずつ逐次実行するインタープリタ方式がもともとあり、その両者のメリットのいいとこどり＝処理速度を保ちつつ、機械への依存を出来るだけへらすため、中間コード方式というものが考えられ、Java はこの方式をとっています。ハードウェアの進歩と多種多様なマシンが共存するインターネット環境という背景から、現在ではすっかり定着しています。

ちなみに、文法が規定されている「言語」と、その「実行環境」は、本質的には独立です。Java や VB でかかれたプログラムを純粋な機械語にコンパイルするシステム（ソフトウェア）を開発すれば、もちろん動きます。とはいえ、VB は MS が、Java はSun Microsystems (Oracle に吸収合併）が提供する環境が実質的標準 (de facto standard) 環境ですので、中間コード方式という説明をするわけです。

プロセスとスレッド

CPUが１つしかなくても複数のプログラム＝プロセスが時分割されて擬似的に同時並行的に動かすことができる、というのがマルチプロセス環境で、現在のシステムではあたりまえになっています。さらにもう少し細かくみてみると、１つのプロセスの中でもいくつかの役割分担（入出力、計算処理、…）をしていて、それらが比較的独立している場合には、プロセス内をさらに細かい単位でわけて、CPUを効率的に使うことができます。

たとえば入出力は非常に時間がかかり、さらに待ちの多いルーチンとなるため、別扱いで普段は寝ていてもらう、のようなことをするわけです。

この細かい単位が「スレッド」で Java はマルチスレッド環境をサポートしています。マルチプロセスとの違いですが、一般的にスレッドは(CPUは別々に使いますが）メモリの一部（後述）を同じプロセス内で共有できることが多いです。このため、スレッド間の情報交換は非常に簡単ですが、その反面相互依存性があるので、１つのスレッドの不具合は別のスレッドにも影響します。あるシステムをマルチスレッドにするかマルチプロセスで構成するかは、メモリ資源、入出力の負荷等いろいろな観点から考えるべきでしょう。

スタティック・ヒープ・スタック

まずオブジェクト指向かどうかはさておき、そもそも、現在（ＯＳ上で動く）プログラムの動作環境として、メモリを使い分けている、ということを知っておかなくてはいけません。それがすなわち

スタティック（静的）領域
ヒープ領域
スタック領域

です。

スタティック領域

スタティック領域とは、プログラムの開始時 (Windows だと Explorer でダブルクリックした瞬間?) に確保され、プログラムが終了するまで固定されて置かれる領域です。「スタティック（静的）」と呼ばれるくらいで、この領域に格納される情報の配置は実行中変化しない、ということで、グローバル変数と、プログラムの（機械語レベルの）実行形式が置かれています。

ヒープ領域

ヒープはプログラムの実行時に動的に確保するためにＯＳが用意しておいてくれる領域です。これは、プログラムの実行中にメモリが必要になったアプリケーションが必要なサイズを要求することで割り当てられ、逆に不要になれば元に戻す、という使い方をします。実際には整合性の制御など、複雑な機能をＯＳが行っています。C では malloc()/free() 関数（システムコール）で確保／解放をおこないますし、Java の new でオブジェクトを作るときにもここが使われます（後述）

スタック領域

スタック領域は、ローカル変数や、関数（メソッド）呼び出しの引数・戻り値 用の領域等を確保するために使われます。前述のスレッドに関連して、ヒープはスレッド間で共有されますが、スタックはスレッドごとに個別にもちます。スタックというのは積み重ねる、ということで、いわゆる「後入れ先出し」(Last In, First Out, LIFO) の構造になっています。これは、関数呼び出しが入れ子になって続く時に、とにかくいま動いている関数についての領域を一番上においておき、関数から戻るとその領域を解放して、その呼び出し元の関数について動く、というわけです。たとえば、コードが動く様子を考えると、以下のようになります、 main() { funcA(); funcB(); } funcA() { funcC(); }

以上を整理すると、以下のような表にまとめられるでしょう

	スタティック	ヒープ	スタック
使われ方	アプリケーション開始時に確保	開始時に一定領域がＯＳで確保され、必要になればアプリケーションに割り当て	後入れ先出し
格納される情報	グローバル変数、実行コード	任意	ローカル変数、引数＆戻り値用領域
確保される単位	プロセス（アプリケーション）で１つ	システム（またはプロセス）で１つ	スレッド毎に１つ

オブジェクト指向のメモリの使い方

以上が理解できたところで、ではオブジェクト指向言語の動作環境はどうなっているか、ということを Java を代表として考えます。

他の言語 (C++, .NET, ruby, ...) で微妙に異なるところはありますが、まずは当面の対象としている Java を掘り下げておくことで、他の言語を知るべき時がきたときにも理解が容易になると思います。

クラス情報は１つだけメモリにおかれる

Java が動くときにはクラスからインスタンスが作られて動くわけですが、実際にプログラムが動くときにはどうなっているかというと、インスタンスを作る前に、対応するクラスの情報がメモリにある必要があるわけです。ここでクラスの情報とは、Java だと static で宣言されているクラス変数と、メソッドのコードです。インスタンス変数はインスタンス毎に別々にもつということは、ここには関係ないわけです。

このクラス情報のメモリにおくのに、事前に（プログラム起動時に）すべてメモリにおくというやり方もあります (C++ はこの方式）が、Java では必要になった時点でメモリに逐次ロードする、というやりかたを採用しています。これは、メモリ効率を考えると同時に、ネットワーク分散されてる場合などの動的結合も可能としています。ただ、新しいクラスのロードが頻繁におこると、オーバーヘッド＝処理時間のロスがでて、処理速度は犠牲になります。

ちなみにこのクラス情報は、上の説明でいうスタティック領域におかれますが、 Java では必要なクラスが動的にロードされるのでスタティック＝「静的」ではない、ということで「メソッドエリア」と呼びます。

インスタンス生成はヒープに

ではインスタンスはどうなっているかというと、インスタンスを生成すると、そのインスタンス変数に必要な領域と、メソッドエリアへの対応付けのための情報の領域がヒープに確保されます。

構造化プログラム（以前）では、ヒープの割り当て／解放処理は重い（管理に時間がかかる）のにくわえて、使い終わったあとの解放のところでバグが出やすく、特に解放しわすれるとプログラムのメモリ使用がどんどん増えてシステムを圧迫する、いわゆるメモリリークを起こしてしまう可能性があるため、あまり積極的に使うものではありませんでしが。しかし、Java に代表される最近のオブジェクト指向プログラムではインスタンスは原則すべてヒープに配置されます。言い方をかえると、遠慮なくどんどんヒープを使っている、ということで、これは、後述の GC のおかげてプログラマが解放から開放されるので安心、というわけです。

とはいえ、メモリと同時に CPU も消費するので、大量のインスタンス生成などは厳しいかもしれないですので、もしパフォーマンスがでない場合は注意が必要です。

変数にはインスタンスのポインタが格納

では、そのインスタンスをどう操作しているか、ですが、たとえば public void execute(String fileName) { // ... File f = new File(fileName); // ... } のようにインスタンスを生成して f で受けているとき、この f にはいっているものはそのインスタンスそのものではなく、そのポインタ（＝メモリのアドレスのようなもの）であることを理解する必要があります。このようにすることで、インスタンスの大きさに関係なく同じ形式でインスタンスを利用できます。

ちなみに C++ では、インスタンスそのものを変数にいれることも可能ですが、 Java ではそれを禁止してヒープで管理することで、後述の GC でのメモリ管理の自動化も可能としているわけです。

インスタンスを示す変数の代入はポインタのコピー

上に関連して、インスタンス変数の値を別の変数に代入する、ということは、ポインタをコピーしているわけで、インスタンスの実体をコピーしているわけではない ということは注意が必要です。つまり、 public void execute(String fileName) { // ... File f1 = new File(fileName); File f2 = f1; // ... } としたときには、f1 も f2 も同じファイルを操作しようとしている、ということです。もちろんインスタンス変数も同じものを使うので、一方 (f1) で変化させた情報はもう一方 (f2) の操作に影響をあたえてしまいます。それが嫌なら； public void execute(String fileName) { // ... File f1 = new File(fileName); File f2 = new File(fileName); // ... } とインスタンスを別々に生成しないといけません。

孤立したインスタンスは GC が処理

前述したようにGC (garbage collection) はゴミ集め＝不要になったヒープ上のメモリを回収する、ということで、プログラマにとっては便利ではありますが、その分システム (Java VM) には複雑で重い処理で、完璧なものはなかなか実現できない＝メモリリークは１００％おきないとは言えないです。ここでは、考え方として、どのように GC が行われるか＝不要なメモリを見つけて処理しているかを簡単にみていきます。

GC をするのももちろんプログラムなわけですが、それは専用のものが、Java の場合 VM （実行環境）の機能として持っています。プログラムは定期的にヒープの状態を調べ空きメモリが少なくなるとGC を動かします。Java の場合、不要なメモリとは、もはや不要となったインスタンスの領域なわけです。では「不要」をどう判断するか、ですが、「孤立したインスタンス」を探す、ということになります。

Java プログラムはクラスからインスタンスが作られ、そのインスタンスに対してメソッドを動かして処理をすすめていくわけです。そのインスタンスは別のインスタンスを使うこともできるわけで、このようにして連鎖的にたくさんのインスタンスが作られ、参照情報のネットワークのようなものが作られるわけです。インスタンスは実際にはポインタが変数に代入され操作しているわけですので、上のネットワークはヒープだけではなくスタック や（スタティックに対応する）メソッドエリアにも関連していきます。

スタックはローカル変数・メソッドの引数などの領域で、その変数にインスタンスを指定することは可能であるということですから、スタックにはヒープに存在するインスタンスのポインタが格納されます。メソッドエリアにある static な変数にももちろんポインタを代入できます。スタックとメソッドエリアは、その時点でのプログラムの処理で使われる可能性があるので、ここから 間接的にでも参照されているインスタンスは「不要ではない」＝ GC の対象にはならない、というわけです。逆に、これらから辿れないものが GC の対象になるわけです。

プログラムの動作に応じてスタックは生成したり消滅したりしているので、過去のある時点でメソッドを動かして、スタックにのっかっている変数にインスタンスを生成させてうけて処理をしていたとします。しかし、そのメソッドが終了するとそのスタック領域は解放されるわけで、その時点でインスタンスを指し示すものがなくなってしまう、というようなことが頻繁に起こっています。

図示すると、以下のようになります。

この図で矢印は「参照している」を意味しています。ここでは、A はもちろん生きている、すなわち、これからもプログラムで利用される可能性がある、ということです。B も、生きている A から参照されているので生きています。D は何からも参照されていないので、今後使われる可能性はない、すなわち不要となっています。C は分かりにくいかもしれませんが、不要な D から参照されていても利用される可能性はありませんし、生きている B を参照はしていますが、B から参照されているけではないので、やはり利用される可能性はありません。すなわち、A,B は必要ですが C,D は不要＝ GC の対象となり、回収されてその分のメモリ領域が再利用される、というわけです。

プログラマーの立場からすると、スタックやメソッドエリアから参照するインスタンスは気をつけて、不要なものは極力参照しない、ということなのですが、実際にはなかなか気付きにくいものなので、大量にリンクされているとかでない限りはシステムにお任せでもいいでしょう。ただ、メモリ不足でプログラムが落ちたりすることがあれば、この点に注意してバグをさがすのを最初にするといいかもしれません。

あと、多態性は違うクラスが同じ表現になったり、継承される情報の種類によってメモリ配置は異なったりするのですが、詳細は略します。興味のある人は自分で調べてみてください。

講義用スタイル
印刷用スタイル