補助資料：Ｃ言語の要点のメモ
(21/Nov/2002 版)

この文書は、Ｃ言語を学習する人が最低これくらいはおさえて欲しい、というところをざっとまとめたものです。網羅的に書かれてはいませんので、詳細については別途参考書などで補ってください。

推薦図書は以下のようなものです。

カーニハン、リッチー（石田　訳）：「プログラミング言語Ｃ　第２版 ANSI 規格準拠」、共立出版
S. Oualline （望月　監訳、谷口　訳）：「Ｃ実戦プログラミング　第３版」、オライリージャパン
ちなみにこの文書は以下の本の流れにそって書かれています。

湯田：「図解 TURBO C プログラミング入門」、オーム社

Ｃ言語ことはじめ

Ｃプログラム（の、単純なもの）は以下のようになります。

（インクルード文など） main() { 宣言文（の並び）文（の並び） }

ここで、

（あとで説明する）コメントと文字列を除き、プログラムは（いわゆる）半角アルファベット／記号／数字のみを用いて書きます。説明文で（見やすさ等の理由で）全角文字が使われてる場合があっても、実際にプログラムを組む時には全て半角文字を利用してください。
「インクルード文など」のところで#include <stdio.h> のようなヘッダ（ファイル）をインクルードします、が、当面はおまじないと思ってとりあえず書いておいてください（詳細はもう少し学習を進めてから説明します）。
＃ではじまる行（上の include 以外にも define 等があります）は、改行までで１つの（コンパイラへの）指示となり完結します。行を継続したい場合は行の最後に＼（バックスラッシュ）をつけます。ちなみに、日本語 Windows の場合、「￥」と「＼」（の各々の半角文字）は同じ働き（というか、半角の＼が存在しない）ですので、その場合は￥を使います。
このあたりの文字コードに関する話も本当はするべきなのですが、別の機会に譲ります。

逆に、＃ではじまる行以外は、改行、空白、タブ等は基本的に無視されます。つまり、続けてかかれてようと、行を分けていようと、同じ扱いです。
Ｃ言語は必ず main() で本体を記述します。これも含めて、Ｃでの実行の単位は全て関数というものなのですが、詳細はのちに説明しますので当面はこれもおまじないと思っておいてください。
{ と } とではさまれた区間をブロックと呼びます。このブロックで main 関数を定義するわけです。
Ｃ言語では、利用する変数などを（型を指定して）あらかじめ記述しておかなくてはなりません。そのためのものが宣言文です。これは複数指定できます。変数を使わない場合は無くてもかまいません。
文の並びで、実際に処理をする内容を書いていきます。Ｃ言語では文はおおまかに以下の２通りです。
- 式（代入とか関数呼出しとか）に；（セミコロン）をつけたもの。
  例えば printf("Hello!\n"); の場合、printf が関数名、() で囲まれた部分（この場合は"" で挟まれた文字列）がパラメータ（関数に渡す値）となりこれらがあわさって関数呼出し（式）となり、それに；がついて文となります。この場合は画面に
  　　Hello!
  と表示しろ、という文になります。ちなみに、\n は改行をあらわす特殊文字（シーケンス）です。
- 制御文（ if とか for とかの一連の記述、詳細は後述）
/* ではじまって */ でおわる部分はコメントといって、処理系で無視されます。ここには、備忘録など好きなことをを書きこんでおけます。途中に改行がはいってていても大丈夫です。

☆非常に簡単な（代表的な？）プログラムの例としては以下のようなものがあげられます。

データ型

「ことはじめ」でもあったように、プログラムで利用する変数はかならずその型を決めてやらないといけません。何故「型」というものが必要かというと、変数（や定数）を宣言するときにその型を（処理系に）指示してやることで、効率的な実行オブジェクト（プログラム）が作れるようするためです。
逆に考えてみると、perl や JavaScript のような型無し言語の場合、どんなデータ型が代入されるかわからないし、場合によっては（数字を文字列として取り扱う、等）型の変換なども処理系で面倒をみるかわりに、処理系の負担（メモリを余分に消費したり、ＣＰＵ資源を食いつぶしたり）が多くなりその結果実行速度は遅くなってしまっています。Ｃ言語は効率優先で設計されているので、プログラマ（人）が処理系に型を教えてやることになってます。また、これはコンパイル時に型チェックをすることでバグのチェックもできる、という効用もあります。
基本的なデータ型とは…整数 (integer), 浮動小数点数 (floating point number), テキスト（char とその配列）、ポインタです。
これらのうち、テキストは文字の配列なので整数型の扱いの延長であることに注意し、それを除いた基本型を（配列、構造体などに対して）スカラー型と呼ぶことがあります。文字列については後に説明します。
整数型は、ビットの並びを単純に２進数として表現したもの。その有効桁数をどれくらいとるかによって、short / int / long (/long long) の型を使いわけます。（浮動小数点型についても有効桁数の大小でdouble / float を使いわけます。）桁が多くなるほど必要なメモリが多くなるので、特に大きな配列を扱うときなどには注意が必要です。
これらの型の変数／定数が、それぞれが何バイトをメモリ上で占めるかは処理系依存です。それぞれの型が何バイトあるか、を調べる演算子には sizeof というのがあります。
例えば pc2617.heisei-u.ac.jp (Pentium/linux2.0.38/libc5) の場合；

を実行すると結果は「2 4 4 4 8 12 4 」となります。
short ≦ int ≦ long (int), float ≦ double ≦ long double と必ずなっています。別の見方をすると、極端な話、全て同じでも規格を満たすことになります。
最上位ビットを符号とせず正数だけを扱うときには unsigned と宣言すると、上限がほぼ倍になります。つまり

である、が、いずれにしても 2¹⁶=65536 通りの区別をしているに過ぎないことに注意してください！
浮動小数点の場合は、内部表現が整数型と根本的に異なります（！）

［以下、中級以上の人向き］
代表的な内部型式（IEEE 754) では、float は、符号 1ビット、指数 8ビット（基数２で、127 を加えた数字）、仮数 23 ビット (1+m) の合計 32ビットとなります。double の場合は指数11ビット、仮数が 52 ビットで合計64 ビットとなります。
仮数は、常に先頭が 1 になるように正規化され、その 1 を省略した残りを float の場合23 ビットに納め、従って、精度は 24ビットとなります。それぞれは２進数表現で、2^{指数部- 127}×(1+仮数部（小数））となります。例えば
```
0 10000101 01010000000000000000000
```
のビット列を考えてみると、仮数部は0101 であるから、これを２進数の小数とみて
1/2 * 0 + 1/4 * 1 + 1/8 + 0 + 1/16 * 1 = 5/16 = 0.3125
これに１を加えた 1.3125 が仮数となり、指数部は 10000101 = 133 だから 133-127=6 となり、1.3125 * 2⁶ = 84 となります。
この場合、シフトして仮数部を０にして簡単に求めることも可能です。仮数が 0.0101₍₂₎ ではなく 1.0101 であることと、左に小数点を１ビットシフトすると指数部が１減ることに注意すると、
　 1.0101₍₂₎ * 2⁶ ＝ 10101.0₍₂₎ * 2² ＝ 21 * 4 ＝ 84

となります。
定数の場合は、大抵の場合表現自体に型の要素がはいってる（例えば 1.1 とかだと小数以外にありえない）ので、あまり気にする必要は無いかもしれません。

☆例として、整数の変数 i および浮動小数点数の変数 f をまず用意して、 1000000000 および 1.2 でその変数を初期化して、それらを表示させるプログラムは以下のようになります。

演算子と式

算術演算子 (+,-,*,/,%)
…ごく普通の、いわゆる２つの数値にたいして計算（演算）をするためのものです。この「２つの」というのを「二項（演算子）」という言い方をします。
二項というぐらいなので、２つじゃないのもあります。
- 単項…+,- （符号）, *（間接演算子＝ポインタをたどる）, & （アドレス演算子＝アドレスを求める）, ~ （１の補数演算子＝ビット反転）、など。ポインタ関連の詳細は後述します。
- 三項…「?:」…これは、「a?b:c」のように使い、a が真なら b 、じゃなければ c という if...then...else のようなものです、が、これもあくまでも（文ではなく）式です。
代入演算子 (=,+=,.....)
要するに変数に値を代入するわけです。ここで注意すべきは；
- 「＋＝」のようなものは馴染みが無いかもしれませんが、要するに「a=a+2」を「a+=2」と簡単に書けるようにしたものです。これは、言葉で「Ａに２を足す」と言うの対応してるので（慣れれば）わかりやすいですし、計算機（ＣＰＵ）によってはこのほうが素直に（機械語レベルで）計算できる場合もあり、誰にとっても好都合です。
- 左辺値と右辺値の扱いの違い：同じ変数でも、代入演算子の左右で微妙に扱われかたが違います。つまり、
  - 右の場合…その変数にはいってる「値」＝箱の中身
  - 左の場合…その変数そのもの。例えていうなら箱そのもの
  です。だから、原則として定数は代入演算子の左にはありえないです。
- 「代入文」は文でなく式である：Ｃの場合、代入に限らず演算子が作用したものはあくまでも式 (expression) です。「ことはじめ」の文のところで説明したように、";" （セミコロン）をつけてはじめて文になります。
  逆に、式であることを利用して、
  a = b = c;
  のようなことが可能になるわけです。この場合、まず b=c が計算され、その結果、元の c の値がb に代入されるとともに、この（b=cという）式の値自体も c の値になります。そして、その値がa に代入される、というわけです（順序の詳細は後述）。
インクリメント、デクリメント：
これもＣ独特です。++ とか -- で、その変数を１増やしたり１減らしたりできます。つまり「i++」は「i=i+1」と（ほぼ）等価です。これも代入演算子と同様、ループの回数を数えるなどの時の「i をカウントアップする」のような言葉に対応が良いのと同時に、ＣＰＵによっては機械語レベルでサポートしてることが多いので、このような記述が有用です。
++,-- どちらとも前置と後置の場合（区別）があります。これは、式の評価（変数の値はいくつか？）と、演算（１増減させる）のどちらを先にするかの違いです。例えばi=1のとき i をインクリメントするといずれにしても i は２ですが、「j=++i」の場合、先に演算してから（iが２になってから）式の評価をするので、 j は２になります。一方、「j=i++」の場合は先に式の評価をして、すなわち j に 1 を代入してから i を１増やします。
比較演算子 (==,>,.....)
== にだけ注意すれば、あとは普通に考えれば大丈夫でしょう（？）
論理演算子 (&&,||,.....)
比較演算子などで演算した結果の論理値について、「かつ」や「または」という演算をほどこすものです。
ビット演算子 (&,|.....)
ビット単位で操作する演算子です。論理演算子は変数全体でのand/or であったことに注意しておいてください。

優先順位と評価：
たとえば a = b + c の場合、b + c を先に計算して（Ｃでは「評価する」と言います）、その結果を a に代入するわけですが、これは+ のほうが = より優先順位が高いから先に評価したわけです。Ｃ言語では（もちろん！）この評価の順位が厳密に規定されているので、混乱は（基本的に）ありません。

じゃぁ、同じ順位だったらどうするか、という疑問が出てくるでしょうが、その場合にも（大抵の場合には）問題なく評価することができます。それが結合規則というもので、「同じ順位の演算子が並んでたらどちらから先に評価するか」というものです。先の例の「a=b=c」の場合、＝は右から左に行うことが規定されてますので、先に b=c を評価して、その後でその式の値を a に代入する、という順序が保障されています。

これまで出てきていないものも含めて、Ｃ言語での演算子の評価順位（上ほど高い）と結合規則をまとめておきます。出てきてないものは適宜解説していきます。２、３項演算子の場合、その複数ある被演算数（変数など）の評価の順序は（論理演算など一部の例外を除き）処理系依存（つまり、どっちから評価されても文句は言えない→そのようなコーディングはしてはいけない）です。

たとえば
i = 2;
j = ++i * (--i);
の場合、先に ++ してそのあと -- する、とすると 3*2 で j は 6 になりますが、先に -- しちゃうと 2*1 で j は 2にしかなりません。

演算子の優先度と結合規則
演算子	結合規則
()　 [] 　-> 　. （参照絡み）	左から右
!　 ~　 ++　--　 + 　-　 *　 &　 (type) 　 sizeof （単項）	右から左
* 　/ 　% （算術演算）	左から右
+ 　- （算術演算）	左から右
<< 　>> （ビットシフト）	左から右
< 　<= 　> 　>= （比較）	左から右
== 　!= （比較）	左から右
& （ビットAND）	左から右
^ （ビットEOR）	左から右
\| （ビットOR）	左から右
&& （論理AND)	左から右
\|\| （論理OR)	左から右
?: （（三項）条件式）	右から左
= 　+= 　-= 　*= 　/= 　%= 　&=　 ^=　 \|= 　<<= 　 >>= （代入）	右から左
, （コンマ…並記できる。式の値は最後の式）	左から右

☆例として、

整数の変数 i,j,k,l を用意して、
i,j,k を１つの文で１に初期化して、
j をインクリメントして、
その結果を l に代入して、
その値を k から引いて、
i,j,k,l を画面に表示する、

プログラムは以下のようになります。ちなみに結果は「i=1,j=2,k=-1,l=2」です。

プログラミングの基本要素

プログラムとは、端的に言えば命令をある順序で並べたものですが、それを（一般論として）強いて機能的に分解すると以下のようにまとめられるでしょう。

情報の入力…標準入力関数がうけもちます。
情報の表現…定数や変数の宣言、定義など。
情報の操作・演算… 演算子と式に従って組み立てていきます。
情報の出力…標準出力関数がうけもちます。
流れの制御…if, while など。
処理のブロック化…（ライブラリ）関数を利用。
関数については詳細は後述しますが、ここでは；
- 関数とはあるまとまった仕事をするコードの塊のことで、あるデータを（引数として）入力するとなんらかの処理をして出力する（返り値をかえす）もので、
- 関数には printf など標準的に用意されているものがあり、それで不満（？）な場合は、ユーザが自分で作ることもでき、
- 作る場合はまず定義をして、それを呼び出すことで利用でき、
- その際、引数や返り値には型が指定されていてそれらは一致していないとだめ。
くらいのことを把握しておいてください。

プログラムのスタイル

ことはじめでも少しふれたように、（文字列定義部などを除いて）プログラム部分での２つ以上の空白、タブ、改行の続きは単なる（１かたまりの）空白としてとりあつかわれます。
かといってどう書いてもいいか、というと（コンパイラ側からみるとその通りですが、プログラマ＝人からすると）そうではなく、プログラムの構造が見た目ですぐわかるような書き方がバグもはいりにくく、望ましいでしょう。
その際、大切なのは「統一しておく」ということです。あるときは ")" のすぐ次に "{" を書くけど、別の時には改行してから書く、とかでは混乱がおこりやすくなり、それがひいてはバグの混入の原因になったりします。プロのプログラマになってチームを組んで書く場合には、チームのみんなで統一されることが必須です。会社によっては「コーディング規約」として文書化してある場合が多いようです。

プリプロセッサの話

#define や #include （あと #pragma なんてのもあるけど略）は、あくまでもＣのコンパイル前に処理されるものなので、形式的にはＣ言語の文法とは関係ない、ということは覚えておいたほうがいいでしょう。
#define や #include はプログラムのどこでもおけます。が、その指定した行より先（下？）でのみ、それが有効になります。
#define …いわゆるマクロ定義。引数も使えるので、関数っぽいことも書けます（詳細は後述）。あと、（システム標準でない）ユーザ定義マクロは大文字で書くことが多いです。そうでなくても動きますが、特に理由がなければ慣習には従っておいたほうがいいでしょう。
#include …ファイルの読み込み（主にヘッダ）
#include というおまじないは、printf などの標準関数がコンパイルエラーが無いように、コンパイル時に必要な情報をコンパイラに提供するためのものでした。

☆例として、

マクロで NUMBER を 1 と定義して、
整数の変数 i を用意して、
i に NUMBER を代入して、
i を画面に表示する、

プログラムは以下のようになります。ちなみに結果は「i=1」です。

☆別の例として、

マクロで SQUARE を引数 (x) つきで (x) * (x) と定義して、
この場合、かならず () をつけるようにしないとだめです。というのはたとえば
```
#define SQUARE(x) x * x
```
とすると、SQUARE(i-1) は（#define はＣ言語の文法は気にせず展開するので）「i-1*i-1」となり、これは優先順位を考えると「i-i-1」となり、i の値にかかわらず -1 になります（！）
[ 以下、中級以上向け ]
といいつつ、実はこれで安心しては駄目で、たとえば
```
SQUARE(++i)
```
のような呼び出され方をした場合、これは
```
(++i)*(++i)
```
と展開されますので、i が 2 だったとしたら、3*4 で 12 になってしまい、意図した 3^2 => 9 とは違ってしまいます（要するに処理系依存とにたようなバグを産む）…逆に言うと、関数呼び出しの場合はマクロになっている場合も頭において、「引数として渡すと同時に内容を変更する」といったことをしないように心掛けるべきでしょう。
整数の変数 i を用意して、
i に 3 を代入して、
i に SQUARE(i-1) を代入して、
i を画面に表示する、

プログラムは以下のようになります。ちなみに結果は（２の平方なので）「i=4」です。

標準入出力 (standard input/output)

コンソール入出力と言われることもありますが、それはともかく、プログラムを「元データ入力→処理→結果出力」という流れと見たときの「入力」「出力」を文字の流れとして抽象的に扱うための仕組みです。
#include のところでも述べた <stdio.h> とは、この標準入出力を扱う場合に（コンパイルに）必要な情報がはいっているヘッダです。よって、標準入出力を利用するプログラムはこのヘッダファイルをかならずインクルードしなくてはなりません。
通常は、標準入力はキーボード、標準出力はディスプレイとなっていて、「人がデータを打ち込むと、結果が画面に出てくる」という上記の流れに素直にしたがったプログラムを書くことができます。
WinNT のコマンドプロンプトや、UNIX 系OSでのシェルなどでは、この標準入出力を柔軟に扱えるようになっています。入力をキーボードから打つかわりに事前に作成されているファイルからおこなったり逆に出力を画面ではなくファイルに書き込むことが可能です（リダイレクションといいます）。また、あるプログラムの標準出力と、別のプログラムの標準入力を繋げることで、あたかも２つのプログラムが１つになってデータ処理を行うようにするのも容易です（パイプといいます）。

標準出力 (standard output)

putchar(): １文字だけ出力する。引数は文字型（１つ）。
puts():１行出力する。引数は文字列（１つ）。
「文字列」とは、厳密には、文字の配列（の先頭アドレス）か、文字へのポインタです、が、詳細は後述します。
printf():第一引数で出力のフォーマット（形式）を文字列としてまず設定して、第２引数以降、必要な数だけ変数あるいは定数を指定します。
フォーマットの指定の仕方は、文字列中に「％」とそれに続くいくつかの文字でそれぞれの情報をどのような形式で表示させるかを指示します。とりあえずは
- d …１０進数
- u …符号無し１０進数
- x …１６進数
- f …浮動小数点数
- c …文字
- s …文字列（へのポインタ）
くらいは把握しておいてください（詳細略）。これらのうち、%s 以外は全てそのデータの値そのものが出力されます（%s はそのポインタの先にある文字列）。
数値（%d,%f, etc.) に関しては、桁指定も可能です。たとえば %10.3f と書くと、全体を10桁にして、そのうち小数は3桁、という指定になります（詳細略）。
printf() を使うと、例えば putchar(c) は printf("%c",c) と、puts(s) は printf("%s\n",s) と書けます。が、一般に printf() のほうが putchar() や puts() よりも重い（複雑な）処理なので、適材適所で適宜選択すべきです。
putchar(), puts(), printf() は標準出力を扱うものですが、これをもうちょっと一般的に（？ファイル出力対応）したものに fputc(), fputs(), fprintf() というものがあります（詳細はここでは略します）。

☆例として、

整数の変数 i を用意して、
i を 97 で初期化（代入）して、
i を16進数および文字として画面に表示する、

プログラムは（出力をすこし装飾してますが）以下のようになります。これは10進数の97が何の文字のコードになってるかを示しているプログラム、といえます。

☆別の例として、

整数の変数 i を用意して、
i を 48 で初期化（代入）して、
そこから 57 以下の間 i を１つずつ増やしてそれらを文字として画面に表示する、

プログラムは（出力を多少装飾してますが）以下のようになります。for 文はここでは単に i の値を１ずつ増やして、i が58未満のの間、すなわち57までくり返す、とだけ理解しておいてください。
ちなみに 10進数の 48 （16進数の 0x30) はASCII コードの '0' です。ここの「i=48」のところは、「i='0'」と書いても全く同じことです。 ASCII では48 から 57 まで（あくまでも文字としての）数字が順にならんでいますので、それらを表示する、ということで結果（の主要部）は「0123456789」となります。

標準入力 (standard input)

基本的に、出力に対応したものたちがあります。

getchar(): １文字だけ入力。引数無しで返り値が文字、だけど型は int であることに注意が必要です。これは、エラーや文末 (end of file, EOF) の場合には整数型定数 EOF が帰ってくるためです。
gets(): １行入力する。引数は文字列（のポインタ）。入力した結果がそのポインタ（アドレス）で示された文字の配列の領域へ格納されます。
scanf():
第１引数で入力のフォーマット（形式）を文字列としてまず設定して、第２引数以降、必要な数だけ変数へのポインタを指定します。フォーマットの指定の仕方は、文字列中に「％」とそれに続くいくつかの文字でそれぞれの情報がどのような形式で入力されるかを指示します。書式は printf() とほぼ同じなのでここでは略します（詳細はテキスト参照のこと）。
ここで重要なのは、第２引数以降は変数ではなく変数へのポインタを渡さなくてはいけない、ということです。これは、左辺値と右辺値のところでも述べましたが、データを代入するためには左辺値、すなわち変数を器（あき箱）として扱わないといけないのですが、関数で引数として渡せるのは値（箱の中身）だけなので、変数のアドレス（在処）を「値」として渡すことで、変数（＝箱）に値をいれてもらえるようにするわけです。
このあたりの正確なところはポインタを学習しないと理解できないかもしれませんので、当面は scanf() のときは変数へのポインタを渡す（文字列の時以外は前に＆をつける）と覚えておいてください。
putchar(), puts(), printf() はの時と同様、入力関数にも標準出力を扱うものですが、これをもうちょっと一般的に（？ファイル出力対応）したものに fgetc(), fgets(), fscanf() があります。
結局これらはUNIX 流の「キーボードもディスプレーも抽象的にファイルととらえ、その（文字）データの流れ（＝ストリーム）をファイルからの入出力ととらえる」ということに落ち着きます。stdio により stdin とstdout をデフォルトの入出力ファイルとみなす、ということです。具体的な例だと、 scanf(...) は fscanf(stdin, ...) の省略形、とみなしたらいいですよ、というふうなことです。

さらにファイルからではなく既に文字列としてあるものから（型変換なども含めて）別の変数にいれなおす sscanf() というものがあります（詳細はここでは略します）。
［中級以上の人向き］
実は、現実の（まともな）プログラムでは、gets() や scanf() はまず使いません。というのは、これまたポインタを勉強してないので詳細は述べられないですが、scanf() などでは入力される文字数を指定できない（入力する人を信用してる）ので、本来入力できないメモリ領域まで書き込んでしまい、それがシステムを壊す可能性があるからです。
よくbuffer overflow のバグをついたクラッキング（不正な Web page 書き換えなど）が報道されたりしますが、これらの大多数は入力文字数チェックをしていない（ある意味手抜きというか、素人的）プログラムだからです。
じゃ、どうするのかというと、例えば入力領域を
char buf[1024];
と確保したとき、
fgets(buf,1024,stdin);
のようにして最大 1024-1 バイトまで読みこむ、としておいて、返り値が NULL になってたらエラーなのでそれをチェックしてから、その読みこんだデータ（文字列）に関して sscanf() する、という手順をふみます。たとえば１０進数を読みこみたい場合は以下のようになります。とはいえ、講義では簡単のため（入力者を信じて？）scanf() も使っていきます。

☆例として、

整数の変数 i を用意して、
i に１０進数の数字を読み込み、
それらを 8進数、16 進数として画面に表示する、

プログラムは以下のようになります。

プログラム内の制御構造

構造化プログラミングとは…
プログラムを組むことを考えるとき、その全体ですべき仕事を階層的にトップダウンに細分化（モジュール化）し、その時それぞれが独立性が高いように設計するのがよいとされています。(Dijkstra の提案）
プログラムの制御構造を基本パターンに分解すると以下の３つになり、入力・出力が１つずつならこれらで完結させることができます。
- 連接 (sequence) … ごく普通に文をずらずら並べる。必要に応じて {} でかこんでブロック化する。
- 選択 (selection) … if(-else), switch 文で、条件判断をするということ。
- 反復 (repetition) … while, for 文。ようするに、くり返し。

Pascal という言語はこの構造化プログラミングを強く意識して設計された言語で、Ｃもその流れを組んでいます。それ以前の FORTRAN や COBOL などにはこのような考え方はなくで、（機械語レベルの jump に対応する） GOTO 文をつかって制御の流れをかえていたのですが、これを多用すると全体の見通しが非常に悪くなり、バグの温床となることが指摘されていました。

if 文

if と else について、

if (条件) { 実行文 }
if (条件) { 実行文 } else { 実行文 }
if (条件) { 実行文 } else if (条件) { 実行文 }

とパターン化されると思いますが、これについて少し考えてみます。

else が無い場合は、 else 以下が省略されてる（要するに「そーじゃなければ、何もしない」ということ）とみなせばよいでしょう。
「{ 実行文 }」と「文」が場合分けされてること、あるいは、「{ 実行文 }」の中身が１つの時は {} が不要、という説明について、もう少しつっこんで考えてみると、１つの時は {} が略せる、というのは方便で、考え方としては元々
```
if (条件) 文
```
であり、「文」で１つ以上複数の文を書きたいときに {} でブロックを作ってあたかも１つの文のようにふるまわせる、というほうが構文的には正しい解釈で、かつ覚えることが少ないです。ちなみに{文;} と１つだけでも当然ＯＫです。
else if についても同じようなことがいえて
```
if (条件) 文 else 文
```
の後の文がたまたま別の if 文であった、という解釈が妥当です。強いて書くなら
```
if (条件1) {
  文1
} else {
  if (条件2) 文2
}
```
で、上の理屈により {} が省略されている、という考え方です。
なので、基本的にはいくつでも else if は並べて使えます。たとえば
```
if (条件1) 文1
else if (条件2) 文2
else if (条件3) 文3
else            文4
```
でも全然問題ないです。これは構文的には以下のような入れ子構造になることを確認しておいてください。
```
if (条件1) {
  文1
}
else {
  if (条件2) { 
    文2
  } 
  else {
    if (条件3) {
      文3
    }
    else {
      文4
    }
  }
}
```
但し、perl などでは elsif を見た目通り (switch のように）条件の並列とあつかいますし、C でもコンパイラによってはそのような最適化をしてる可能性はあります。

☆例として、

整数の変数 i を用意して、
i に点数（１０進数）を読み込み、
もし６０未満なら「不合格 (fail) 」、そうじゃなければ「合格 (pass) 」と画面に表示する

プログラムは以下のようになります。

くり返し（ループ）

while 文

while 文についても（ for 文についても同様） if 文と同様に「{ 実行文 }」と「文」が場合分けされてること、あるいは、「{ 実行文 }」の中身が１つの時は {} が不要、というのは、考え方としては元々
```
while (条件) 文
```
であり、「文」で１つ以上複数の文を書きたいときに {} でブロックを作ってあたかも１つの文のようにふるまわせる、というほうが構文的には正しい解釈で、かつ覚えることが少ないです。
```
while (条件) 文
```
の場合、まずはじめに式を評価して、それが真なら文を実行するので、もし式が最初に偽だった場合には文は一回も実行されないです。
最低１回はかならず実行して、その後で判定する場合は
```
文
while (条件) 文
```
でもいいのですが、これは冗長なので、
```
do 文 while (条件);
```
という構文が用意されています（が、あまり使わないかもしれません）。
ちなみに
```
while (1) 文
```
のように書くと、条件部が常に１（＝真）なので、無限ループになります（後述）。

for 文

```
for (式1;式2;式3) 文
```
で、
1. 「式１」はループの一番最初にだけ評価される式で、大抵は変数の初期化なんかをします。が、それでなくてはならないわけではないです。もしここで複数の変数の初期化をしたければ、"," （カンマ演算子… 演算子の項を参照のこと）を用いて並べて書きます。
2. 「式２」は while 文同様ループのはじめに条件として評価して、それが真なら「文」を実行します。上で述べたように、複数の処理をしたければ {} でかこってブロックにします。
3. 「式３」は「文」を実行した後で処理したいことを書くところで、大抵は（"i++" みたいに）ループのカウントの変数を更新しますが、それでなくてはならないわけではないです。
つまり、
```
for (式1;式2;式3) 文
```
は
```
式1;
while (式2) {
 文;
 式3;
}
```
と（ほぼ）同じ処理をします。
ちなみに（データを読み飛ばしたりする時なんかは）「式３」でやりたいことが全てで、「文」で処理したいことが無かったりします。そんな場合、
```
for (cp=str1;*cp;cp++);
```
のように「文」のところが空文（";"だけ）になることもありえます。
while 文では条件は省略できませんが、for 文では中のそれぞれの式は必ずしも書かなくてもよいことになっています。ということは
```
for (;;) 文
```
と書くことが出来ます。そしてこの場合は無限ループになります。
for (;;) はちょっと考えると「永久に実行される」ということで、こういう使い方はあまりないかと思いきや、利用される場面は結構あります。というのは、文（ブロック）の中で、そのブロックから抜けるbreak 文というのがあるからです。ちなみに逆に、ループの途中で、（続きはやめて）もう一度ループのはじめにもどる時のためには continue 文が用意されています。
利用例をあげると、for の中ではループから抜ける条件は１つしか書けませんが、複数の条件の時にそれぞれ状況をかえてループから抜けたいような場合は
```
for (;;) {
  共通処理; /* 入力させたりすることもあり */
  if (条件1) {
    個別処理1;
    break;
  } else if (条件2) {
    個別処理2;
    break;
  }
}
```
と書いたほうが見通しがよくなります。
［中級以上の人向き］
ちなみに、無限ループを作りたい場合、
```
for (;;) 文
```
でも
```
while (1) 文
```
（１は要するに常に真ということ）でも可能です。しかし、普通は前者の for 文のほうを用います。なぜなら、後者はループがまわるたびに1 を評価する（＝処理を行う）わけですが、前者なら無条件でループするわけで、処理が（少しだけ？）軽いからです。１回のループでの差は小さくても、ループは何回もおなじ処理が行われるわけですから、ちりも積もれば高い山になるかもしれません。

☆例として、

整数の変数 i,j,k を用意して、
j に１０進数を読み込み、
１から j までの和を k に格納して
それを出力する

プログラムは以下のようになります。

その他の制御構造

switch 文

if ～ else if ～ else ～の場合はまず最初の条件を調べ、それが偽の場合にだけ次の条件を調べて…という手順を踏むわけで、条件が背反する（いくつかある条件のどれか1つが成り立つ）場合にはあまり効率がよくありません。どういうことかと言うと、
```
if (条件1) …
else if (条件2) …
else if (条件3) …
else if (条件4) …
else if (条件5) …
else if (条件6) …
else if (条件7) …
```
のような場合、 if 文のところでも述べたように、条件7は深い入れ子の底にあり、これのみが合致する場合にでも、条件1～6をチェックして、それらが全て偽になることを確認しなければ条件7のチェックまでこれない、という構文になっています。
そこで、条件チェックが整数値（実は文字も可）の場合に限り、複数の定数の整数値の1つと一致してるかどうかを調べてそれに応じて複数の分岐を制御する、というのが switch 文です。形式は；
```
switch (条件式) {
case 定数式1 : 文1 ;
case 定数式2 : 文2 ;

   ‥

case 定数式n : 文n ;
default: 文n+1 ;
}
```
となります。条件式が下のいずれかの定数式に一致すれば、その文を実行します。この場合の文は複数かいても({} でかこまなくても）大丈夫です。
実際、実行時には switch 文にしても上から順番に条件チェックをしている可能性はありますが、賢いコンパイラならうまく最適化してすばやく分岐できるコードを生成してると期待できます。さらに、条件の排他性が保証しやすいという利点もあります。

どの定数式にも一致しない場合は default: ラベル（後述）がふられている文を実行します。ただし default: は無くてもかまわなくて、無い場合には、上の定数式に一致しない条件の時にはなにも行いません。
ちなみに、この default ラベルの綴を (defalt のように) 間違っってもコンパイルエラーにはならなくて、(switch とは関係のない）単なるラベルとして取り扱われてしまう、すなわち意味をなさないことになって、バグの原因となる場合が多いので注意してください。
注意すべきは、基本的には定数式が条件と一致した場合、それ以降の文全てが実行の対象になるということです。たとえば1つ目の定数式が条件と一致した場合、文1を実行するのはもちろんですが、その次の文2,3,... も実行されてしまいます。
そこで、（こちらのほうがほとんどだと思われますが）例えば上の場合で、定数式2以降の文は実行しない、というときには、文1（のあつまり）の最後に break; 文をいれることで、この switch 文全体（のブロック）から抜ける、ということが可能になります（例題参照）。

goto 文とラベル

プログラム中の任意の場所に、「名前」（変数名とおなじ制限あり）に ":" （コロン）をつけたものを置くことで、ラベルをつけることができます。これはどういう場合に利用するかというと、「goto どこそこ」という形式でプログラム内の任意の場所に制御をうつすことができる、というわけです。例えば；
```
if (条件1) goto cond1;
else if (条件2) goto cond2;
………
cond1: printf("条件1でした\n"); exit(1);
cond2: printf("条件2です\n"); exit(2);
```
のような使い方が可能です。

ですので、例えば while のループ

while (条件){
  実行文;
  ……
}

は

loop:
if (! 条件) goto loopend;
  実行文;
  ……
goto loop;
loopend:

で実現できます（確かめてみてください）。

しかし、構造化プログラムのところで述べたように（特殊な場合を除いて）原則的にgoto 文が無いほうがプログラムは読みやすく、その結果バグもはいりにくくなるので、自分で使う機会はあまり無いでしょう。ただ、いざというときのために他人の書いたものは読めるようにはなっておきましょう。

☆例として、

整数の変数 i を用意して、
入力を促すメッセージのあと
i に10進数を読み込み、
i が
1. 1の時には「1つですね」
2. 2の時には「2つですね」
3. 1でも2でも無いときには「たくさんですね」
と出力する

プログラムは以下のようになります。

配列 (array)

配列とは、端的にいうと、同じ（データ型の）ものがある適当な長さ並んでるもの、といえます。その場合、「◯×（の並び）」のうちの１つめ、２つめ…と数えられるわけです。
別に列にしなくても、いちいち（「新宿一丁目」「新宿二丁目」…という感じで）名前をつけたらいいじゃないか、と考える人がいるかもしれませんが、数個ならいざしらず、数万個とかになると、名前をつけるのも大変です。でも、配列を使うと「新宿［１］」「新宿［２］」…のように配列名とその順番で全て指定できるので簡便なわけです。
普通の変数（配列や、あとで出てくる構造体などに対してスカラー変数と言うことがあります）と同様、配列をプログラム中で利用したい場合はかならず宣言しておかなくてはなりません。書式は以下の通りです。記憶クラス　型　配列名［要素の個数］［要素の個数］…；ここで、
- 記憶クラスとは、static や auto などですが、省略も可なのでここでは説明は略します（後述）。
- 型とは int, float などです。
- 配列名は普通の変数名と同じ命名規則（制約）です。
- 配列名のあとの数は配列要素の総数です。 C言語では配列は０番からはじまる決まりなので、例えばの場合、配列要素は intarray[0]…intarray[7] で計８つです。
- 配列数を２つ以上並べる場合は、その並べた次元の配列になります。２次元の配列は、いわゆる表になります。３次元以上は…ここでは略します。
- Cでは配列要素数は静的に決まらないと、つまり、配列要素数は定数でないといけません。ただし、最近のコンパイラには、要素数に変数を許す、つまり動的な割り当てを許すものもあります。たとえば gcc は OK です。（ANSI C99 で追加されたのかも？…あやふやですんません。ちなみに VB.NET ではReDim で可能になってます）
配列の初期化は {} で要素を列挙することで可能です。例えば以下のようにすることで、i[0] に1、i[1] に2、i[2] に3を一度に代入（初期化）できます。また、文字配列（＝文字列）については "" でかこんだ文字列で初期化が可能ですが、この場合には配列要素数は文字数＋１（ヌル文字）であることに注意が必要です。
プログラム中で配列を利用するときは、配列名に添字を指定してスカラー変数のように扱います。例えばとすると、その結果 str[] は "HI!" になります。
配列はその（同じものが連続しているという）性質上、while や for ループで処理されることが多い（というか、ほとんど）です。
［以下、中級以上の人向き］
配列は、実際の計算機上では、（同じ型のくり返しである）ある大きさのメモリ領域を確保して、その先頭アドレスに名前をふったもの、と考えることができます。そして、添字はその先頭アドレスからの（データ型に応じた）メモリ上の距離（オフセットと呼びます）を表します。char 型だと多くの場合１バイトなので、添字＝バイト数ですが、例えば int が4 バイトだとすると、添字×４のバイト数がオフセットになります。ただし、これらの計算はＣ言語処理系（コンパイラかインタープリタ）が自動的に処理してくれるのでプログラマは気にする必要はありません。
配列の添字が０から始まるのも、ここからきています。つまり、０番目ということはオフセットが０ということで、つまり配列の一番最初の要素、ということなわけです。
ちなみに（次章のポインタでさらに明らかになりますが）a[i] というのは要するに a というアドレスからオフセットi のデータの場所、ということなので、&a[i] はその場所のアドレスです。ということは、a というアドレスにオフセットi を加えたものと同じであり、つまり、&a[i] と a+i は同じものになります。

☆例として、

整数の配列 a[10] を用意して、
a に標準入力から10個の数字を読み込み、
それを小さい順に並び変え
それを出力する

プログラム（の１例）は以下のようになります。実はバブルソートというよく知られた列び替えのアルゴリズムの実現例です。

ポインタと配列

ここがＣ言語をマスターできるかどうかの分かれ目ですので、こころして（！？）学習してください。

NetNews の記事（喩え話）も参考になるかもしれません。
生の計算機のイメージでも述べたように、コンピュータにはメモリがあって、そこに命令やデータの情報がおいてあって、読みだしたり書き込んだりして処理がすすむわけです。それで、そのメモリの何処かを指定しないと読んだり書いたりできないわけですが、メモリは大抵バイト（普通 8 bit）単位で番号（番地＝アドレス）が割りふってあり、その番地を指定することで特定のメモリ領域を指し示せるわけで、これは「千代田区千代田１番１号」のような住所とおなじ考え方です。
しかし、このような番地をプログラマがいちいち意識してアクセスするのは大変なので、大抵のプログラム言語では記号（変数名など）でメモリの番地を表すことにしています。これにより、プログラマは自由に変数名を指定してプログラムを書けるわけです。この場合変数名と実際のアドレスの対応はコンパイラやインタープリタが頑張ってくれているわけです。
とはいえ、特にハードウェア寄りのもの、例えばOS自体をプログラムするような場合にはアドレスを扱いたい場合もあります。そこで、C言語ではプログラマがアドレスを自在にあやつる仕組みが用意されていて、それがポインタと呼ばれるものです。
ポインタ変数は、その指ししめす変数の型の後に＊をつけて宣言します。では、そのポインタはどうしてとりあつかうか、というと、変数があった時、その変数のアドレス（ポインタ）を「＆」＝アドレス演算子でとることができます。実は scanf() で詳しい説明無しに利用していました。
例えば； int a=1; /* 1 */ int *p; /* 2 */ p = &a; /* 3 */ *p= 2; /* 4 */ の場合は
- 1 で普通に変数を定義してあり、１で初期化してます。この変数にはメモリ上のどこかの領域が割り当ててあります。
- 2 では p がポインタ変数、すなわち格納される変数の値がint 型の変数（メモリ領域）のアドレスでである、ということを宣言しています。この場合「＊」を変数の前につけて宣言すると、その変数名がポインタ変数であると処理系はあつかいます。
- 3 では、まず右辺 &a で変数 a のアドレスを求め、それを変数 p に格納しています。よって、例えば変数 a のアドレスが 1000 ならばp の値は 1000 になります。ただし、C では整数の 1000 とアドレス（ポインタ）の 1000 は（型が違うということで）明確に区別されます。というか、ポインタの値は即値としてあつかうことは原則として有り得ません。
- 4 では、*p によって、p のポインタの指す先、すなわち今の場合では変数 a がその意味するところとなります。この「＊」は間接演算子と呼ばれます。よって、*p に 2 を代入することはすなわち a に2 を代入することと全く同じ操作になります。
ここで注意すべきは、はあくまでもポインタが格納できる変数を用意してるだけで、そのポインタの先にあるべき、つまり実際にデータが格納できる変数があるかどうかは保障されてないことです。というよりも、なんらかの別の手段で実際にデータを格納できる変数領域を用意して、そのアドレスをポインタ変数に代入しておかない限り使いようがない、ということをよく覚えておいてください。上の例の場合は＆によってその「実際にデータを格納できる変数領域」のアドレスを取得して、利用できるようにしたわけです。
［以下、中級以上の人向き］
上の例では、ある（事前に宣言・確保された）変数にたいして、そのアドレスをとってくる演算子＆によってとってきたものをポインタ変数に代入（保存）して、データを扱っていましたが、いつもそうとはかぎりません。後に述べる構造体をあつかった複雑なデータ構造をとりあつかう場合、事前にいくつデータ領域が必要になるか分からない場合が一般的だからです。
そのために（標準的なホスト環境を仮定するＣでは）malloc() という関数が用意してあります。たとえばとすると、int 型の変数１つ分をプログラム外のどこか（大抵のun*x ではヒープといわれるシステムが管理している領域）に確保し、そのアドレス (void* 型なので、int* にキャストしないといけない）を p に代入することで、上で＆でとってきたポインタと同じ操作が出来るようになります。
malloc() で確保した領域が不要になった時は、再利用できるようにする（システムに返すような感じ、だけど、厳密には違う）ための関数 free() が用意されています。メモリをとりっぱなしで不要な時にも返さないとプログラムがどんどん大きくなってシステム資源を喰いつくしますので、特に２４時間動いているサーバー（デーモン）プログラム等では注意が必要です。
malloc/freeについては構造体のところで再度ふれる予定です。

☆例として、

整数の変数 a とポインタ変数 p を用意し
p に a のアドレスを代入し
a に 1 を代入し *p を出力し
a に 2 を代入し *p を出力する

プログラムは以下のようになります。まったく同じp （の中味のポインタ）を扱っていても、その指し示す先の値を変更することで出力が異なることを確認してください。

文字列のポインタ操作

上で述べたポインタを使うとメモリ上のある大きさの領域を、その先頭アドレスで代表的に指定できるわけです。その活用の代表的なものが、配列操作です。特に文字の配列である文字列の操作にはかかせません。
以下の例文で考えてみると； char *cp,*cp2,moji; cp = "PROGRAM"; moji = *cp; cp2 = cp;
- 1 でポインタ変数とともに普通の文字型変数を定義してあります。この変数にはメモリ上のどこかの領域に割り当ててありますが、初期化はされてません。
- 2 ではシステムのどこかの領域（大抵ヒープ）に文字列定数 "PROGRAM" 、すなわち文字列のところで述べたように'P' 'R' 'O' 'G' 'R' 'A' 'M' '\0' を（文字型の長さ8の配列として）セットします。そして、その先頭アドレスを cp にいれます。ここで、cp にはアドレスだけがはいっていて、文字列全体がはいっているわけではないことに注意が必要です。
  この場合、"PROGRAM" という文字列自体には名前がついてません。とかくと分かりにくいかもしれませんが、ようするに、"PROGRAM" は文字の並び（配列）なのに、その配列名は存在しなくって、その先頭アドレスだけがcp にいれておくことで利用できる、という仕組みです。
- 3 で *cp は cp が指し示すアドレスの中味、つまり文字列"PROGRAM" の最初も文字 'P' を指示しています。つまり、moji には文字 'P' が代入されます。ちなみに i 番目の文字は *(cp+i) で表せます。
- 4 では cp の中味、すなわち "PROGRAM" の先頭アドレスが cp2 に代入されてます。この代入により cp2 も cp と同様文字列のポインタとして利用できますが、あくまでもこれはポインタだけで、文字自体を代入してるわけではありません（！）
上の文字列を「文字の配列」として明示的にかくと、以下のようになります。 char a[] = "PROGRAM"; char *cp; cp = a;
- 1 では上の例とことなりこのプログラム内の領域に文字の配列 a をおき、その初期値として"PROGRAM" 、すなわち'P' 'R' 'O' 'G' 'R' 'A' 'M' '\0' を（文字型の長さ8の配列として）セットします。
  ちなみにここでは、a で文字列全体をあらわしている、と言えなくもないです。
  初期値の文字列を用意した場合に限り、宣言の宣言で [] と数字を省略することができ、必要な配列の要素数は処理系が自動で用意してくれます。ちなみに[] の中に数字を指定した場合；
  - 初期値の文字列の長さと同じか、初期値が短い場合は問題ない（[] 内で指定された数だけの長さの配列が用意されます。が、
  - 初期値の文字列のほうが長い場合はそのままでは溢れてしまいますので、エラーとなります。その対応は処理系によります。gcc の場合あふれ分を切ってしまうようで、最新の規格ではこのようにする、すなわち、あくまでも（文字の）配列の初期化なので、配列要素の分は初期化して、あまりは捨てる、というのが真っ当なようです。
- 2 はポインタ変数の宣言です。
- 3 では cp に a 、すなわち "PROGRAM" の先頭アドレスが代入されてます。この代入により cp も a と同様文字列（のポインタ）として利用できますが、これの場合も上の例同様、あくまでもこれはポインタだけで、文字自体を代入してるわけではありません（！）
［以下、中級以上の人向き］
上で述べたように、文字列とは本質的に文字の配列です。アクセス方法にしても、「配列 a の i 番目」は「配列の先頭アドレスからオフセット i のところの内容」です。これを C で書くと"a[i]" と "*(a+i)" が同じもの、ということです。
ということは、「『配列 a の i 番目』のアドレス」が「『配列の先頭アドレスからオフセット i のところの内容』のアドレス」であり、それはすなわち「配列の先頭アドレスからオフセット i のところ（であるアドレス）」であるわけで、C で書くと "&a[i]" と "a+i" が等しいということです。
の場合、名無しの配列がヒープ（？）に出来て、そのアドレスを cp に代入（初期化）してる、という説明を上でしました。でも、名前がなくても文字列は文字列、つまり文字の配列であることは確かです。なので、例えばのようなことが可能です（この場合は文字としての 'f' になります）。

☆例として、

文字配列 str とポインタ変数 cp と、カウンタ用の i を用意し
cp の値として "APROG" という文字列（のアドレス）をいれ、
for ループで str に cp の実体をコピーして
str を出力する

プログラムは以下のようになります。for 文の終了条件、すなわち'\0' （ヌル文字）は数値として0なので、論理として偽であることに注意してください。もちろん、*cp != '\0' とかいても問題はないです（丁寧、だけど冗長と言えます）。

このような簡潔な書き方は実際のプログラムでは非常に多いので、見馴れておくとよいでしょう。

さらに string について（補助資料）

素朴な気持ちとして

char a[4] = "abc" ;
chat b[4];

の場合、

b = a;

で文字列変数 b に "abc" という文字列が入って欲しい、というのは理解はできます。し、実際 perl など他のプログラム言語では可能です。

しかし、C ではあくまでも「文字列」は実現としては文字の配列で、その取り扱いについては文字配列の先頭アドレス（ポインタ）をもって行う、という決まりになってます。だから、前の例ではアドレス同士の演算なので、実際の文字列操作にはなってないわけです。

ちなみにC++ や Java では、String クラスという文字列用のクラスを準備して、さらに "=" （代入演算子）を overload （上書き？）することで、
String a = "abc";
String b;
b = a;
のような記述は可能となっています（詳細は略します）。

そこで、strcpy などのような標準関数が用意されるわけです。この場合は stdio.h だけではなく string.h というヘッダもインクルードする必要があることにも注意しておいてください。

文字列操作関数としては、以下のようなものがあります。

strcat …文字列をコピーする。整数での a=b という感じで、文字列 a と b があったときに、a に b を代入するのは
```
strcpy(a,b);
```
でＯＫです。この場合、文字配列 a には b 以上のメモリ領域が事前に確保してある（＝配列の長さが十分ある）必要があります。
strcat …文字列を連結する。整数での a+=b という感じで、文字列 a と b があったときに、a に b をくっつける（で、それを新しく a とする）のは
```
strcat(a,b);
```
でＯＫです。この場合、文字配列 a には b をくっつけても十分なメモリ領域が事前に確保してある（＝配列が十分長い）必要があります。
strcmp …文字列を比較する。整数での a > b とか a == b を統合した感じのもので、文字列 a と b を比べるとき、
```
strcmp(a,b);
```
とすると、a が（文字列として）b より
- 小さいとき…-1 （か、他のマイナスの数）
- 等しいとき…0
- 大きいとき…1 （か、他のプラスの数）
を返します。ただし使い方としては、大小をみることは少なくて、一致するかどうかだけをチェックするのに利用されることが多いように思われます。その場合は
```
if (! strcmp(a,b)) {/* 文字列が等しいときの処理... */}
```
のように書かれます。

ポインタの配列

複数個の文字列データを扱う場合などは、まず文字列（の先頭アドレス）のポインタ変数を複数個もつ必要があります。このような時はポインタ配列、すなわち中味がポインタである配列を用いる場合が多いです。
例えばの場合、strarray[0], strarray[1], strarray[2], strarray[3], strarray[4] という char 型へのポインタ（文字列）が用意されます。
実際には、配列要素数を略して初期化する使い方が多いです。たとえばの場合、配列要素数は４となり、それぞれの文字列へのポインタで初期化されるわけです。
上の例とを比べてみると、上の場合はまず４要素のポインタ型の配列が（プログラム内に）あり、その要素のそれぞれが（ヒープの？）文字列を指しているのに対して、この例では最初から 4x9 = 36 個の文字型の２次元配列を（プログラム内に）用意して、そこに４つの文字列をいれています。ここでは一番長い文字列に長さをそろえてるので、かなりのメモリの無駄が生じています。

上下どちらの例にしても（結局文字列はポインタ扱いなので）；
と同じ書式で出力できることに注意してください。
［以下、中級以上の人向き］
ポインタ（中級編）で述べたように、一般に長さのかわりうる（わからない）メモリを確保するには malloc を使うわけですが、例えば標準入力から文字列をどんどん入れて、それをプログラム中で保持して利用する、という時にもこのやり方を使います。上で配列の初期化で自動で長さを調節したようなことをプログラムでやるわけです。
DOS 窓や un*x のシェル上で使うコマンドには、パラメータを指定して使うものがあります（というか、そちらのほうが多いです）。例えば下の例では cd がコマンド名、/home/maechan がパラメータです。
実際には cd は built-in command の場合も多いですが…
このようなコマンドをC言語で開発する場合には、なんらかの手段でそのパラメータをプログラムに取り込まなくてはならないわけですが、そのやりかたは標準規格で決まっています。すなわち、main 関数の宣言で；のようにします。ここで argc は（プログラムが起動されたときの、コマンド名自身も含んだパラメータの）個数で、argv[] にはパラメータそのもの（文字列）が配列の形で格納されることになっています。たとえば、以下のプログラムを実行すると、自分自身の名前を含めてパラメータをそのまま出力します（いわゆる echo コマンド）。

☆例として、

文字列のポインタの２要素の配列 strs[2] を用意して、
strs[0] に "hannan-u" （の先頭アドレス）を代入し、
strs[1] に ".ac.jp" （の先頭アドレス）を代入し、
i を 0 から 2 未満までループさせ strs[i] を出力させ、
最後に改行する。

プログラムは以下のようになります。

記憶クラス

変数というのはメモリ上のどこかにとられるわけですが、その有効範囲に区別があります。関数についての詳細は後述しますが、例えば関数を呼び出した時などは、関数の中だけで存在すればよくって、関数から戻って来た時には無くなってもこまらないし、逆にメモリの有効活用という観点からは、無くなったほうが好ましいです。また、別々の関数で同じ名前の変数を使った時には（ループカウンタの i など）別々の変数として扱いたい場合が多いと思われます。これらのことをうまく考慮した方策が、記憶クラスという考え方です。基本的な考え方としては、
- 関数の外で宣言されたものは global
- 関数、に限らず、ブロック（{} に囲まれた部分）の先頭部分で auto として宣言された変数は、そのブロックの範囲内だけ有効
- ブロックは (for 文などを見てもわかるように）入れ子が可能
位を理解しておけば大丈夫でしょう。
しかし、基本的に記憶クラスについては特に指定しなくて全部 auto でも（本当にシステム寄りでないかぎり）プログラムは書けますので、自分で書く場合はあまり意識する必要はないかもしれません。
しかし、他人のプログラムを読む場合のことを考えて、最低限の理解は必要でしょう。
変数は、大きくわけると外部変数と内部変数に区分できます。有効範囲については、関数のところでまたすこしだけとりあげますので、とりあえずは関数内だけで有効な変数と、（関数の内外問わず有効な）関数外におく変数がある、ということだけ覚えておいてください。
［以下、中級以上の人向き］

記憶クラス指定子の区分は以下の通りです。
- auto （省略時のデフォルト）：スタック領域とよばれるところにとられ、有効範囲の中だけ存在します。
- static: 静的に記憶される、というのは、有効範囲が関数内だけではなく、永続的に存在する、ということです。
- extern: プログラムファイルの外部にある静的変数を指示、
- register: CPU のレジスタに割りふられる（原則 auto) 変数、
の４つなのですが、
- auto は省略可で、
- extern は、当面（初学者は）１プログラム＝１ファイルで考えると不要であり、
- register は近年ではレジスタ割り当てはプログラマより処理系が賢くなってきてまかせた方がよいコードがでるのでまず使わない
ということで、static のみ考えます。
static の場合、関数の実行がおわっても変数（と、中の値）は消滅しないので、次に同じ関数が呼び出されても変数は前に実行した時の値を保持しています。よって、これはシステムの状態などの大域的データ用に使うことが多いです。

関数

前にも述べているように、（printf など標準的に用意されているもの以外にも）ユーザが自分で作れるもので、以下を満たします；
- 関数とはあるまとまった仕事をするコードの塊のことで、あるデータを（引数として）入力するとなんらかの処理をして出力する（返り値をかえす）もので、
- 作る場合はまず定義をして、それを呼び出すことで利用でき、
- その際、引数や (ANSI の場合）返り値には型が指定されていて、それらは一致していないとだめ。
「関数定義が同じファイルでされており、その呼び出しは宣言より後ろにある」という場合を除き、関数宣言が変数宣言と同様に必要となります。これがいわゆるプロトタイプ宣言で、ANSI 以前のCには無かったものです。
典型的な関数の宣言は例えば以下のようなものです。この場合、引数は2つで、それぞれ整数型であり、返り値は int 型であることを表しているわけです。
返す値が無い場合、void という「（値が）無い」型を指定します。これは ANSI で導入されたものです。返り値が省略されている場合、Ｋ＆Ｒの流儀に従うと int になってしまうので注意が必要です。
典型的な関数の定義は例えば以下のようなものです。この場合、引数は2つで、整数型であり、返り値は int 型であることを表しているわけです。そして、ブロック ({} ではさまれた部分）内部では、まず必要に応じて変数が宣言・定義され、そのあとに処理の内容が記述されます。返り値がある場合には return 文で返したい情報（上の例の場合は2数の積の整数）を呼び出し元にかえすわけです。
関数は使ってなんぼのものですから、呼んだり呼ばれたりします。そして、それは小さい仕事を頼んで、その処理結果を貰う、ということなので、データの受渡しが必要となります。
呼び出す側と呼び出される側と間のデータの受渡しには以下の３通りがあります。
- call by value （値渡し）
- call by reference （参照渡し）
- 外部変数渡し
とはいえ、実際には「参照渡し」はアドレスを値渡しするので、機構としては２通りになります。さらにいうと、外部変数によるデータの受渡しは（どの関数でどーゆー風に値が書き変わるかが追っかけにくく、バグの温床となるので）出来るだけやらないほうが無難です。ということで、実質的に値渡しだけ理解しておけばＯＫということです。とはいっても、アドレス渡しは (scanf でも使われているように）重要ではあります（後述）。
他のプログラミング言語では値渡し、参照渡しの他、変数渡しという機構がサポートされているものもあります。その場合は実装はまた別となります。
引数は上でも述べたように、原則、値渡しです。値のコピーが関数内の引数用の変数につくられ、処理がすすみます。配列など、大きなデータ領域を渡したい場合はポインタ渡し（参照渡し）とします。
引数にしても、関数内で定義された変数にしても、基本的にはその関数内部でのみ有効です。つまり同じ名前の変数が他の関数ででも定義されていても、おたがいに別箇のものです。これらの変数を auto 変数ということがあります。
［以下、中級以上の人向き］
記憶クラス指定子で static だとそのソースファイルローカル、extern だと定義は外部ファイルである、というのは変数と同様です。
関数の引数は、通常プログラムのデータ領域ではなくスタックと呼ばれるシステム領域にとられます。これは、呼ばれる回数がわからないので、事前に領域の大きさが決められないからです。よって、無意味な関数呼び出しはシステム資源を浪費します。再帰（後述）の時にもう少しつっこんだ議論をおこないます。

☆例として、

整数の引数2つを持つ巾乗計算をおこなう関数 beki を宣言して、
int の変数 i,j を用意し 2,3 で初期化して
beki(i,j) の呼び出しにより2の3乗の値を取得しその値を出力する

プログラムは以下のようになります。ここでは巾乗、すなわちi の j 乗とは、i を j 回掛けたもの（jが0の場合は i の値にかかわらず1）であることをC言語で既述しています。

再帰関数について

Ｃ言語では、関数が自分自身を呼び出すことができ、これを「再帰呼び出し」 (recursive call) といいます。また、そのような関数を再帰関数 (recursive function) と呼びます。再帰機能を用いると、数学の漸化式のように、求めた値を使って次の値を求めるような問題や、リストや２分木のようなデータ構造自体が再帰的に定義されたものの処理をスマートにプログラムすることが可能になります。
例えば次のプログラム例を考えてみましょう。これは階乗 (factorial) を求めるプログラムで、再帰呼び出しの代表例といってよいでしょう。ただし、扱う数は正の整数と仮定しています。 #include <stdio.h> long int fact(int n) { if (n==1) return 1; else return (long)n*fact(n-1); } main() { int n=5; int i; for (i=1;i<=n;i++) printf("%d!=%ld\n",i,fact(i)); } このプログラムの main 部分は 1 から 5 までの階乗を計算してそれを出力しているだけです。よって、考えるべきは関数の部分だけです。
関数の部分は、以下のように考えられるでしょう。
```
n!　　　　　　は、n * (n-1)!　　　で求められる。
(n-1)!　　　　は、(n-1) * (n-2)!　で求められる。
(n-2)!　　　　は、(n-2) * (n-3)!　で求められる。
　　　　　　　：
　　　　　　　：
3!　　　　　　は、3 * 2!　　　で求められる。
2!　　　　　　は、2 * 1!　　　で求められる。
1!　　　　　　は、1　　　　　　です。
```
すなわち、関数 fact は受け取ったパラメータが１の時は１を返し、それ以外の時は n*(n-1)! を返すものです。
ここで、 if (n==1) の条件文が再帰からの脱出の出口をなっていることに注意してください。再帰関数はかならず脱出口を持っています。でないと無限ループにおちいってしまいます。
［以下、中級以上の人向き］
ちなみに、この（再帰に限らず）関数呼び出しについて大抵の処理系での実現はどんなものかというと、関数への引数とか内部変数はスタック領域にとって同じルーチンをぐるぐる廻り、逆に関数から戻るとスタックをポップしていく、というものです。スタック（を含むメモリ資源）は有限であることから、再帰呼び出しには限度があるわけで、脱出口（関数の終了条件）をきちんと設定しておくことは大切なわけです。
このようなスタック処理というものは結構重い処理であり、かつメモリ資源も浪費するので、できることなら避けたほうがいい、というのも事実です。再帰のうち、再帰呼び出しがその関数の終わりにだけあらわれるもの（上の階乗がその例）を tail recursion と呼び、これは単純なループに機械的に書き変えられることが知られています。賢いコンパイラの中には自動で変換して処理してくれるものもあるようです。

構造体について

構造体とは、ひとことで言うと、複数の変数をひとまとまりにしたもののことです。ある１つの対象物（オブジェクト）のさまざまなデータ（属性といってもいいかもしれません）をひとまとめにしておくことができ、どのデータをどれに代入したか、などを見通しよく記述することが可能となります。
例えば次のプログラム例を考えてみましょう。ここでは student が学生をあらわしていて、その構成要素として name （名前）と idnumber （学籍番号）がある、としています。 #include <stdio.h> struct student { /* 構造体の（型）宣言 */ char name[20]; int idnumber; }; main() { struct student a,b; /* 構造体変数の宣言 */ strcpy(a.name,"maeda"); a.idnumber=1; strcpy(b.name,"fukuyama"); b.idnumber=2; printf("%s's id=%d\n",a.name,a.idnumber); printf("%s's id=%d\n",b.name,b.idnumber); }
- 普通の変数では最初から宣言ができますが、構造体の場合には変数宣言に先だって型枠（構造体の構造自体）を宣言しなくてはいけません。でないと、どのような変数のまとまりを１つのオブジェクトとして扱うかわかりませんから。宣言の文法は以下のようになります。上の例では student というのが構造体の名前（タグと呼ぶこともあります）で、name と idnumber がそれぞれ構成要素である変数です（メンバと呼ぶことが多いです）。この宣言以降、＜struct タグ名＞が(int とか float とかと同様に）データ型として扱うことが可能となり、main の中で実際に変数の宣言をしています（変数の実体がつくられる）。
- 構造体（変数）のメンバは、＜変数名.メンバ名＞であらわされます。上の例でいうと a.name で構造体変数 a のメンバ name をしめし、普通の文字列（文字型配列）として扱えます。他も同じです。
他の変数と同様、構造体も宣言と同時に初期化が可能です。例えば上の例の構造体宣言ののち、のようにすると、c には c.name[] には "yamamoto" が、c.idnumber には 3 が初期値としてあたえられます。これは普通の配列の初期化と似ていますが、構造体のメンバの宣言の順序にしたがって型が違う値をならべなくてはいけないことに注意してください。
さらに、構造体の配列も考えることができ、さらにその初期化も同様に考えられます。文末例を参照してください。
［以下、中級以上の人向き］
構造体の場合、いくつかの情報を１つにまとめて、それをオブジェクトとして取り扱うわけです。このオブジェクトを単位とした操作というのが「クラス」という概念に発展し、C++ や Java などのいわゆる「オブジェクト指向言語」につながっています。実際、初期の C++ 処理系は、C 言語へのトランスレータで、その際クラスは構造体へ変換されていました。ちなみに「メソッド」は構造体のメンバとして関数へのポインタを持つ、というように実装されます。
上の例では構造体の宣言は main の外、下の例では main の中で宣言しています。上の場合はスコープが大域 (global) になる（つまり、どこでも有効）ですが、下の例だと main の中でしか有効でない、という有効範囲も変数の場合と同様です。
実際のプログラミング場面では、構造体を局所的 (local) に宣言することはほとんどないといってよいです。なぜなら関数の引数で渡したり返り値でもらったりするには共通の型情報が必要だからです。下の場合はあくまでも練習問題だから、と捉えておいてください。

☆例として、

メンバが、整数 bangou と文字配列 sensei[10] の２つである構造体 kumi を宣言し、
class は C++ の予約語なので使わないほうが無難です…
３クラス分ということで struct kumi の配列 classes[3] を宣言すると同時に１組は yamada 先生、２組は sato 先生、３組は suzuki 先生として初期化して、
for 文で i を 0 から 3未満の間１づつ増やして、組番号と先生の名前を出力する

プログラムは以下のようになります。

構造体とポインタ

構造体とポインタはきってもきれない間柄です。これらによって、Ｃ言語で非常に柔軟で複雑なデータ型が実現可能となっている、ということはぜひ覚えておいてください。
構造体は、所詮は異種（？）データの塊でした。そして、普通の変数と同様、＆演算子によってアドレスを取得することが可能です。
前例をすこし書き換えた以下のプログラムをみてください。
ここで注目すべきは最後から2つ目の printf で、のように "->" と書くことで、そのポインタ変数が指している構造体（オブジェクト）のメンバを参照することが可能になります。つまりとがまったく同じものである、ということです。前者のほうが書きやすいし、直感的なのでよく利用されます。
また、関数呼び出しのパラメータとしてそのアドレスを使うことも当然可能です。上の例をさらに書き換えたのが以下です。 pout を呼び出す際に引数として構造体のポインタだけをわたしています。この場合、構造体の型（枠）の宣言は、かならず main の外（グローバル）におかないといけません。そうでなければ関数 pout と main とで、構造体型の情報を共有できないからです。
［以下、中級以上の人向き］
構造体のポインタを単独で扱うだけでは実際にはありがたみは少なくって、自己参照構造体とよばれる、構造体のメンバの中に自分（と同じ型のオブジェクト）へのポインタを持つ、というデータ型が重要です（後述）。
さらに言うと、構造体は最初（静的）に（自動）変数として用意するのではなく、前にもでてきた malloc() で動的に必要に応じてメモリを確保するやりかたが常套手段です。

型についてのあれこれ

いままで曖昧なままにしていた「型」の扱いについてすこし解説を加えておきます。

型変換について
- 算術変換：異なった型の数値の演算の場合、int→long→double のように精度が上がっていく（右辺）式の演算に適用
- 代入変換：代入時に符号拡張やゼロ拡張のように、ビット長を調整
- キャスト：プログラマが明示的に型の変換を指定するもの。（型）のように書き、関数の引数や代入文において別の型のものを（むりやり？）変換することで、コンパイルエラーを防ぐ
  例えばメモリをシステムからもらってくる関数 malloc() は void* 型と決まってるので、整数や文字列や構造体の場合に応じてその型へ変換してあげないと変数の値として使えない、等。
typedef について：struct foobar みたいな場合、名前が長いし、わかりにくい、という時にのようにすることで、新たな型名として FOO を使えるようになります。
#define による書換えも似たようなことが出来ます。しかし、異なる点は、 #define は字面だけで変換しているのに対して、typedef は型の名前である、という意味を（コンパイラが）理解しながら変換する、という点です。

複雑なデータ構造（中級以上向き）

これまで習ったポインタや構造体等を活用すると、非常に柔軟なデータ型を独自に設定・利用することが出来ます。自己参照構造体によるツリーやリストなどが典型例です。
最後に、詳細な例として以下をみてみてください。これは、図で表されているような、可変長（配列とかとはちがって、最初に長さが決まっていない）リストの実現例です。

目次へ戻る

前田としゆき / maechan@hannan-u.ac.jp

補助資料：Ｃ言語の要点のメモ (21/Nov/2002 版)

Ｃ言語ことはじめ

データ型

演算子と式

プログラミングの基本要素

プログラムのスタイル

プリプロセッサの話

標準入出力 (standard input/output)

プログラム内の制御構造

while 文

for 文

switch 文

goto 文とラベル

配列 (array)

ポインタの配列

再帰関数について

構造体について

型についてのあれこれ

複雑なデータ構造（中級以上向き）

補助資料：Ｃ言語の要点のメモ
(21/Nov/2002 版)