関数型言語入門

最近になって、関数型言語が注目されつつあります。Microsoft も Visual Studio 2010 で F# という関数型言語を採用していますし、他に Haskel, Scala, Scheme などが人気があるようです。実は大昔から LISP という大御所的な関数型言語もあります（が、純粋な関数型ではないという見方もあります）。それが、なぜ今になって？ということですが、１つには計算機能力の圧倒的向上等により、実行速度が実用的になってきたというのは大きいと思います。逆にいうと、昔は処理系が重くて学習には使えても実用システムを組むのにはちょっと…ということでした。

しかし、他にも関数型の特徴で注目されているところはいろいろあるようです。ともかく、手続き型の延長としてのオブジェクト指向プログラミングとは全く違った世界があるということを知っておくのも大切だと思いますので、ここで簡単に説明しておきます。

関数型言語とは何か？

関数型言語とは、ラムダ計算というプログラム意味論の概念をプログラミング言語として具現化したものです。

ラムダ計算とはのような記述で、束縛変数を明示して式を記述し、その変形でプログラムの意味を自動的（機械的）に計算する、ということなのですが、数学的にもかなり高度ですので、ここでは詳細は略します。

すべての計算は関数の評価によって行われます。関数型言語は、広い意味ではファーストクラスの関数オブジェクトを持つ言語であり、関数型言語の多くは、 カリー化、遅延評価などの機能を備えています。

ここでいうファーストクラスオブジェクトは、オブジェクト指向でのオブジェクトとは違って、簡単にいうと、プログラム内で変数に代入したり値を取り出したり、関数の引数、戻り値に利用できたり、実行時に生成したり組み合わせたり表示したりできる、という意味です。

…といっても分かりにくいので、イメージでいうと；

Java 等のオブジェクト指向言語の一部を含めた）手続き型をベースとした言語は、プログラムの手順を記述します。つまり、フォン・ノイマン型のコンピュータがメモリにある命令を順番に実行していくのが透けてみえる（？けど、もっと人間に優しい）記述によりコンピュータを動作させるものと言えるでしょう。いわば How の記述です。
一方、関数型言語は、原則として関数の宣言、つまりコンピュータの動作原理とかはさておいて、問題解決のために必要な情報の記述のみを行ない、具体的な処理手順は処理系におまかせ、といったものです。いわば What の記述 です。
ちなみにこのような What の記述によるプログラミングには、他に論理型というのもありますが、詳細は略します。
関数型言語の基本的な思想では、変数は値を変えることがありません。関数型言語では、原則として関数を呼び出した戻り値を組み合わせてすべてを完結する、ということです。たとえば、再帰の代表である階乗の計算は elisp で書くととなり、引数の n 以外の変数は必要としません。
実は Java でも同じようにと書けるのですが、このような場合は再帰を使わずのように書くほうが効率的とされます。ですが、これは思いっきり状態機械としてのコンピュータの動作を意識しているわけで、関数型はそうじゃなくあくまでも関数式の記述だけに専念して具体的動作は意識しない、というわけです。

関数型言語が注目される理由

処理速度の向上以外に、なぜ今になって注目されてきているか、ということですが、１つは Intel core シリーズに代表される CPU のマルチコア化が進んできているのをうけて、並行処理を前提とするアプリケーションのための枠組み が必要とされてきているから、と言えるかもしれません。どういうことかというと、機械語（アセンブリ言語）レベルで TIA 1 AIA 2 のように上位メモリから順番に命令を読み込み実行（この場合はＡレジスタを操作）するように、手続き型では、 int a = 1; i += 2; // i+=2 は i の値を2増やす、の意と記述するわけで、ここには 処理の順序 が本質的に入っています。ですが、関数型は前述のように CPU の実行モデルとは全く違う記述をします。特に原則として変数等のメモリアクセスにたいする記述をしないのがポイントです（後述）。

手続き記述の問題点

言い方をかえると、オブジェクト指向を含む手続き型プログラムは、常に今の プログラムの状態をメモリ上の数値として管理しています。例えば int sum = 0; for (int i = 0; i < 10; i++) { // i++ は i の値を１増やす、の意 sum += data[i]; } のような Java のコードの場合、繰り返し（順序）の管理と同時に取り出す情報の位置管理の２つの意味で i という変数をつかっています。このようなプログラムでの「変数」による状態の管理、つなわち処理が順番に進むのにともなって値が変化していくので、どこまで計算がすすんだか、という状況依存の情報が変数には入っている、ということは並行処理をする上で問題がある場合がある、ということです。もう少しくだいて言うと、上のループを展開して記述すると int sum = 0; int i = 0; sum += data[i]; i++; sum += data[i]; i++; sum += data[i]; i++; sum += data[i]; i++; sum += data[i]; i++; sum += data[i]; i++; sum += data[i]; i++; sum += data[i]; i++; sum += data[i]; i++; sum += data[i]; i++; となるわけですが、i の値は上から処理がすすむにつれて順番に増えていっている、ということは、おなじ「i++;」という記述でも実際の値はどの行まで処理がすすんでいるかによって全く異なる、ということで、あたりまえといえばあたりまえなのですが、このような順序に依存してる記述は並列処理をするときには応用しにくい（順番に処理してはじめて意味のある処理は、同時並列には処理できない）ということなのです。

ちなみにこの場合は、パイプラインによる平行処理は出来るかもしれません（詳細は略）。あと、ちなみに最近の Java だとのように書けるので（順序を管理していない）多少ましといえるかもしれません。

では、状態をプログラムで管理する問題はというとですが、以下のようなことが考えられます。

まず、上でも少しふれたように、複数のプロセス（あるいはスレッド）でこの状態変数を参照したり書き換えたりする場合の排他制御が難しいということです。
なので、難しい場合はなくせばよい、というのがある意味達観で、歴史的に GOTO をなくしてスパゲティコードをなくそうとしたり、グローバル変数をなくしてバグの混入の機会をへらす、というのと同じかもしれません。つまり、プログラムで状態の管理を出来なくしてしまうことを試みるわけです。
関連して、排他制御をへたにするとスケーラビリティを阻害する (CPU のクロックをあげたりコアを増やせばその分プログラムは早くなってくれなくなる）というとです。
さらに、１つめに関連するかもしれませんが、ソフトウェアの規模や処理の複雑さが今のプログラミング環境で管理できる範囲を越えそう（なので新しいパラダイムが求められている）、というムードがあるのかもしれません。

引数としての関数

上で関数を引数とできる、という説明をしましたが、それで何が便利になるかといえば、汎用のテンプレートを用意しておいてそれを便利につかうことができるようになるからです。Java でも java.Util.Array の sort メソッドなどで無理やり（？）やっているように、並び替えの対象（データ列）と、大小関係を判断する関数を引き数として渡して並び替え処理を実行させることができるわけです。

カリー化

上に関連して、関数型言語では関数を簡単に利用するための仕組みをもっています。その代表的なものがカリー化です。カリー化とは、n 引数の関数を、1 引数の関数の戻り値として 1 引数の関数を返すことを n 回くりかえすことで作成することです。…といっても分かりにくいと思いますが、これはラムダ計算と密接につながった複雑な機構です（詳細は少しだけ後述します）。ともかく、他の手続き型言語、たとえばCで関数ポインタを使って関数自体を処理の対象にするのは、それなりのプログラム経験をもった技術者には便利な機能だったとしても、初心者には非常に理解し辛いものなのですが、関数のカリー化は関数ポインタに比べると概念さえ理解してしまえば非常に便利なものだと思います。

LISP

ここでは、関数型の代表例としての LISP を外観してもらうことで、関数型言語に少しだけ慣れてもらおうと思います。逆に、LISPを語る上で、必ず、LISP は関数型言語であるという説明が出てきます。では、関数型言語とはどのようなものかということで、上でも難しい説明がありましたが、Javaなどの関数型以外の言語と比較するとわかりやすいと思います。Javaなどの言語では、処理を行う関数（Javaではメソッドですが、便宜上、ここではメソッドも関数と表記します）を定義し、その中で必要な変数を定義し、変数に結果を入れ出ししながら必要な結果を求めていくかと思います。これは、関数は変数の状態を変えていく手続きと考えることができます。

それに対して、関数型言語の基本的な思想では前述のとおり変数は値を変えることがありません。関数型言語では、関数を呼び出した戻り値を組み合わせてすべてを完結していきます。

ただ、実際に変数の値を変えられないのは不便なため、Common Lispなどの多くのLISP系言語では、変数の値を変更する機能は持っています。ですが、プログラミングする際の基本的な思想は変わらないです。

Javaなどの言語になれている人からすると変数の値は変えないと言うことはピンとこないかもしれませんが、関数型言語とは副作用的に生じる変化ではなく、関数の戻り値を使って動作するプログラミングを書いていく手法・考え方だ、と当面は理解しておいてください。ちなみにLISPは、現在存在する、いるいろな関数型言語のなかで最初のものですので、最初に学ぶ価値はあると思います。

LISPクロージャ

ここまでで、LISPの概観を説明してきましたが、ここからはLISPの中身について見ていきます。LISPの言語特徴には、「LISPは式と文を区別しない」や 「LISPのプログラムはすべてリストで出来ている」などいったものがありますが、それらの意味や特徴を説明するのは大変ですので、ここでは他の言語と比べて典型的に関数型の特徴であるといえるLISPの「クロージャ」 の例を示して、LISPの長所を知ってもらえればと思います。

クロージャとは、関数自体を数値データなどと全く同様に式の戻り値として扱える機能のことです。言葉ではわかりづらいですが、次から説明する例を見てもらうと理解していただけると思います。

まず、クロージャを使わない簡単な例で「引数に1を足した値を返す」関数を、 LISPと比較のためにJavaで書いてみます（構文の説明については、省略します。簡単な例なので、イメージだけをとらえてください）。

Java
LISP

この例の場合にはどちらにしても大して違いはないかもしれません。では、次に「引数に1を足す関数を返す」関数を考えてみましょう。先ほどの例と違うところは、今度は、値を返すのではなく、関数を返すところです。どうですか？Javaの場合は、そのまま関数を返すことはできないので、関数のクラスをつくってあげないと実現できません。

Java

本来やりたいことは簡単なことなのですが、その割には記述がくどい、と言えるかもしれません。では、LISPではどうかというと、LISPでは関数を数値などのデータと同列に扱えるクロージャの機能があるため、関数を返す関数を以下のように簡単に作れます。

LISP

圧倒的にこちらのほうが簡単に記述できています。もちろん、このようなことはCでは関数ポインタをつかってもできます。しかし、LISPのクロージャがこれらと違うのは、CやJavaでは、あらかじめ静的に定義された関数やクラスの実体 しか返さないのに対して、LISPではプログラムの中で動的に関数を作って返す ことができるということです。LISPはこのクロージャの機能があるため、プログラムを非常に柔軟に作れるようになっています。

別の例として、３倍する関数は LISP の場合、名前をつけるのは必須ではないので

(lambda (n) (* 3 n)) で無名関数が定義でき、この関数に対して複数のパラメータを一気に（ループをまわさずに！）適応させたい場合 (mapcar (lambda (n) (* 3 n)) '(3 4 5 6 7)) ; elisp の場合のようにすることで、 (9 12 15 18 21) というリストが一度に得られます。
http://www.sksk.info/lazy-lisp.html で動かすには (map (* 3) (list 3 4 5 6 7)) とすればいいようです。

ちなみにこれはカリー化の例にもなっています。どういうことかというと、「*」（掛け算）は本来引数は２つなのですが、「(* 3)」とすることで、2引数のうちの１つを3に固定して、１引数の（この場合は「３倍する」という）関数になって、その引数として 3,4,5,6,7 のそれぞれを map （作用させる）ということをしているわけです。

いずれにせよ、ここでは５つの要素に対してその処理の順序はまったく問わない、ということが本質ですので、この処理系がマルチ CPU （スレッド）に対応していれば、並行処理がそのまま素直に記述できていることになる わけです。

まとめ

ここまでで、関数型言語の例ということで、ほんの少しですがLISPについて述べてきましたが、雰囲気だけでもつかんてもらえればと思います。LISPは古くからありますが、古いからと言って使えない言語ではありません。むしろ、 LISPに代表される関数型言語の思想（パラダイム）やプログラミング手法などは、現在の言語を理解し活用する上でも参考になる部分は多いと思います。実際、クロージャは Python, JavaScript などではよく使われていますし、その意味では関数型とのハイブリッド言語、と言えるかもしれません。機会があれば、関数型言語について各自で掘り下げてみてください。

講義用スタイル
印刷用スタイル