Algorithm intro. using nipamo

プログラミング言語「にぱも」 (nipamo) を使ったアルゴリズム入門

はじめに

この文章は、プログラミング言語「にぱも」を学んだプログラミング初心者のための、アルゴリズムの入門、というより導入のための文書です。言いたいことはただひとつ、 「アルゴリズムを考えるということが大事である」 です。これまでに先人がいろいろなアルゴリズムを考えていて、我々はそれを簡単に利用することが出来るわけですが、そのためにはアルゴリズムというものに対する知識が必要です。この文書はそのさわりの部分だけですが紹介して、今後の読者の学習の方向性だけでも示せればと思います。

そもそもアルゴリズムとは？

"Algorithm" とは、辞書的には「算法」などと訳されることもありますが、計算・問題解決のための、特にコンピュータプログラムにおける 手順 のことです。プログラムが書けて、それが動いて、正しい結果さえ得られればよいわけではなく、いかにより良いアルゴリズムで書かれるかが大事です。この「より良い」がポイントです。処理時間の観点が重要視されますが、他にもプログラムの記述の簡単さ＝バグの入りにくさも大切です。

手順が大事、の例

例えば「１から１００００までの数の合計を求めなさい」という問題をとくプログラムを作成することを考えてみます。

なにも考えないプログラム

一番単純な書き方は、

アを１とする
アに２を足す
アに３を足す
#
# ... ひたすら続ける
#
アに１００００を足す
アを出力する

です。が、これだとプログラムが１０００１行も必要です。コーディングが大変だし、書き損なう可能性もあります。

繰り返しをつかう

同じようなことを繰り返すのだから、我々は繰り返し構文を知っているわけで、それを使えばコーディングがすごく簡単になります。つまり、以下になります。

アを０とする
１００００までのそれぞれについて繰り返す
　アにそれを足す
アを出力する

もっと簡単に計算できる？

実はもっと簡単に計算できます。1から10000までの数を２つ用意して、逆に並べたものと足してみましょう。つまり；

     1+    2+    3+...+ 9998+ 9999+10000
+10000+ 9999+ 9998+...+    3+    2+    1
----------------------------------------
 10001+10001+10001+...+10001+10001+10001

となり、10001 が 10000 個あることになります。これが、1から10000 までの数の２倍だったわけなので、求める数は

10001x10000/2 = 50005000

となります。これは100まででも100000 でも一緒で、要するに最後の数と、最後の数に１を足したものを掛けて２で割ればよいので、プログラムとしては以下になります。

アを１００００とする
イをアとする
イに１を加える
アにイを掛ける
アを２で割る
アを出力する

ちなみにこれはガウスが小学生のときに求めたという逸話で有名（実際は微妙に違うという説もあり）です。等差数列の和の公式でもあります。

繰り返しの場合、１万までの和を求めるには１万回の足し算が必要ですが、上の場合、いくつまでの和でも５回の計算ですむので計算の量としてはすごく効率がよいわけです。このような、 効率のよい手順 （を考えること）が、すなわちアルゴリズムなわけです。

よくある例：ソート (sort)

数学の公式はさておき、コンピュータでよく出てくるような処理は、先人たちの知恵＝アルゴリズムが蓄積されています。その中でもソート（並び替え）やサーチ（探索）はかなり研究がなされています。ここではソートの代表的なアルゴリズムについて紹介します。

バブルソート

以下のプログラムをみてください。

ハイレツを【５、６、９、２、７、３、８、１、４】とする
ナガサを　ハイレツの長さとする　＃空白を挟む（！）
０以上ナガサ未満のそれぞれをアとして繰り返す
　イを１とする
　イにアを足す
　イ以上ナガサ未満のそれぞれをウとして繰り返す
　　もしハイレツのア番目がハイレツのウ番目以下ならば
　　　ハイレツのア番目とハイレツのウ番目を交換する
０以上ナガサ未満のそれぞれをアとして繰り返す
　ハイレツのア番目を出力する

このプログラムは２重のループ＝繰り返しになっていることが分かると思います。「ア」は外側の、「ウ」は内側のループのカウンタ＝今、配列のどの要素を操作しているかを覚えておく変数です。「イ」は、アの１つ次を示しています。

一番最初の時には、「ア」は０番目、「イ」は１番目、「ウ」も１番目です。そして、「ウ」は繰り返すたびにカウントアップ＝１づつ増えていって、ハイレツのア番目とハイレツのウ番目を比べて、ア番目が小さければア番目とウ番目を入れ替えています。つまり、配列の最初は

【５、６、９、２、７、３、８、１、４】

ですが、この５と、そのあとの数字を比べて小さければ大きいものと交換するので、１回目には

【６、５、９、２、７、３、８、１、４】

となり、次には

【９、５、６、２、７、３、８、１、４】

となり、あとの 2,7,3,8,1,4 は９より小さいので交換しません。つまり、最初のループで、この配列の中で一番大きな数字を一番左（０番目）に置きました。結果として配列は

【９、５、６、２、７、３、８、１、４】

となっています。

ここで、「ア」を１つ増やします。すなわち、配列の一番左は配列全体の中で一番大きなものであることが決まっているので、その次に大きいものを探しにいく、ということです。そうすると、次のループが終わったときには、

【９、８、５、２、６、３、７、１、４】

となり、これを繰り返すわけですので

【９、８、７、２、５、３、６、１、４】
【９、８、７、６、２、３、５、１、４】
【９、８、７、６、５、２、３、１、４】
【９、８、７、６、５、４、２、１、３】
【９、８、７、６、５、４、３、１、２】
【９、８、７、６、５、４、３、２、１】

と交換がすすんで最後まで行って終了、となります。

このバブルソートの場合、９つの要素に対して比較（と、必要に応じて）並び替えをするので、8+7+6+5+4+3+2+1 = 9*8/2 回の処理が必要となります。要素が少ないときは問題にはなりませんが、要素が多いと、その ２乗程度 の計算量が必要となり、かなり効率が悪いです。

この「２乗程度」のような計算量の次数のことを 「オーダー」 と呼び、 O(n²) のように記述することがあります。

クイックソート

クイックソートは、平均的に素早く (quick) 並び替えを行なうように考えられたもののうちの代表的なアルゴリズムです。以下にコードを示します。

関数クイックを引数ハで定義する
　ナガサを ハの長さとする　＃空白を挟む（！）
　もしナガサが１以下ならば
　　ハを返す
　ではなくナガサが２と同じならば
　　もしハの０番目がハの１番目以下ならば
　　　ハの０番目とハの１番目を交換する
　　ハを返す
　ではなければ
　　ナガサを２で割る
　　ナガサを整数にする
　　ナカをハのナガサ番目とする
　　ダイを空配列とする
　　ショウを空配列とする
　　ハのそれぞれをアとして繰り返す
　　　もしアがナカより大きいならば
　　　　ダイにアを付け足す
　　　ではなくアがナカと違うならば
　　　　ショウにアを付け足す
　　カエリを関数クイックを引数ダイで呼び出したものとする
　　カエリにナカを付け足す
　　カエリに関数クイックを引数ショウで呼び出したものを合わせる
　　カエリを返す
#
ハイレツを【５、６、９、２、７、３、８、１、４】とする
カエリチを関数クイックを引数ハイレツで呼び出したものとする
カエリチを出力する

クイックソートは、名前の通り早くソートすることが可能なソートアルゴリズムです。特に要素が多い時に効果を発揮します。クイックソートは、再帰関数の形で定義されます。再帰関数とは、自分の定義の中に自分が入っていて呼び出される（これが再帰呼び出し）関数のことです。

まず、データは

【５、６、９、２、７、３、８、１、４】

要素数は9でランダムに並んでいます。これをクイックソートを使用して降順にソートします。まず、この9個の要素の中からひとつの要素を選びます。ここでは、要素数の中間の値であるものを選びます。コードにすると、

　　ナガサを２で割る
　　ナガサを整数にする
　　ナカをハのナガサ番目とする

つまり、配列の長さの半分ですから、最初は４、だけど０から始まってるので５番目の要素が中間値となります。つまり、７です。そして、この７を基準値にしてデータ数列をソートしていきます。ちなみにこの基準値、つまり軸となるものをピボットと呼びます。

【５、６、９、２、７、３、８、１、４】

次に、このピボットより大きいものと小さいものに分類します。その受け皿用の変数として「ダイ」と「ショウ」を用意します。そして、データ数列の先頭からピボットと比較して、大きいものは「ダイ」に、小さいものは「ショウ」に付け足していきます。最初のチェックでは、以下のようになります。

ダイ=【９、８】
ショウ=【５、６、２、３、１、４】

そして、以下のようにそれぞれに対して「クイック」を適用します；

　　カエリを関数クイックを引数ダイで呼び出したものとする
　　カエリにナカを付け足す
　　カエリに関数クイックを引数ショウで呼び出したものを合わせる

「ダイ」については、

【９、８】

の２つだけですから

　ではなくナガサが２と同じならば
　　もしハの０番目がハの１番目以下ならば
　　　ハの０番目とハの１番目を交換する
　　ハを返す

を適用して、ここでのソートは終了です。その結果、データは変らず「カエリ」（深さ１）は以下です。

【９、８】

そしてこれに後で「ナカ」を付け足して、さらにこれに「ショウ」をソートした結果を付け足すわけです。すなわち；

【５、６、２、３、１、４】

についてクイック（深さ２）を適用すると、ピボットが３になり、分類すると

ダイ=【５、６、４】
ショウ=【２、１】

になります。この「ダイ」に再度クイック（深さ３）を適用すると、

ダイ=【】
ショウ=【５、４】

となりますので、クイック（深さ３）のカエリは

【】＋６＋【５、４】=【６、５、４】

になります。よって、クイック（深さ２）のカエリは

【６、５、４】＋３＋【２、１】=【６、５、４、３、２、１】

となります。さらに、これをカエリ（深さ１）に付け足すので、最終結果は以下になります；

【９、８】＋７＋【６、５、４、３、２、１】=【９、８、７、６、５、４、３、２、１】

以上のようにソートしていけば、降順にソートされることがわかります。今回は、ピボットを真ん中の値としましたが、ソートに関して、効率のよい値をピボットにするのが細かい工夫になります。

クイックソートの場合、平均的に O(n・log(n)) の計算量であることが知られています。バブルソートの O(n²) と比べると、 n が大きい場合はクイックソートのほうが圧倒的に有利です。例えば、n=10000 の場合、
n²=100000000 (10⁸)
ですが、
n・log(n) = 10000・log₂10000 ≒ 1.3・10⁵
くらいなので、800倍近くの速度差になります。

他には…

「にぱも」のキラーアプリ（？）として、「エラトステネスの篩（ふるい）」というものがあります。これは、素数を見付ける代表的なアルゴリズムです。ソースコードは以下です。

＃　エラトステネスのふるい
＃
サイダイを百とする
リミットをサイダイの平方根とする
０以上サイダイ未満をハイレツに入れる
ハイレツの１番目を０とする
ハイレツのそれぞれをアとして繰り返す
    もしアが０と同じならば
        続ける
    ではなくアがリミット以上ならば
        抜ける
    そうじゃなければ
　　　　イにアを入れる
　　　　イに２を掛ける
　　　　イからアおきにサイダイ未満のそれぞれをウとして繰り返す
            ハイレツのウ番目を０とする
ハイレツのそれぞれをアとして繰り返す
    もしアが０と違うならば
　　　　アを改行出力する

いま、国から研究費を貰っているのですが、自分としては↑が動いているというのが決め手になったんじゃないかと思っています。

これは、素数ではないデータを篩にかけて落していって、残ったものが素数である、という処理をしています。じっくり読んでみてください。

おわりに

とりあえず現状の「にぱも」でアルゴリズムということを簡単に説明しました。これ以外の複雑なプログラムについては、ぜひ専門書を勉強してください。世界がずっと広がると思います。

文責：前田としゆき <<< ...modified on 2021.07.29

講義用スタイル
印刷用スタイル
（開いてから、ページを再度更新してください）