R Introduction

表計算ソフトやワープロソフトなどのファイルは、テキストファイルではありません。表計算ソフトやワープロソフト (Excel, Word など）が作るファイルは、表示する文字のデータだけでなく、それをどのように表示するかというフォントやレイアウトの情報、貼り込まれた画像の情報なども含みますし、文字自体もそのソフト特有の形式で記録されていたりします。テキストファイルは、そうした情報をいっさい含まないファイルです。

各列がそれぞれひとつのデータ項目に対応し、各行はひとつのサンプルのデータという形式のテキストファイルだと、 read.table 関数を呼び出すことで読み込めます。データの区切りは 空白かタブ なら特別な指定は不要です。またカンマが区切りのファイル (CSV, comma separated values) ならread.tableではなく read.csv という関数を使えば同じことができます。以下で述べるように Excel での前処理を考えると read.csv のほうが利用機会は多いかもしれません。

なお、read.table,read.csv 関数で読み込むには、各列のデータ数は同じでないといけません。このデータ構造は、列が測定項目、行がひとつのサンプルに相当するというような構造を想定しています。

また、Excel で作成したシートの必要な部分だけを選択・コピーし、あらかじめ開いておいた空のテキストファイルに貼り付けると、列間がタブで区切られたテキストファイルを作ることができます。ただし、Excel でひとつのファイル中にたくさんのシートをまとめて管理している場合、これらをテキストファイルに保存するには、シート毎に手作業するか、VBA で工夫するかしないといけません。

場合によっては、不揃いなデータがあった場合や、２次元の表になっていないなど、そのままの形では解析に適さないような場合もあります。 R のなかに一行ずつ読み込んでから整えるという手もありますが、テキスト処理が得意な Excel VBA, perl 等のプログラミング言語を使えるならば、それで前処理してしまったほうが簡単かもしれません。

＜練習＞

仮想の成績データ（ここにリンクはってます）を R に読み込ませて表示させてみましょう。具体的には、リンクされている成績データを I:￥rdata に保存してから、Rの中で
```
Seiseki <- read.csv("seiseki.csv")
Seiseki
```
とすれば良いです。ディレクトリの変更を忘れずに先にしておいてください。
あるいは前述の通り
```
Seiseki <- read.csv("I:/rdata/seiseki.csv")
```
と フルパス (full-path, ドライブ名、フォルダ名を全部順番に書いてファイルを指定するやり方。絶対パスとも言う) で読ませると、ディレクトリの変更をさぼれます。これまた前述のとおり Windows ではフォルダの階層は \ (Yen, backslash) なのですが、 Rの中では / (slash) で表現できます。
ちなみにこのデータファイルは文字コードを Shift-JIS にしていますので、 Linux, Mac 等で開くと化けるかもしれません。前の "\" の混乱同様、文字コードの詳細は略します。

プログラムの流れをコントロールする【制御構造】

繰返し [for]

＜練習＞

1から20までを表示させてみましょう。

＜練習＞

上のソースコードを実行し、結果を確認してみましょう。

繰返し [while,repeat]

条件判断

＜練習＞

上のソースコードを実行し、結果を確認してみましょう。

＜練習＞

上のソースコードを実行し、結果を確認してみましょう。

if文は簡単な処理ですが、ベクトルや行列に対して関数を実行可能なRの性質を活用すると、CやJavaでは見慣れない効率的なコードを作成できると思います。

データの可視化

＜練習＞

上のソースコードを実行し、結果を確認してみましょう。

このように、R ではデータのグラフ化は非常に簡単です。データの解釈には視覚化（グラフ化）は非常に大切なプロセスなので、ぜひ覚えておきましょう。

Ｒ入門(3)

データファイルからの読み込み

プログラムの流れをコントロールする【制御構造】

繰返し [for]

繰返し [while,repeat]

条件判断

データの可視化