コンピュータネットワーク入門（前期の復習＋α）

インターネットの起源

アメリカ国防総省・高等研究局（ARPA: Advanced Research Project Agency ）が、いくつかの拠点が壊滅しても全体としての通信ネットワークを確保するための実験としてアメリカ国内の４大学を接続しました。

　⇒ARPANET := 1969年12月 に誕生、とされています。

インターネットの特徴

大学、企業、プロバイダなどの（組織）ネットワークがお互いに結ばれて 全体として１つのネットワークのように振舞います。
接続経路は複数 　⇒　一部が切れても大丈夫（接続性が高い）
ネットワークを流れるデータは 小さな塊（パケット） に分けて送られます　⇒　転送エラーが起こっても、そのエラーがおこったところだけ再送すればよいわけです。
大きな塊のままデータを送ると、途中でエラーがおこった場合、全部送り直しになってしまい、効率が悪くなってしまいます。
インターネット全体を管理運営する組織はないですが、最低限必要な調整を行う組織 は存在します（後述）。機関に割り当てる ドメイン名（電子メールのアドレスや、WWW の URL などのベース） や、インターネットに接続するIPアドレス（計算機＝ホストマシンのネット上での登録番号） がかち合わないように調整してくれています。
とはいえ、近年インターネットの肥大化および社会的重要度が増すにしたがい組織もどんどん整っており、実質的に組織的に管理運営されている、と言ってもいい状況になりつつあります。

ネットワークの論理的接続

コンピュータ間の通信を行うためには、単に電気信号を送り合えればいいというわけではなく、それを情報として解釈するための共通の約束（プロトコル）が必要 です。
この点に関しては、今日のインターネットは必ず TCP/IP というプロトコルを使うことになっています。言い方を変えると TCP/IP でつながっている世界中のコンピュータのネットワークが「インターネット」だ、ということです。
つまり TCP/IP は、（学術界での英語と同様？）いわば世界中のコンピュータが会話をかわす時の共通語なわけです。

ネットワークとプロトコル

そもそもプロトコルとは何か、ということですが、（コンピュータに限らず）通信をする際の 約束事（通信規約） のことです。

通信のための約束事というのは実はコンピュータネットワークにかぎったことではなくって、例えば、人と人がコミュニケーションをとる際にも、音声（空気の振動） により、日本語という文法 （これも規約と考えることができる）により通信（？コミュニケーション）が可能となっているるわけです。みんながてんでんばらばらに、フランス語とかアラビア語をしゃべったんではコミュニケーションはなりたちません。

別の例でいうと、我々が葉書（封書でも一緒）を出す場合に、ちゃんと約束事に従ってます、よね。これも勿論通信です。つまり相手の郵便番号をちゃんと７桁書いて（それも決まった場所＝上に！）住所と名前もおおよそ決まった場所（郵便番号の下）に書いて、切手も決まったところ（左上）にはって、ポストに入れる、という手順をふむわけです。これも立派なプロトコルです。この約束を破ると、例えば住所を書かないと何処に届けていいかわからないし、切手を貼らないと郵便は届けてもらえない、ということです。

くどいようですが、プロトコルすなわち約束事をまもらないと、情報は伝わらない（伝えようがない） ということをここでしっかりと押えておいてください。

プロトコルの階層

プロトコルといっても決めることは沢山あって、例えばケ－ブル・コネクタの形状の決まりがないとそもそもお互いに差し込めるようにできないし、あとアプリケ－ションレベルのデ－タフォ－マットも約束事＝プロトコル です。もしこういった規格が全て１つの約束事になってたら、ということを仮に考えてみましょう。そうすると、もしケーブルでつないでたコンピュータを無線にしようとしたら、無線LANの規格を含むプロトコルに総入れ換えしないといけなくなります。手紙の例で言うと、郵便屋さんが乗ってるのが自転車かバイクか車かによってあて先の書き方を変えなければいけない、という感じです。これは非常に面倒でかつ無駄なわけです。

もし自転車なら舗道のある道順を指定しないといけないけど畔道を通ることになっても大丈夫、とか、車なら高速道路のルートを教えてあげないといけない、といった感じでしょうか？

そこで、ネットワ－クプロトコルを階層的に定義 して整理（モデリング）する方法が一般的です。これをネットワークアーキテクチャ といいます。

要点として；

「通信ができる」とは、プロトコルにしたがってデータ交換ができる 、ということである。
ある階層以上でプロトコルが一致していれば、それより下の層は一致していなくても通信は可能 である。
例えば、電話線でダイアルアップしようが、LAN 経由であろうが WWW は同じようにアクセス出来る。
逆に、如何に下の階層が全く同じでも、上の層が異なれば通信はできない 。というよりも、出来ると困る。
例えば、メールの情報とWWW のデータが混ざって届くとわけがわからなくなる、というイメージ。

ということを押さえておいてください。

OSIの７階層について

ネットワークアーキテクチャの中で標準的なものが、ISO (Internatinal Standardisation Organisation) が 1983 年 に示した OSI (Open System Interconnection) の参照モデル です。

このモデルは Internet において実際に実装されているというわけではありませんが、ネットワークの階層性を理解・説明するのに便利で非常によく利用されますので、ここでも述べておきます。

これは７つの階層からできています。

基本参照モデル


第七層	応用層	応用プログラムや端末利用者にデータ通信機能を提供
第六層	プレゼンテーション層	異機種間のデータのタイプや符号を変換する
第五層	セション層	全二重、半二重、優先データ、送信機能、同期、再送機能などを提供


第四層	トランスポート層	データ転送品質(誤りの検出・回復)を保証
第三層	ネットワーク層	通信ルートの確立し、データを中継・転送する機能を提供
第二層	データリンク層	高信頼の透過的なビット伝送を保証
第一層	物理層	通信回線を介してビット単位の伝送を提供
物理媒体		電気的な回路、回線、交換機など

それぞれの層の主な機能は、以下の通りです。ちなみに第１～４層を下位層、第５～７層を上位層と呼びます。

応用層(Application Layer)
応用プロセスや端末利用者にデータ通信機能を提供する層です。
プレゼンテーション層(Presentation Layer)
データの表現形式の制御、、セキュリティの管理などを行う層。応用層が扱う情報をいかに効率的に相手に伝えるかが重要となる。
セッション層(Session Layer)
全二重や半二重という通信モードの管理、通信に必要な同期・非同期、障害からの復旧などを管理する層です。
トランスポート層(Transport Layer)
下位層の通信機能が充分でない時、独自に誤り検出/回復による高信頼化や多重化・分流によるコストの低減、高スループット化などを行うための、いってみれば上位層とのインタ－フェ－スの役割をはたす層です。 TCP, UDP がこの層に対応します。
ネットワーク層(Network Layer)
目的の層までの経路選択と中継機能により経路を設定、データを透過的に転送する、等の相互接続のための規定です。ネットワーク層のプロトコルの例としてはX.25の呼制御手順などがありますし IP もこの層と考えられます。
データリンク層(Data Link Layer)
物理層から提供されるビット伝送機能を用いて、高信頼の透過的なビット伝送を提供する機能を持ち、この中には多重化、フラグシーケンス、順序制御、誤り制御、フロー制御などがあります。データリンク層のプロトコルの例としては HDLC(High-Level Data Link Control)ハイレベルデータリンク制御手順や CSMA/CD などがあります。
物理層(Physical layer)
物理層は、電線は当然として、マイクロ波や衛星、光ファイバなどの各種物理媒体を介して、ビット単位の伝送を行うためのプロトコルで、信号レベルや伝送スピ－ド、あるいはコネクタ形状なども含まれます。IEEE 802 シリ－ズ等もこれに含まれます。

ちなみに、インターネットの世界の標準プロトコル TCP/IP に上の7層をむりやり（？）対応付けると、1,2 層目はごっちゃになって（代表として）データリンクの層として扱うことが多く、 3 層目がIP、4層目がTCP,UDP 、 5～7層もまた併せて（代表として）アプリケーションの層として考えることが多いです。

RFC

Internet 上の約束事（規則といってもいいが、強制する組織は無いのは前述の通り）の多くは、RFC (Request For Comments) という形でまとめられて、公開されています（原語は英語）。

RFC 以外にも、特に下位層については ISO , IEEE などで標準化されたものがいくつか使われています (IEEE 802, ISO の文字コードなど）

たとえば、電子メールのプロトコルと型式に関しては、比較的最近（といっても2008 年）更新された RFC5321 と RFC5322 で規定されています。

その前にあったメールに関する RFC としては821/822, 2821/2822 がありましたが、これらは5321/5322 に上書きされた形で 無効 (obsolete) となっています。このように、RFC は旧来のものを改善したものが出てきたときに、バージョン管理ではなく新しい番号をふって古いのを無効にする、という習慣があります。

ちなみに一部は日本語に翻訳されています。それらについては、例えば JPNIC の RFC のページなどを参照してください。

物理層 (Physical Layer) について

通信をするには、まずはなんらかの手段でコンピュータ同士をつながないといけないわけで、さらにその場合、電圧とかいろいろ事前に決めておかないと当然データ通信は出来ないです。その「なんらかの手段」の規約がすなわち物理層のプロトコルとなります。

通信路の種類と通信速度

下のものほど新しく、大体高速になってます。

RS232C （いわゆるシリアル）…9600bps 位でよく使ってました。
（公衆）電話回線…V90 で 56kbps
同軸ケ－ブル: イーサネット (Ethernet, IEEE 802.3) : 10Base-5/2 (10Mbps)
また、いわゆる ADSL や CATV もこの方式でデータ通信を（音声通信やビデオ信号と混在させて）行っている場合があります。
ちなみに IEEE 802.3 は単なる(OSIでいうところの）物理層の規定だけではなく、実際にはデータリンク層に対応するところの規定も含まれています（後述）。
ツイストペア線: これも Ethernet : 10Base-T (10Mbps), 100Base-TX (100Mbps)
RJ-45 (厳密には 8P8C) コネクタでつなぎます。最近はギガビットイーサも普及しています。
光ケ－ブル: 10Base-F も一応ありますが、今ではギガオーダー（以上）の高速通信に利用されています。B-Flets などの俗にいう FTTH (Fiber To The Home) もこれです。
その他
- 赤外線…スピードというより利便性です。
- 無線LAN (IEEE 802.11a/b/g/n/ac) は今ではあたりまえのインフラになっています。
- bluetooth は無線LANほどの到達性は必要としない簡便な無線通信として登場しましたが、普及は今一歩でした。しかし、スマートフォンにほぼ標準で搭載されるようになり、イヤフォンなど周辺機器との接続に利用されています。

伝送の方式（種類）

全二重 （同時に双方向通信が可能）
半二重 （同時には片方向の通信しかできない。昔のトランシーバとか糸電話はこれ。一方が話しおわると「どうぞ」と言って相手に番をまわす）
ちなみに Ethernet は元々の規格としては上にもあるよう同軸ケーブルだったので半二重（ある一瞬には、あるコンピュータからあるコンピュータに一方向で通信していて、他の通信は出来ないというか、待たされている）なのですが、ツイストペアの場合には上りと下りで別の線を使えるので、全二重通信が可能です。
直列伝送 (シリアル：RS 232C, Ethernet, USB,.. 要するに転送路が１本ということ）
並列伝送 （パラレル：プリンタ等）
同期（網でタイミングを合わせて通信する。計算機内部（マザーボード上とかCPUチップ内とか）はこちら）
非同期 （送信したい時に送信する。衝突などがおこるとパフォーマンスが落ちるが自由度は高い。Ethernet はこちら）
ベースバンド (ビットの0/1を電気の On/Off 等に対応させて、そのまま流す。のろしはこっち（煙の有無））
ブロードバンド （モデム等…変調をすることで、情報を伝送）

接続の方式

バス型 : 同じケーブル（？）に複数のコンピュータが接続されます。
リング型: 1つのコンピュータは2つ線をもち、それぞれ両隣と接続することで、全体が輪になって継っています。通信は回覧板のように直ぐ隣の人にメッセージを渡して伝えてもらいます。
スター型: 中心になるコンピュータ（ハブ）に、他のコンピュータすべてが継っています。なので、通信は常にハブ経由となります。

net-con

物理的な接続と、論理的な接続が違う場合があるので注意してください。例えばスイッチングハブにつないだ複数のＰＣによる Ethernet のネットワークは、物理的（見た目）にはスター型ですが、論理的（プロトコル的？）にはバス型です。（以下参照）

データリンク層 (Data Link Layer) について

データリンク層の役割

誤りの検出と回復
パリティ、CRC…詳細は略
多重化と分流
- 多重化
- 分流
フロー制御、順序制御…も詳細は略

Ethernet (IEEE 802.3) のデータリンク層プロトコル

Ethernet のフレーム
MAC アドレス ＝6オクテット (octet) により識別しています。6のうち前半3オクテットはメーカー毎に決まっていて、（以下16 進数で）例えば Intel なら 00:07:E9,他（複数もってます） RealTek なら 00:40:33 という感じです。この制約により、原則としてあらゆるネットワークインターフェース器機は世界中で一意の MAC アドレスをもつことになっています。
octet とは 8 ビットのことです。コンピュータのハードウェアで言う byte とほぼ同じ意味ですが、何故か（歴史的事情で？）通信やさんはオクテットという言葉を好んで使います。
有線LANの制御方式： CSMA/CD (carrier sense multiple access with collision detection) : データが衝突すれば再送
無線LANの制御方式 CSMA/CA (carrier sense multiple access with collision Avoidance) :もデータが衝突すれば再送、ただし送る前に間をあける

ネットワーク層 (Network Layer) について

ネットワーク層の機能 = IP (Internet Protocol)

IP とは

IP とは、OSI の７階層のネットワーク層（３層目）に対応する、複数のネットワークを繋げるためのプロトコルです。複数のネットワークをつなげられるようになって、はじめてネットのネットである Internet が構成できるわけです。

１つ下の層である データリンク層 で、ある １つの ネットワークに継った複数のコンピュータがつながることが保証されます。細かく言うと、MACアドレス というインターフェース（ネットワークの出入り口であるハードウェア） が固有にもっている 6オクテット ( 48 ビット）の数値で識別され、 CSMA/CD(有線), CSMA/CA(無線) 等のプロトコル にのっとってフレーム（＝データの小さな塊） 単位でのデータ交換を可能としています。

IPアドレスの表現

住所の場合は前述のように数字、文字を使って書くわけですが、IPアドレスはどうなってるかというと、40 億くらいまでの単なる整数です。細かくいうとIP(v4) アドレスは 32ビット = 4オクテット で表現されます。つまり、０か１かが

10010110000010011010000000001010

のように32個並ぶわけですが(10 進数だと 2517213194) 普通は8ビットずつ区切って、

10010110　00001001　10100000　00001010

とし、さらに各々を(なぜか16進数ではなく) 10進数に直して

150.9.160.10

のように書くのが普通です。つまり、10進数で 0～255までの数の、４つ組 でIP アドレスというものが成り立っていてるというわけです。

ネットワークアドレスとホストアドレス

Internet では、近くのコンピュータにデータを送るのに世界中に問い合わせたり遠くのコンピュータを経由することは原則しません。

VPN 等の例外もあることはあります。

これを実現するのが「ネットワークアドレス」と 「ホストアドレス」です。IP アドレスというのは実は

最初の方が（その計算機がぶらさがってる）ネットワークアドレス、
下ののこりが（その計算機自体にふられている）ホストアドレス、

である、ということを理解してください。

先の例では、150.9. が阪南大学 (hannan-u.ac.jp) のネットワークアドレスで、160.10 が puffin のホストアドレス、となるわけです。

ホストアドレスが全て1であるアドレスはブロードキャストアドレス （そのネットワーク全体を示す）で、全て0であるアドレスはネットワーク自身のアドレスになります。つまりこの２つにはホスト（コンピュータ）を割り当てることは出来ません。

グローバルアドレスとプライベートアドレス

上でも少しのべたように、IP アドレスは不足気味でずっと推移しています。実はサブネットで切るのも効果はあるのですが、１つの組織で全てのコンピュータに世界で一意のIP アドレス（これをグローバルアドレスといいます）を割り当てるのではなく、組織内は閉じたネットワークを構成し、そこでは自由に世界中で一意ではない（つまり重複した）アドレスをふることで解決することが考えられました。これがプライベートアドレス(RFC1918) です。

RFC1918 で規定されているプライベートIPは以下の通りです。

10.x.x.x (クラスAに対応）
172.16.x.x - 172.31.x.x (クラスBに対応）
192.168.x.x (クラスCに対応）

これらは勝手に使ってよいのですが、当然使ってよいのはその閉じたネットワークの中だけで、重複してるので外部、すなわち The Internet では当然このアドレスは直接は 使えません。ではどうするかというと、プライベートアドレスのマシンはグローバルアドレスが振られているルータに接続され、そのルータ経由で、その時にグローバルアドレスに変換してから外部に接続する、ということをします。これには NAT (Network Address Translation) や、 NAPT (Network Address Port Translation) （別名 IP マスカレーディング (masquerading) ）といった技術をもちいます。

この変換を利用すると、１つのグローバルアドレスを多数のコンピュータで使えるのでアドレスの消費を節約できるというわけです。また、結果として外部から内部のアドレスを隠すことになっているので（不正アクセス等の）セキュリティ対策面でも有利です。現在ちまたで売られて使われている「ブロードバンドルータ」なるものは、ほとんどがこの機能を使ってます。

サブネットとネットマスク

例えばクラスＢのネットワークだと6万個以上のコンピュータが1つのネットワークに継るわけですが、これは輻輳の可能性もありますし、ネット資源として無駄が出る、等いろんな意味でよろしくないので、大抵の組織内ネットワークでは、これを（もちろん論理的に）細かく切り刻んで使うことが多いです。その場合の刻んだネットワークのことをサブネット といいます。そして、具体的な個々の刻まれたサブネットのことを セグメントと言うことがあります。CIDR とにたような動きです。

そして、サブネットがどのように刻まれているかを示すのに使われるのが ネットマスクです。これとIP アドレスの ビット毎の論理積 (bitwise-AND) をとるとサブネットのアドレスがわかります。例えば本学の場合だと、ネットマスクは 255.255.248.0 なので、例えば 150.9.160.10 の場合、150.9.160 までがネットワークアドレスとなります。つまり；

   255   .  255   .  248   .    0
 11111111 11111111 11111000 00000000
&
 10010110 00001001 10100000 00001010 <= 150.9.160.10
=10010110 00001001 10100000 00000000 <= 150.9.160.0

同じネットワークアドレスを表すのに、150.9.160.0/21 という表記をする場合もあります。これは、上位21ビット(=255.255.248.0) がネットワークアドレスである、という意味です。同じ 150.9.160.0 でも、/19 もありえるし、/24 もありえるわけです（上図参照）。

経路制御

経路制御 (routing, ルーティング) とは、上でいうネットワークをまたがって配送する場合に、どのようなルールで転送していくか、ということです。これがないと、ネットワーク間の情報伝達は出来ないわけです。たとえ話でいうと、大阪府外に出す場合は、まずは中央郵便局に集配して、そこから各都道府県の中央郵便局に送って…という感じです。

実際の制御を簡単な例え話でいうと、

送りたい場所が自分と同じ府県（＝ネットワークセグメント）ならそのまま行ける。
自分と同じ府県に目的地がなければ、
1. その経路を教えてくれるところ（大抵は中央郵便局？）へまず送る。
2. そしてそこで次に送るべき場所（大抵は都道府県の大きな局）を教わって、それに従う。
3. これを目的地に到着するまで繰り返す。

という感じです。

ということで、本格的な解説です；

IP の経路制御
どのIPデータグラム（パケット）をどのネットワークに送ればいいか、を表にしてもっておく。

この図の例では、router B が（PCではあるが）ルーターとなっているとする。 pc A1 から pc A2 への通信を考えると、
1. まず、pc A2 の IP が 192.168.1.3 であることを（後述の DNS 等）なんらかの手段で知る。
2. ルーティングテーブルを見て、192.168.1.3 は 192.168.1.0/24 に含まれているので、自分のネットワークインターフェース (eth0) にパケットを流せば届くことを知る。
3. 自分のネットワークに 192.168.1.3 宛のパケットを流す
また、pc A1 から pc C への通信を考えると、
1. まず、pc C の IP が 192.168.2.2 であることを（DNS 等）なんらかの手段で知る。
2. ルーティングテーブルを見て、192.168.2.2 は 192.168.1.0/24 に含まれていないので、デフォルトの 192.168.1.1 宛にパケットを投げなければいけないことを知る。
3. ルーティングテーブルを見て、192.168.1.1 は 192.168.1.0/24 に含まれているので、自分のネットワークインターフェースにパケットを流せば届くことを知る。
4. とりあえず（自分のネットワークの） 192.168.1.1 に、192.168.2.2 宛のパケットを流す
5. 192.168.1.1 (router B) は、pc A1 からのパケットが、192.168.2.2 宛のパケットであることを知る
6. ルーティングテーブルを見て、192.168.2.2 は 192.168.2.0/24 に含まれているので、インターフェース eth1 へむかってパケットを投げなければいけないことを知る。
7. eth1 に、192.168.2.2 宛のパケットをリレーする

ルーティングテーブルの管理

ルーティングテーブルを静的、すなわち不変のものとして管理する場合は、上述のようにテーブルを管理者が作っておけばいいわけです。しかし、障害対応など接続状況が変化する場合は、その状況に応じて適宜動的に生成 する必要があります。その場合、RIP などのプロトコルを用いて生成します。これこそが、Internet が Internet として成り立っている （網の一部に障害がおこっても全体としての通信機能はたもたれる）主要技術となっているわけです。

DNS (Domain Name System (Service))

名前と IP アドレス

IP アドレスは数字の羅列なので、コンピュータにとってはともかく、人間にとっては覚えにくく、扱い辛いです。なので、分り易い名前をつけて、その名前と IP アドレスの関連をつければよい、ということが考えられました。それがすなわち DNS です。IE などのブラウザは、自動的に ドメイン名を IPアドレスに変換 してアクセスしているわけです。

ドメイン（ホスト）名は世界中で一意に定まっています。例えば puffin.hannan-u.ac.jp の場合、 hannan-u.ac.jp というドメイン内の puffin というホスト名である、という言い方をしますし、また puffin.hannan-u.ac.jp 自体が完結したドメイン名（あるいはホスト名）であるという言い方をすることもあります。後者を特に「世界で一意に定まったドメイン名」という意味で FQDN (Fully Qualified Domain Name) と呼びます。ただし、必ずしもIPアドレスと1対1対応とは限らないです。
ドメイン名は "."（ピリオド）区切りによる階層的名前付け を行っています。階層的に名前を管理することで、データベースを階層的に分散して管理することが可能となっています。
puffin.hannan-u.ac.jp の場合は、「hannan-u」＝組織名、「ac」＝組織の種類（大学、専門学校＝学術組織）、「jp」＝日本、という具合で、つまり住所と同じです。
どういうことかというと、例えば；大阪府という枠があって、その中に松原市という枠があって、その中に天美東5 丁目という枠があって、その4番33号、という住所で場所が特定される、ということです。
ということで、もっとも上位の層のサーバは、全世界の1層目の情報を全てもっているはずで、そうでないと辿って探すことは出来ないです。そのサーバーのリストのことをルートキャッシュ (root.cache) といい、現在、世界で13台（日本にはそのうちの１台）が設置されています。
管理すべき対象として、以下の種類があることも留意しておいてください（詳細は略）
- A レコード：ホストのIP アドレスを持つ
- PTR レコード：逆引き（IP アドレスからホスト名を調べる）
- MX レコード：そのドメインのメールサーバを指定
- CNAME レコード：ホストの別名
- （…以下略）

トランスポート層 (Transport Layer) について

IP 層で世界中のコンピュータがつながるようになるとして、その上で、さて個々のアプリケーションがどのようにそれぞれを 区別して個別に 通信ができるか、については、もう少し細かい制御が必要となります。それがこの層の役目になります。

TCP,UDP と並行処理のモデル

そもそもここで対象としている並行処理 とは何か、ということなのですが、そもそも今どきのコンピュータはマルチプロセス システムであることが本質であり、その各プロセスが個別に通信 を行えるようにするための仕組みを提供しています。つまり、同時にメールの送信・受信も出来るし、WWW のサービスも提供できるし、ということです。そこで、並行処理のために、ポートという概念を導入し、これを識別子として個別の通信を区別できるようにしています。

IP 通信では、2者（通信の主体、ノード ということがあります）間で通信をする場合には、まず通信したい、即ち何かサービスを受けたい方（これをクライアント といいます）から通信される、即ち何かサービスをする側（これをサービスする者という意味でサーバ といいます）にたいして接続要求をし、サーバが要求を受け付けた時点で通信が開始されます。これをサーバ・クライアント型通信 といいますが、サーバ／クライアントといった種類を問わず、かならずポートを割り振ります。

例えば、SMTPサーバは通常25 番を使用しますし、HTTPサーバは 80 番です。つまりサーバの場合は、クライアントからのアクセス時にどのサービスを受けたいかを指定しないといけないので、必然的にポートを指定する必要があります。そして、一般的なサービスについては25や80のように一般的な固定化された番号を定義しています。これはウェルノウンポート(well-known port) と呼ばれます。

unix 系マシンの場合はたいてい /etc/servicesというファイルにそのポートが記されています。以下、 /etc/services からの抜粋です。

ftp-data        20/tcp
ftp             21/tcp
ssh             22/tcp                          # SSH Remote Login Protocol
ssh             22/udp                          # SSH Remote Login Protocol
telnet          23/tcp
smtp            25/tcp
www             80/tcp          http            # WorldWideWeb HTTP
www             80/udp                          # HyperText Transfer Protocol
pop-3           110/tcp         pop3            # POP version 3
pop-3           110/udp

同時に、これらのサーバに接続するクライアント側のアプリケーションでも、実はポート番号が割り振られています。そうしなければ、要求元、すなわちサービスを受けたいクライアントノード上のアプリケーションが見分けられないからです。とはいえ、クライアント側のポートは何でもよいため、通常は使用されていないポート (1024 より上）からOSが 自動的に割り振ります。

TCP の通信モデル

ストリーム機能（データが順番通りに流れていく）
バーチャルサーキット（コネクションを張った通信… あたかも個別に回線が引かれているように使える）
バッファ付き転送（緩衝領域をもっておくことでスムーズにデータを流す）
全二重（同時に双方向で通信が出来る）
非構造化ストリーム…詳細は略

これらをIP層の上で構成して、信頼性をもたせているわけです。言い替えると、 TCP は多少パフォーマンスはおちることがあっても、高信頼性の双方向通信を確立させるためのプロトコルと言うことができます。ちなみに コネクションを張る、とは、データを流す前に繋ぎ元と繋ぎ先をお互いに確認することで、その後は安心して通信できるようにする、ということです。

UDP …コネクションレス型プロトコル

UDP とは TCP より効率を重視したプロトコルで、ポート番号とチェックサム以外のエラー処理を行わないため、パケット自体が小さくてすみ、格段に処理が簡単になります。
UDP の使い道はどのようなものかというと；
- DNS のように、 そもそも送るべきデータ量が少なく て、 送信失敗すればまた送りなおせばよい という開き直り（？）で素早く情報を伝えたいものや、
- ファイル共有 等、効率を重視し、かつ通常同じセグメントで使われるためエラー処理などをさほど必要としないものや、
- ストリーミング のように、エラーになった時は再送するのではなくその部分のデータは諦めて 実時間性 を重視するものに使われます。
言い替えると、UDP はパフォーマンス重視の（ほとんど）一方向の通信といえるでしょう。

おまけ：「サーバ」とは何か？

上にも「サーバ」という言葉が使われていますし、今後も頻繁に出てくるのですが、ここでまとめとしてサーバについて改めて説明しておきます。

「サーバ」とは、第一義としては Webサーバやメールサーバといった ソフトウェア がインストールされて、動作している コンピュータ すなわちハードウェア です。サーバと言うとなにか難しいものに思えるかもしれませんが、細かな違いを除けば、普段使っているPCと特に変わりありません。そのソフトウェアが２４時間動いていて、サービスを要求されるのを待っていて、要求されればそれに応える、ということです。 PCにブラウザやオフィス（ワープロ他）のようなソフトウェアをインストールして使うのと同様に、Webサーバやメールサーバといったソフトウェアをインストールして必要に応じて設定することで、それらの機能を使うことが可能になります。

ここで改めて確認しておいて欲しいのは、「サーバ」と呼ばれるものには、ソフトウェアがインストールされて稼働しているハードウエア をあらわす場合と、Webサーバなどの ソフトウェア をあらわす場合の２通りあるということです。文脈に応じてどちらのことを言っているかを考えないといけません。さらに、場合によってはハード・ソフト併せて言うこともあるので気をつけてください。

講義用スタイル
 印刷用スタイル（開いてから、ページを再度更新してください）