WWWその1
目次
WWWって?
インターネット普及の牽引役となったWWW(World Wide Web)は大きく3つの事柄が決められています。その3つとは以下の通りです。
- 情報へのアクセス方法とその位置→URL(Uniform Resource Locator)
- 情報の表現方法→HTML(Hyper Text Markup Launguage)
- 情報の転送方法→HTTP(Hyper Text Transfer Protcol)
URL
まず、URLです。これはいわゆる「ホームページのアドレス」と呼ばれているものです。よく目にする「http://www.~」というのがURLです。
URLはUniform Resource Locatorの頭文字をとったもので、「Uniform」は「形式」、「Resource」は「資源」、「Locator」は「位置」ですね。コンピュータネットワークの世界での「資源」というとだいたいファイルのことなんだなぁと考えていただいて結構です。
つまり、URLは「インターネット上のファイルの位置を定義するための形式」です。
URLは「形式」だと言うことで、その形式を表したのが次の図です。
この図はRFC(RFC1738)から引っ張ってきた、正式な書式です。
<scheme>
スキームと呼びますが、アクセス手段のことを表しています。ここにはhttpやftpなどが入ります。
httpだけとは限らないんですね。最近SSLというセキュリティの仕組みを使っているサイトではhttpsとなっているのをよく見かけます。
<scheme-specific-part>
スキームに特有の部分を表しています。
スキームとしては次のものが主に使われます。
ftp | File Transfer protocol |
http | Hypertext Transfer Protocol |
gopher | The Gopher protocol |
mailto | Electronic mail address |
news | USENET news |
nntp | USENET news using NNTP access |
telnet | Reference to interactive sessions |
wais | Wide Area Information Servers |
file | Host-specific file names |
prospero | Prospero Directory Service |
<user>:<password>@
<user>、<password>はオプションなんですがユーザ認証を行うこともできます。会員制の有料サイトはこの<user>、<password>を利用してユーザ認証を行っているところもあります。 「:」は<user>と<password>の区切りで、「@」は次の<host>との区切りとして入れてあげる必要があります。
<host>
ネットワーク上のコンピュータのホスト名です。これはFQDNで指定する必要があります。<host>の指定は必須です。
<port>
オプションでポート番号の指定を行います。スキームがhttpの場合は、<port>を省略すると自動的に80と認識してくれます。
<url-path>
ホスト内の目的のファイルまでのパスです。
以上が一般的な書式ですが、よく見かけるのが次のようなURLです。
http://www.yahoo.co.jp/
このURLはつまり「httpプロトコルでwww.yahoo.co.jpにあるファイルにアクセスできますよ」ということを示しています。この例では最後の