WWWその1

WWWって?

インターネット普及の牽引役となったWWW(World Wide Web)は大きく3つの事柄が決められています。その3つとは以下の通りです。

  • 情報へのアクセス方法とその位置→URL(Uniform Resource Locator)
  • 情報の表現方法→HTML(Hyper Text Markup Launguage)
  • 情報の転送方法→HTTP(Hyper Text Transfer Protcol)

URL

まず、URLです。これはいわゆる「ホームページのアドレス」と呼ばれているものです。よく目にする「http://www.~」というのがURLです。
URLはUniform Resource Locatorの頭文字をとったもので、「Uniform」は「形式」、「Resource」は「資源」、「Locator」は「位置」ですね。コンピュータネットワークの世界での「資源」というとだいたいファイルのことなんだなぁと考えていただいて結構です。
つまり、URLは「インターネット上のファイルの位置を定義するための形式」です。

URLは「形式」だと言うことで、その形式を表したのが次の図です。

この図はRFC(RFC1738)から引っ張ってきた、正式な書式です。

<scheme>
スキームと呼びますが、アクセス手段のことを表しています。ここにはhttpやftpなどが入ります。
httpだけとは限らないんですね。最近SSLというセキュリティの仕組みを使っているサイトではhttpsとなっているのをよく見かけます。

<scheme-specific-part>
スキームに特有の部分を表しています。

スキームとしては次のものが主に使われます。












































ftp File Transfer protocol
http Hypertext Transfer Protocol
gopher The Gopher protocol
mailto Electronic mail address
news USENET news
nntp USENET news using NNTP access
telnet Reference to interactive sessions
wais Wide Area Information Servers
file Host-specific file names
prospero Prospero Directory Service

<user>:<password>@
<user>、<password>はオプションなんですがユーザ認証を行うこともできます。会員制の有料サイトはこの<user>、<password>を利用してユーザ認証を行っているところもあります。 「:」は<user>と<password>の区切りで、「@」は次の<host>との区切りとして入れてあげる必要があります。

<host>
ネットワーク上のコンピュータのホスト名です。これはFQDNで指定する必要があります。<host>の指定は必須です。

<port>
オプションでポート番号の指定を行います。スキームがhttpの場合は、<port>を省略すると自動的に80と認識してくれます。

<url-path>
ホスト内の目的のファイルまでのパスです。

以上が一般的な書式ですが、よく見かけるのが次のようなURLです。

http://www.yahoo.co.jp/

このURLはつまり「httpプロトコルでwww.yahoo.co.jpにあるファイルにアクセスできますよ」ということを示しています。この例では最後のがありません。このような場合は、WEBサーバで規定値を設定しているので、自動的に規定値が補完されます。規定値としては、「index.html」とか「default.html」などがよく使われます。

コメントを残す

メールアドレスが公開されることはありません。 * が付いている欄は必須項目です

CAPTCHA