3 インターネットの利用

 

{WWW(World Wide Web)}

・WWWとは
 1994年以降になって急速に普及を始めたのが、 World Wide Web略してWWWと呼ばれるインターネット上の情報公開システムである。そもそもWWWは、1989年にスイスの欧州素粒子物理学研究所CERNで生まれた。WWWのアイディアは、研究プロジェクトにおける各人の情報をどのように管理したらよいか、という問題から出てきた。WWWは、CERN内の複数の独立した情報を何の変更もなく結合し、ハイパーテキストにすることができるように設計されている。このため、CERNの中だけを対象としていた WWWをインターネット全体を対象とするように変更することは簡単なことであった。そして、まさに世界中に張り巡らされた情報の蜘の巣(web)が実現されたのである。
 WWWでは、 Webページと呼ばれる看板のようなものをあらかじめ作成し、サーバーにその内容を記憶させる。Webページを見る人は、サーバーに対してその内容の公開を要求し、サーバーはその要求に応じて情報を転送する。

WWWのリンクはクモの巣のように国際的につながっている

 現在のWWWでは、多くの場合、 WebページをHTML形式で記述している。HTML形式には、他のWWWサーバーのWebページを指示する書式がある。情報を引き出す利用者は、この記述の参照にしたがって、他のWWWサーバーに接続し直すことが出来る。このような「他のWWWサーバーへの参照を指示する書式」のことを、「リンク」という。リンクを作るためには、特定のWWWサーバーを指定し、そのWWWサーバー固有の方法で情報を引き出す必要がある。このとき用いられるのが、「URL」と呼ばれる文字列である。現在では、ほとんどのWebページがリンクを持ち、相互に情報を参照しあっている。このリンク関係は、あたかも世界中にクモの巣が張られているように見え、これが「Web(クモの巣) 」という言葉の由来である。


リンクされたWebページ

 

・ WWWのしくみ
 WWWはインターネット上で情報をやりとりする仕組みの1つで、 1994年ころから急速に普及した。 WWWでは、情報を見るのにWebブラウザと呼ばれるプログラムを使う。中でも、1993年にアメリカのNCSA(National Centerfor Supercomputuing Applications)で開発されたモザイクは(Mosaic)は有名で、その完成度と繰作性の良さからWWWが爆発的に普及し始めた。モザイクは、WWWをアクセスするプロトコルを持ち、情報としてテキスト、グラフィック、音声などを取り扱うことができる。まさに、マルチメディアである。近年では、モザイクに変わりネットエスケープやインターネットエクスプローラが主流になってきたが、いずれもこのモザイクを模倣して作られた。ブラウザはインターネットを通じて各地にあるWebサーバと呼ばれるプログラムに接続してHTTP情報を取り出す。サーバが情報源、ブラウザが情報を受け取る手段となる。


WWWの概念

 テレビ放送で言えば、 Webサーバは放送局、 Webブラウザはテレビ受信器に当たる。ただし、テレビは電波やケーブルの届く範囲の放送局の情報しか受け取れまないが、 WWWでは世界中の数十万箇所にある、どこのWebサーバの情報でも受け取れ、混信することもない。
 WWWでは受け取る情報の単位はWebページと呼ばれ、ブラウザの画面上で画像とテキスト (文字) のまざった形で眺めることができる。また、ページの中には音声や動画を含めることもできる。このように、コンピュータで多く使われるテキスト情報以外の各種形態の情報を使用可能なことから、 WWWはマルチメディアのシステムであるといえる。 また、近年のブラウザではJavaに代表される、インターネット上で動くプログラム言語も標準で搭載しており、動作機種をまったく選ばずにブラウザ上でワープロソフトを走らせたり、OSまでもエミュレートするなど、ますます高度なマルチメディア化が進んでいる。いずれ、高額なソフトもインターネットを通じて、格安に時間制で利用できる日も近いであろう。

 

・URL と HTML
 クライアントであるブラウザは、利用者がクリックして指定したURLを解釈しながら処理を進めていく。これを図で説明する。クライアントは、起動されると指定されたWWWサーバに要求を出し、webページをもってくる(図の(1))。つぎに、利用者がどこかをクリックして指定すると、それに対応するURLを解釈する。例えば、それがhttp://www.ntt.jp/ japanese/voice/arigatou.auであればhttpのプロトコルを使用して、www.ntt.jpというコンピュータ上の/apanese/voice/というディレクトリ上のarigatougu.uaというファイルを要求する(図の(2))。


WWWサーバクライアントシステム

 WWWのドキュメントは、HTML(Hyper Text Markup Language)という文章の構造をマーク付けする言語で記述されている。HTMLではブラウザの画面に表示されるテキストの表示形式を規定でき、他の資源へのポインタは、URL(Uniform Record Locator)という表現形式で表わされている。これは、インターネット上のあらゆる資源へのポイントが統一的に表現できるようになっており、アクセスの手段の対象の組で記述される。たとえば、FTP(File Transfer Protocol:ファイルのやり取りをするためのプロトコル)でアクセスするds.internic.netというコンピュータのrfcというディレクトリへのポインタは、ftp://de.internic.net/rfc と表記する。FTPのほか、TELNETやウェイズ、ゴーファーなども指定可能である。また、WWWの資源は、http://www.ntt.jp/japanese/voice/rigatou.auなどと表記する。HTTP(Hyper Text Transfer Protcol)とは、WWWのサーバとクライアント間で使用するプロトコルの名前である。www.ntt.jpはコンピュータの名前、japanese/voice/arigatou.auはディレクトリとファイル名である。ちょうど、下記のように解釈できる。

 

・WWWの特徴と弱点
 ここまででWWWのさまざまな側面やさまざまな機能を見て来た。その一番の特徴は、先にも述べたハイパーテキストの構造にある。ハイパーテキストの機能を活かすと、次のような特徴が得られる。

あるページすべての情報を詰め込んでしまうのではなく、ざっと眺められる程度の内容にしておいて、必要ならリンクをたどって詳しい情報がを見えるようにできる
本などのように先頭から順番に見て行かなくても、興味のあるところから飛び飛びに読むようなことができる
ディレクトリサービス(Yahooなど)等を活用し、 1つのことがらを、さまざまな視点から分類整理して示すことができる

 ここまではハイパーテキストの特徴であるが、さらに、 WWWに固有な特徴としては、次のことがあげられる。

マルチメディア テキスト、画像、動画、音など各種の形の情報を提供できる
利用者が必要だと思った時に直接情報源のサーバに取りに行くため、最新の情報が得られ、無駄な配送がない
分散データベース リンクは世界中のどこを指すこともできるので、WWWの情報は世界各地に分散した情報の集まりになっている
大容量 世界中のサーバの情報が利用できるため、情報量がほとんど無尽蔵である
簡単 利用者はリンクを選択するだけで各地の情報サーバから情報を引き出すことができる

一方で、 WWWは次のような弱点も持っている。

ネットワーク容量の浪費。「お飾り」の画像を転送するためだけに、ネットワークの転送能力が消費されがちである
待ち時間の増大。見たい情報を選択してから取りに行くので、延々と待たされることがある
保守の不足。作っただけで保守されていないページや、ページが移動したのに対応していない「切れた」リンクなどにより有効な情報が得られないことがある

 しかし全体としては、 WWWは「誰でもがネットワークから有用な情報を取り出せる」ようにした功労者であり、インターネットブームのきっかけとなったのもうなずけるところである。

 

{電子メール( e-Mail)}

 電子メール(e-Mail)とは、TCP/IPネットワーク上でメッセージの送受信を行うための媒体。Mailのやり取りのプロトコルは、
SMTPプロトコル:Simple Mail Transfer Protocol (送信用)単純郵便転送プロトコル
POPプロトコル:Post Offoce Protocol (受信用)郵便私書箱プロトコル
が用いられる。宛先はgakusei@kamatahoiku.ac.jp のように
ユーザID@ドメイン名 で指定される。コンピュータはドメイン名を数値(IPアドレス)で認識するが、TCP/IPはどこで役割をはたしているのであろう?もちろん、インターネットにデータを流すために、TCP/IPに従ってメール(データ)を送ることになる。

・POPプロトコル
 常時、インターネットに接続されていれば私書箱など不要で、直接相手のコンピュータにメールを届ければよい。しかし、PCなど電源を切ったりすると、メールは届かず破棄される。そこで常時接続してある、
私書箱用のサーバ=POPサーバをつくって、メールを蓄積しておき、欲しいときに私書箱から取り出すことになる。これを行うプロトコルをPOPプロトコルという。
 例として、BさんからAさんにメールが届く場合を考える。まず、BさんからAさんのメールアドレス(例えば、AAA@BBB.CCC.co.jp)にメールを送る。指定されたアドレスまでそれぞれのサーバのsendmailが順繰り転送してゆき、Aさんを担当するPOPサーバ(のハードディスク)にメールが蓄えられる。一方、Aさんが定期的に(メールソフトで)メールをチェックしていれば、POPサーバにメールがあるかどうか問い合わせ、その時点で蓄えられているメールは、 Bさんからのメールも他からのメールすべてAさんのコンピュータ(のハードディスク)に転送される。

POPサーバによるメール転送

(1)Aさんは、メールがきているかどうかPOPサーバに問い合わせる
(2)POPサーバはAさんかどうかを、IDとパスワードを要求して認証確認をする
(3)メールはすべてAさんのコンピュータに転送される

 

・SMTPプロトコル
 発信のほうは、より簡単である。
発信用のプロトコル=SMTPプロトコルは発信を担当し送りっぱなしである。以前、インターネット専用回線は非常に高価で、常時接続されていないときには、定期的に電話回線で接続し一括してメールを送っていた。そのため、次回に電話回線が繋がるまで、送信メールを一時的にためておくサーバ(常時電源が入って24時間稼動している)SMTPサーバが必要となる。このような定期的・自動的に通信を行うためのプロトコルをUUCPプロトコル(Unix to Unix CoPy Protocol) という。


AさんからBさんにメールを送る場合

 

・sendmail 配達マン
 電子メールは、大体は相手に届く。たまに、送れて届いたりする。ただし、確実に届くとは保証していないが、各ネットワーク管理者が最善を尽くしている。
 相手アドレスへの「配達マン」の役割をする、
sendmailと呼ばれるプログラムがメールサーバで必ず稼動しており、E−mailを順繰り目的のアドレスにリレーのように次々とサーバに送っていく。最初に送りつけようとしたサーバが通信不可能なときには、他の経路のサーバを探してそちらに転送していく。極端な場合、東京から大阪にメールが届くのに、アメリカ経由で大阪に届くこともありゆる。また、転送途中で、そのアドレスが無効であることが分かると、すぐに転送もとのアドレスに向けて、「User unknown」や「Host unknown」といった表題の簡単な英文の電子メールを送る。この電子メールのFromは、大抵の場合Mailer-Daemonと言う名前になっている。この電子メールはサーバから自動的に送られてくるものなので、「Re:なんでですか?」等と返事を書かないよう気おつけてもらいたい。
「User unknown」:メールアドレスのドメイン名は合っているが、利用者が存在しない
「Host unknown」:メールアドレスのドメイン名を間違えている

 

 

 

 

 

 

   

 

 

 

 

 

 

 

 

 

 

_