World-Wide Web
NTT基礎研究所
高田敏弘
(takada@seraph.ntt.jp)
"It's like the difference between the brain and the mind.
Explore the Internet and you find cables and computers.
Explore the Web and you find information."
--- Tim Berners-Lee
[NYT93]
目次
World-Wide Web
(通常 WWW, W3 あるいは Web などと略される) は 1989 年に
CERN
(European Laboratory for Particle Physics, Geneva, Switzerland)
の
Tim
Berners-Lee により提案された広域情報システムであり,
以下のような経緯を経て, 今日極めて多くの注目を集めるようになった.
WWWの歴史
- 1989年3月
- 最初のプロジェクト・プロポーザルが
Tim
Berners-Lee により書かれる.
- 1990年11月
- WWW の最初のプロトタイプが NeXT 上で作られる.
- 1991年3月
- Line mode ブラウザの最初のリリース.
- 1991年10月
- 専用のメーリングリスト (www-interest と www-talk) が開設される.
- 1992年2月12日
- Line mode ブラウザの存在が alt.hypertext, comp.infosystems,
comp.mail.multi-media, comp.archives.admin などでアナウンスされる.
- 1993年1月
- Midas, Viola, Mosaic などの X Window System 用のブラウザと,
Macintosh 用のブラウザがリリースされる. この時サーバの数は50.
(
The World Wide Web project
<http://info.cern.ch/hypertext/WWW/History.html>
より引用)
WWW は以下に挙げるような特徴を持つ.
- ハイパーテキストを介して Internet
上の全ての情報にアクセスすることを可能にする.
- Internet 上の全ての情報をシームレスに結合する.
- 統一された簡単な方法で, Internet 上の全ての種類の全ての情報に,
一様にアクセスすることを可能にする.
WWW を構成するのは以下の3つの概念である.
- HTML (HyperText Markup Language)
WWW の中核となるハイパーテキストを記述するための言語.
- HTTP (HyperText Transfer Protocol)
WWW のクライアント・サーバ間のプロトコル.
- URL (Universal Resource Locator)
Internet 上の様々なリソースに対する統一的な名前付けの手法.
次節以降でこれらの概念について簡単に説明する.
WWW は様々な情報を結び付ける手段としてハイパーテキストを用いる.
このハイパーテキストを記述するための言語が
HTML であり,
他の資源へのリンク情報と文書のフォーマットを表現する機能を持つ.
HTML は SGML (Standard Generalized Markup Language)
を基本としたタグ付き言語であり,
SGML と HTML を表す DTD (Document Type Definition) によって定義される.
簡単な HTML 形式の文書の例を以下に示す.
_____________________________________________
<HEAD>
<TITLE>HTML example page</TITLE>
</HEAD>
<BODY>
<H1>Simple HTML example</H1>
<A HREF="http://www.ntt.jp/index.html">
<IMG SRC="/ntt/logo.gif"> このボタン
</A>
を押すと<B>NTT</B>のHomePageに行きます.
</BODY>
_____________________________________________
上の HTML 形式の文書を表示した結果は以下のようになる.
HTMLに関するトピックス
HTML については, 現在, より豊富な機能を持った新しい規格である
HTML+ を開発中である.
HTTP
は WWW のクライアントがサーバと通信する際に(主に)用いられるプロトコルであり,
TCP/IP 上で実現されている.
HTTP プロトコルの中心部分は極めてシンプルであり,
サーバはクライアントから来た,
GET <要求するファイル名> [<使用するプロトコル名>]
という要求に対して, そのファイルの内容にヘッダを付加して送り返す.
例えば前節で例に示した HTML
ファイルをクライアントが要求し,
それが HTTP サーバから送り返される様子を以下に示す.
[クライアントからサーバへの要求]
GET /test.html HTTP/1.0 <CR>
<CR>
[サーバからクライアントへの返答]
HTTP/1.0 200 OK^M
Date: Tue Jan 18 16:19:48 1994 GMT^M
Server: NCSA/1.0a^M
MIME-version: 1.0^M
Content-type: text/html^M
^M
<HEAD>^M
<TITLE>HTML example page</TITLE>^M
</HEAD>^M
<BODY>^M
<H1>Simple HTML example</H1>^M
<A HREF="http://www.ntt.jp/index.html">^M
<IMG SRC="/ntt/logo.gif"> このボタン^M
</A>^M
を押すと<B>NTT</B>のHomePageに行きます. ^M
</BODY>^M
要求されたファイルが HTML 形式以外の場合でも同様に
, ヘッダの後にそのデータが送り返される.
HTTPに関するトピックス
HTTP については, 少し前まではそのサブセットである "HTTP 0.9"
と呼ばれるものが用いられていた.
しかし現在ではほとんどのサーバが正式な HTTP プロトコル
("HTTP 1.0" と呼ばれる) を使用するようになった.
WWW の構成する要素の中で最も重要な概念が
URL
である.
URL は Internet 資源に対する統一的な名前付けの手法であり,
その一般的な構文は,
scheme://host.domain[:port]/path[#anchor][?keyword]
という形式をしている.
例えば前節で例に示した HTML 形式のファイルが
www.ntt.jp というホストに test.html というファイル名で置かれており,
それを HTTP プロトコルを用いて要求することが可能な場合は,
http://www.ntt.jp/test.html
という URL で, その資源を特定することができる.
URL は scheme 部で様々なプロトコルを指定することができ,
これにより WWW は, Internet
上の様々なサービスから得られる情報を統一的に取り扱うことが可能になる.
以下に利用可能なアクセスプロトコルと, それを用いた URL の例を示す.
- HTTP
- http://info.cern.ch/hypertext/WWW/TheProject.html
- File/FTP
- file://ftp.ntt.jp/sound/voice.au
- Gopher
- gopher://gopher.micro.umn.edu:70/1
- WAIS
- wais://quake.think.com/weather?surface
- NetNews
- news:comp.infosystems.www
- Telnet
- telnet://www@info.cern.ch
上の例からも分かるように, WWW とは単に WWW 内に閉じたシステムではなく,
Gopher, WAIS, FTP, Archie, WHOIS, NetNews
などの Internet 上の様々な情報システムを連続した形で内包する概念である.
この最も重要な特徴を可能にしている一つのポイントが URL である.
URLに関するトピックス
URL 関連では, 現在 IETF の
URI
WG で,
URI (Uniform Resource Idenifier),
URN (Uniform Resource Name),
URC (Uniform Resource Citation)
などの,
URL より更に高レベルな Internet 資源への名前付けの手法が検討されている.
CERN で作成している
The World-Wide Web Virtual Library: Subject Catalogue
<http://info.cern.ch/hypertext/DataSources/bySubject/Overview.html>
というリストには以下の項目が挙げられている.
Aeronautics, Agriculture, Archaeology, Astronomy and Astrophysics,
Bio Sciences, Chemistry, Computing, Earth Science, Economics, Education,
Electronic Journals, Engineering, Environment, Finance, Fortune-telling,
Geography, History, Languages, Law, Libraries, Literature & Art,
Mathematics, Meteorology, Movies, Music, Philosophy, Psychology,
Physics, Politics and Economics, Recipes, Reference, Religion, Social Sciences
しかし実際どれだけの情報が今現在世界にあるかは,
WWW が日に日に成長を続けている今日では, 誰も把握のしようがないであろう.
WWW の世界にどのようなものが存在するかを知りたければ,
上のリストを手掛かりにして,
実際に自分で WWW の世界を歩いてみるのが最も良いと思う.
WWW は 1993 年の一年間で飛躍的な成長を遂げた.
その成長の様子を, サーバの数と Internet
中を流れるデータの量の2つの側面から紹介する.
HTTPDサーバ数
以下の表は HTTPD サーバの数の様子を示したものである.
Number of
Date Server Sites
_________________________
Jun 5, 1993 130
Sep ?, 1993 204
Oct 15, 1993 212
Oct 25, 1993 228
Nov 18, 1993 272
Dec 13, 1993 623
(
<http://www.mit.edu:8001/afs/sipb/user/mkgray/ht/web-growth.html>
より引用)
HTTPプロトコルのパケット数
以下のグラフは
NSFNET バックボーン・トラフィックの去年一年間のプロトコル別統計より,
全体のトラフィックに対する HTTP プロトコルが占める割合
(括弧内はその順位を表す) が増加していく様子を示したものである.
WWW のクライアント・ソフトウェアを紹介する.
Terminal based browsers
- CERN Line Mode Browser
- Dumb terminal 上で動作するクライアント.
- Lynx
- UNIX の curses ライブラリを用いて動作する.
「日本語 curses」に類するものがあれば, 日本語の表示が可能.
- Emacs W3-mode
- GNU Emacs 用. Mule 上で使用すれば多国語の取扱いが可能.
X Window System
- NCSA Mosaic for X
- 非常に強力で魅力的なプログラムであり,
現時点での WWW の代表的なクライアントとなっている.
Motif を用いて書かれている.
- tkWWW
- Tcl/Tk で書かれている. 日本語 Tcl/Tk を用いれば日本語の表示が可能.
- Chimera
- Athena Widget のみを利用するクライアント.
- MidasWWW
- Motif を用いている. 中国語の表示も可能.
- ViolaWWW
Macintosh
- NCSA Mosaic for Macintosh
- Mosaic の Macintosh 版. X 版の後を追いかけて開発される形になっているので,
X 版よりはやや機能が劣る.
- Samba
NeXTStep
- Browser-Editor on the NeXT
- NeXTStep 用のクライアント.
Microsoft Windows
- NCSA Mosaic for Windows
- Mosaic の MS-Windows 版. Mac 版と同様, X 版よりはやや機能が劣る.
- Cello
以上に挙げた以外にも多数のクライアントが存在する.
現時点で最も広く使われているのは
Mosaic
である. Lynx, W3-mode なども利用者が多い.
WWW (正確には HTTP) のサーバ・ソフトウェアを紹介する.
- CERN server
- CERN で書かれたオリジナルのサーバ
- NCSA httpd
- NCSA で書かれたサーバ. PDS に置かれている.
- Plexus
- Perl で書かれたサーバ. サーバ自身の拡張が容易である.
- MacHTTP
- Macintosh 上で動くサーバ.
- GN
- 基本的には Gopher のサーバであるが, HTTP プロトコルも取り扱うことができる.
1994 年 1 月 20 日の時点で,
日本では以下の 14 の機関でサーバが立ち上がっている.
この数は今年一年でかなり増えていくものと思われる.
NTT でも有志が中心となって
WWW サーバの立ち上げを行った.
1993 年の 9 月の末にサーバを開設し, 10 月 7 日に日本国内に対して,
12 月 2 日に全世界に対してアナウンスを行った.
現在では NTT のサーバに対して,
一日平均 3000 から 5000 件のアクセスがある.
サーバの開設から現在までの,
一週間毎のアクセス件数の推移を以下のグラフに示す.
また, NTT のサーバへのアクセスあった国を,
そのアクセス回数順に並べると以下のようになる.
Internet に接続されている全 69ヶ国 (1994年1月1日現在) 中,
40ヶ国からのアクセスがあった.
Japan, United States, Germany, United Kingdom, Switzerland
Canada, Netherlands, Sweden, Australia, France, Finland, Italy,
Norway, Hong Kong, Denmark, Poland, Spain, Austria, Israel, Taiwan,
Belgium, Korea (South), Slovenia, Hungary, Ireland, Chile, Singapore,
Portugal, Turkey, New Zealand, Greece, Mexico, Iceland, Costa Rica,
Brazil, Czechoslovakia, Soviet Union, Slovak Republic, Malaysia, Croatia
現在 NTT のサーバには, NTT に関する情報の他に,
Japanese Information
と銘打ったコーナーを設けている.
これは, 今日までの海外からの情報の輸入超過傾向を鑑み,
「日本発の情報への入り口」という面の積極的なアピールを試みたものである.
この Japanese Information のコーナーには,
日本の文化や日本での生活の紹介,
音声を用いた簡単な日本語講座,
WWW における日本語の取扱いに関する説明
などが置かれている.
また, 新しい形態の情報提供サービスという観点から,
国際観光振興会
などと共同で WWW による
情報提供実験
を行っている.
また実際に NTT サーバ内に置かれた情報の他に,
NTT 以外で提供している日本に関する情報や国内の他の
WWW サーバなどへのリンクを維持している.
最後に参考までに,
NTT のサーバ上にある各ページ毎のアクセス数上位 10 件を以下に示す.
Number Of Percent Of
Document Title Files Sent Files Sent
------------------------------ ---------- ----------
1 NTT Home Page 13533 5.96
2 Japanese Information 8439 3.72
3 NTT Home Page (in Japanese) 2739 1.21
3 Note on Japanese Documents 2739 1.21
5 What's New 1990 0.88
6 TAKADA Toshihiro 1756 0.77
7 WWW Servers in Japan 1652 0.73
8 NTT INFORMATION 1539 0.68
9 YOUR TRAVELING COMPANION -JAPAN- 1422 0.63
10 Japanese Information (in Japanese) 1408 0.62
現在, LineMode ブラウザ, Lynx, tkWWW
などのクライアントは日本語のテキストを表示することが可能である.
また, Mosaic for Mac, Mosaic for Windows では Shift-JIS
で書かれたデータの場合のみ, 日本語の表示が可能であることが確認されている.
国際化されたクライアント
Emacs W3-mode を Mule 上で動かすことにより, 多国語の表示が可能である.
また, Mosaic for X には, 限定された形ではあるが, 日本語, 中国語, 韓国語,
ロシア語, ヘブライ語などの各国語の表示を可能にするバージョンが存在する.
WWWの国際化
WWW 自体の国際化については, その文字コードの取扱いや,
同一内容の情報を複数の言語で提供する際のインタフェースなど,
はっきりと決まっていない点がほとんどであり, 全てこれからの課題である.
WWW の技術的な面に関しては,
- データのキャッシングやミラーリングをいかに行うか?
- より高レベルな Internet 資源に対する名前付けをいかに行なうか?
- 膨大に膨れ上がった情報に対する検索をいかに行なうか?
などの問題が今後の課題として残されている.
しかし逆の言い方をすれば, WWW は今までの Internet と同様に,
誰かが作るものではなく我々が作るものである.
WWW はまさしく今, その開発が進められている最中であり,
誰でも参加する機会が与えられている.
また研究的な観点から見ると,
- 通信と結び付いたマルチメディアの研究
- 通信と結び付いたヒューマンインターフェースの研究
- 通信によって爆発的に増加する情報の捌き方の研究
といった問題は,
今後の社会と密接に関わってくる重要な研究課題であると考えられる.
- WWW や Mosaic の登場により, 専門家ではない一般の人間も,
計算機やネットワークの利用方法を手に入れることが出来るのだろうか?
- 日本では WWW や Gopher などの Information System
のことを「広域情報検索ツール」と呼ぶことが多いが,
WWW や Gopher の本当の可能性は,
検索ではなく情報発信にある.
-
「誰でも15分間は有名になれる」時代から,
「誰でもテレビ局になれる」時代へ.
といった変化は起こるのであろうか?
このような状況下で,
広範囲に渡って情報がより容易にかつシームレスにやりとりされるようになっていく過程においては,
以下のような点が問題となるであろう.
- 情報を提供する者や情報を取得する者の義務や権利はどうあるべきなのか?
- 情報提供者や情報取得者のモラルの問題.
- 情報がより密に結合することから派生する Internetの 商用利用に関連する問題.
NTT の WWW のサーバの立ち上げなどを一緒に行ってきた,
NTT 交換システム研究所の坂本仁明,
佐藤進也の両氏に深く感謝致します.
また WWW のようなシステムは現在のネットワークの環境なくしては成立しないということを,
今回改めて痛感しました.
これまでネットワークの創設や維持/管理などに関わってこられた全ての方々に深く感謝致します.
そして最後に, WWW の創始者である Tim Berners-Lee 氏,
Mosaic の作者である Marc Andreessen, Eric Bina の両氏をはじめとする
WWW に関わってきた全ての人々に,
絶大なる感謝を!
- [TBL92a]
- Berners-Lee, Tim, et. al.,
World-Wide Web: The Information Universe,
In Electronic Networking: Research, Applications and Policy,
Vol. 1, No. 2, Meckler Publishing, Westport, CT, USA, 1992.
Also available at
<http://info.cern.ch/pub/www/doc/ENRAP_9202.ps>.
- [TBL92b]
- Berners-Lee, Tim and Cailliau, R.,
The World-Wide Web,
In proceedings of the conference Computing in High Energy Physics,
Annecy, France, 1992. To be published as a CERN yellow report.
Also available at
<http://info.cern.ch/pub/www/doc/chep92www.ps>.
- [TBL93]
- Berners-Lee, Tim, et. al.,
The World Wide Web Initiative,
In proceedings of INET '93, Internet Society, 1993.
Also available at
<http://info.cern.ch/pub/www/doc/INET93.ps.Z>.
- [KH93]
- Hughes, Kevin,
Entering the World-Wide Web: A Guide to Cyberspace,
<http://www.hcc.hawaii.edu/guide/www.guide.html>, 1993.
- [NYT93]
- Markoff, John,
A Free and Simple Computer Link,
In The New York Times, December 8, 1993, Wednesday,
Late Edition - Final.
Also available at
<http://www.ugcs.caltech.edu/~kluster/markoff.html>.
第1版: 1994年1月19日, NTT COREnet オープニング・コンファレンス配布資料.
第2版: 1994年1月21日, World-Wide Web 公開版.
Copyright (C) 1994, TAKADA Toshihiro