网页工作原理

Author: 周勇生 Date: 2000年第48期

　　随着时代的进步，Internet正以空前的速度深入千家万户，不少公司或个人在网络上建立起主页和站点。公司通过网站发布产品信息、提供服务、寻求商业契机；而个人可以通过网页展示自己的才华和爱好并与他人交流。其中不知大家有没有考虑这样一个问题，就是设计和创建好的网页是如何显示在浏览器上的？笔者以几种不同网址输入格式为例，说说网页是如何具体工作的。
#1　　一、标准的网址：域名＋目录＋文件名称
　　这是最标准的网址书写格式，例如输入：http:／／www.yesky.com／zxxw／001.htm，其中www. yesky.com为计算机域名，zxxw为该计算机根目录下的一目录，001.htm为该目录下的一个具体文件。对于一般的html文件，Web服务器会直接把文件传回给浏览器。这种最标准的网址书写格式使得浏览器与Web服务器之间只有文件传输的关系。其具体的通信过程为：
　　1.浏览器首先会通过www.yesky.com这样的域名来寻找存放网页的计算机服务器，如果找到，浏览器就会与该服务器联系，并建立信息传输通道使信息正确传输。
　　2.信息通道建立好后，浏览器就会向服务器要求下载zxxw目录下的文件001.htm。
　　3.文件下载成功后浏览器便会解释执行001.htm文件中的html标记，如果有图像，则下载图像文件，然后一起显示在浏览器窗口上。
#1　　二、只有“域名＋目录”的网址
　　如果浏览器要查询的是目录，则Web服务器会判断这个目录是否含有默认文件，如果有，会将默认文件传给浏览器，没有则把目录的文件列表传给浏览器。例如http:／／www.yesky.com／news1和http:／／www.yesky.com／news2，这两个网址从表面上看都由域名和目录组成，news1 的子目录下放置有默认文件Index.html，news2目录下未放置默认文件。在浏览器地址框里输入第一个网址，一旦连接成功，服务器便把默认文件传回到浏览器端，最后解释执行该文件；输入第二个网址，返回的则是该目录下的文件列表，这与FTP有点类似。如果服务器端不允许浏览器访问文件目录，浏览器端将会显示提示信息“不允许访问文件列表”，表明服务器端的一些设置要求必须明确指定要下载的具体文件名，如果浏览器没有找到要找的文件，则不允许下载其他文件或子目录。
#1　　三、只有域名的网址
　　其实最多的网址格式恐怕要数http:／／www.yesky.com这种类型，它等于http:／／www.yesky.com／，表示<http:／／www.yesky.com>＋目录“／”。当我们把上述的网址输进浏览器地址框执行时，浏览器首先与计算机服务器取得联系并建立通信信道，然后就向服务器发出要下载该网站网页的请求。由于没有明确下载文件具体名称，服务器就默认下载文件为服务器根目录下的文件Index.html。因此一旦收到下载请求，服务器就自动把该文件传回到浏览器端。最后浏览器启动解释执行功能来解释运行Index.html文件，并把最后的执行结果显示在用户的面前。
#1　　四、含有程序的网址
　　如果浏览器要下载的是扩展名为ASP或CGI的脚本程序，那么Web服务器会自动启动解释程序，然后把程序执行的结果传回给浏览器。例如http:／／www.yesky.com／test.aspde 的网址结尾并不是以.html为扩展名，而是以.asp为扩展名，test.asp为可执行程序，浏览器不能对它进行解释，所以只能先在服务器上解释运行，如果程序中带有参数，如http:／／www.yesky.com／test.asp?NAME=ZYS＆AGE=21 （NAME和AGE为参数），则在执行过程用到这两个参数，然后服务器将运行结果传回给浏览器。如在结果中遇到html标记，浏览器就启动解释程序，然后按html标记的要求把网页的内容显示在用户面前。