网页工作原理

Author: 周勇生 Date: 2000年 第48期

  随着时代的进步,Internet正以空前的速度深入千家万户,不少公司或个人在网络上建立起主页和站点。公司通过网站发布产品信息、提供服务、寻求商业契机;而个人可以通过网页展示自己的才华和爱好并与他人交流。其中不知大家有没有考虑这样一个问题,就是设计和创建好的网页是如何显示在浏览器上的?笔者以几种不同网址输入格式为例,说说网页是如何具体工作的。
#1  一、标准的网址:域名+目录+文件名称
  这是最标准的网址书写格式,例如输入:http://www.yesky.com/zxxw/001.htm,其中www. yesky.com为计算机域名,zxxw为该计算机根目录下的一目录,001.htm为该目录下的一个具体文件。对于一般的html文件,Web服务器会直接把文件传回给浏览器。这种最标准的网址书写格式使得浏览器与Web服务器之间只有文件传输的关系。其具体的通信过程为:
  1.浏览器首先会通过www.yesky.com这样的域名来寻找存放网页的计算机服务器,如果找到,浏览器就会与该服务器联系,并建立信息传输通道使信息正确传输。
  2.信息通道建立好后,浏览器就会向服务器要求下载zxxw目录下的文件001.htm。
  3.文件下载成功后浏览器便会解释执行001.htm文件中的html标记,如果有图像,则下载图像文件,然后一起显示在浏览器窗口上。
#1  二、只有“域名+目录”的网址
  如果浏览器要查询的是目录,则Web服务器会判断这个目录是否含有默认文件,如果有,会将默认文件传给浏览器,没有则把目录的文件列表传给浏览器。例如http://www.yesky.com/news1和http://www.yesky.com/news2,这两个网址从表面上看都由域名和目录组成,news1 的子目录下放置有默认文件Index.html,news2目录下未放置默认文件。在浏览器地址框里输入第一个网址,一旦连接成功,服务器便把默认文件传回到浏览器端,最后解释执行该文件;输入第二个网址,返回的则是该目录下的文件列表, 这与FTP有点类似。如果服务器端不允许浏览器访问文件目录,浏览器端将会显示提示信息“不允许访问文件列表”,表明服务器端的一些设置要求必须明确指定要下载的具体文件名,如果浏览器没有找到要找的文件,则不允许下载其他文件或子目录。
#1  三、只有域名的网址
  其实最多的网址格式恐怕要数http://www.yesky.com这种类型,它等于http://www.yesky.com/,表示<http://www.yesky.com>+目录“/”。当我们把上述的网址输进浏览器地址框执行时,浏览器首先与计算机服务器取得联系并建立通信信道,然后就向服务器发出要下载该网站网页的请求。由于没有明确下载文件具体名称,服务器就默认下载文件为服务器根目录下的文件Index.html。因此一旦收到下载请求,服务器就自动把该文件传回到浏览器端。最后浏览器启动解释执行功能来解释运行Index.html文件,并把最后的执行结果显示在用户的面前。
#1  四、含有程序的网址
  如果浏览器要下载的是扩展名为ASP或CGI的脚本程序,那么Web服务器会自动启动解释程序,然后把程序执行的结果传回给浏览器。例如http://www.yesky.com/test.aspde 的网址结尾并不是以.html为扩展名,而是以.asp为扩展名,test.asp为可执行程序,浏览器不能对它进行解释,所以只能先在服务器上解释运行,如果程序中带有参数,如http://www.yesky.com/test.asp?NAME=ZYS&AGE=21 (NAME和AGE为参数),则在执行过程用到这两个参数,然后服务器将运行结果传回给浏览器。如在结果中遇到html标记,浏览器就启动解释程序,然后按html标记的要求把网页的内容显示在用户面前。