万丈高楼平地起──压缩基础知识

Author: Date: 2001年 26期

?牐犓窖顾跷募窃诘缒灾衅毡槭褂玫奈募墙胀ǖ谋曜嘉募匦卤嗦耄梢恢志×可僬加么排炭占涞奈募庵治募统莆顾跷募Q顾跷募袷饺酶枨募。子诒4婧驮贗nternet上传播。压缩技术使得音频文件更易于存储和传播。音频文件的压缩一般是去除人类听觉范围之外的音频,这种压缩是一种有损压缩。举例来说,一个未经压缩的50MB的WAV文件,压缩成MP3、WMA或Mjuice(.MJF)文件时可能只有5MB。
  #1?牐犙顾踉?
  ?牐牶芏嗳硕季煊谘顾跫际醯纳衿妫桓鑫募谎顾醭梢话氪笮。我阅芪匏鸹乖兀?
  ?牐犜缙谑褂玫难顾跫际醵蓟谕臣颇P停?20世纪80年代初基于字典压缩的新技术才慢慢推广开来。
  ?牐犑菅顾醢朔浅6嗟娜砑陀布际酰庑┘际醺鞑幌嗤谴蠖嗍顾跞砑际腔贚Z77、LZ88算法并加以修正而成,而LZ77是字典压缩的起源。大家都知道一个文本文件是由一些单词组成,而且必定有重复现象发生,例如我们这里经常出现的“压缩软件”一词,压缩的原理就是在文件的头部做一个类似字典的东西,把“压缩软件”这个词放在“字典”中,并为这个词指定一个占较少字节数的编码,而文章中的“压缩软件” 一词均用此编码代替,以达到压缩的目的。当然压缩软件在实际运作中并非如此简单,还要使用一些看了就头痛的演算方法,在此就不一一细述。也许有人会问,文本文件可用字典技术,那其它文件怎么办呢。这就无须操心了,因为对于压缩软件来说,一个文件中的“数据压缩”一词和“@#¥%^” 是一样的,关键在于冗余码(重复部分)的多少。
  #1?牐犙顾醭J?
  ?牐牥囱顾醴绞椒郑河兴降摹巴该餮顾酢焙汀按虬顾酢薄?
  ?牐牎巴该餮顾酢币话阏攵?.exe和.com文件,直接压缩。成功的话,文件体积变小,功能不变,运行速度还可能更快。但是,这种压缩方法的对象面很窄。如果压缩失败,还会造成文件不可用。所以,这一类程序总是强烈要求用户在压缩前将文件备份。
  ?牐牎按虬顾酢本褪窍衷诔L岬降难顾跞砑褂玫难顾醴āK岩桓龌蚨喔鑫募顾醭梢桓鑫募顾醢R褂醚顾鹾蟮奈募匦胂冉庋菇募丛K奶氐闶欠缦招。视糜诩跣〔怀S玫奈募伎占浜痛涫荨5比唬凑昭顾跛惴ǎ颐腔箍梢越顾醴殖珊芏嘀帧?
  ?牐犚话阄颐窃谔傅窖顾跏保崽岬叫矶嘞喙厥跤铮旅嫖颐蔷吞岢鲆恍┏<氖跤锝薪馐汀?
  ?牐犙顾醺袷剑貉顾跷募笔褂玫难顾醣嗦敕椒ú煌顾跎傻奈募峁咕筒煌庵盅顾跷募峁咕统蒲顾醺袷健?
  ?牐犙顾醣嚷剩何募顾鹾笳加玫拇排炭占溆朐募谋嚷食蒲顾醣嚷省T诔S玫难顾醺袷街校琑AR格式压缩比率较高,ZIP格式较低。但ZIP格式的文件操作速度较快。
  ?牐牻庋梗航顾跷募乖纠吹奈募袷剑渤剖头拧⒗┱埂?
  ?牐犙顾醢阂话憬ㄓ醚顾醺袷降奈募莆顾醢鏩IP格式压缩文件。这种文件可以在压缩工具的管理下对包中压缩的文件进行管理,如查看、删除、添加等。
  ?牐牬虬航募顾醭赏ㄓ醚顾醺袷降难顾醢募莆虬仓附募顾跆砑拥窖顾醢?
  ?牐牰嗑硌顾酰航顾醯奈募殖杉父鲅顾跷募莆嗑硌顾酰话闶俏私顾跷募⒋嬖诙喔鋈泶排躺匣蚍奖阃洗洹?
  ?牐犠越庋刮募航募顾跎煽芍葱械奈募缓笤诿挥醒顾豕ぞ叩陌镏拢ü葱醒顾醯奈募涂山约旱脑次募庋够乖隼础?
  #1?牐犙顾跷募袷?
  ?牐犇壳傲餍凶哦嘀盅顾跷募袷剑旅嫖颐蔷屠纯纯吹降子心男┌桑?
  ?牐燴IP:目前最流行的压缩文件格式(在Internet上,ZIP文件已经取得了绝对胜利。在日常操作中,除专门的压缩软件之外,许多文件管理程序,如Windows Commander等也都支持ZIP格式)。我们可利用WinZip对ZIP文件进行解压、释放等操作,还可以用它来处理ARJ、ARC、CAB、LZH等多种不同格式的压缩文件,从而大大地方便了用户的操作。
  ?牐燫AR:是一种高效快速的文件压缩格式,但不被大多数文件压缩程序支持,WinRAR是在Windows下处理RAR格式文件的最好工具。
  ?牐燗RJ:由DOS下曾经红极一时的压缩软件ARJ压缩而成的文件格式,它具有功能强大、压缩率高等优点。到了现在的Windows时代,它已经没有了往日的辉煌。
  ?牐燙AB:是Windows 98新增的一种特殊压缩文件格式,主要用于对有关软件安装盘中的文件进行压缩,其特点是压缩率非常高(可能是目前最高的),但一经压缩就不能再进行任何增加、删除、替换等修改,也就是说它的压缩包具有“只读”属性。我们也可使用WinZip对CAB压缩包进行操作。
  ?牐???_:软件安装盘所采用的一种压缩文件方式,如*.ex_、*.dl_、*.d3_等,它们一般由系统直接解压并完成安装工作,无须用户操心。当然,我们也可使用DOS的EXPAND命令对*.??_文件进行释放操作。
  ?牐燯U/UUE:汉字编码方式,它们原本是Unix系统中使用的一种编码方式,后来被改写到DOS中,我们在传送中文邮件时只须事先使用该方式进行编码,此后就能顺利通过只能处理7位编码的邮件服务器,从而解决了汉字的传输问题。
  ?牐燗CE:一种新式的压缩程序,压缩比很高。
  ?牐犃硗猓琈P3、MPEG、JPG等音频、视频、图像格式的文件也都采用了压缩技术,从理论上来说它们也应该算压缩文件,不过它们所采用的压缩方式并不相同,这里简单地介绍一下:
  ?牐燡PEG:JPEG 全名为 Joint Photographic Experts Group,它是一个在国际标准组织(ISO)下从事静态影像压缩标准制定的委员会。它制定出了第一套国标静态影像压缩标准:ISO 10918-1 就是我们俗称的JPEG了。由於JPEG优良的品质,使得它在短短的几年内就获得极大的成功,目前网站上80%的影像都是采用JPEG的压缩标准。
  ?牐燡PEG 2000:正式名称为“ISO 15444”,同样是由JPEG 组织负责制定。JPEG 2000与传统 JPEG 最大的不同,在于它放弃了JPEG所采用的以离散余弦转换为主的区块编码方式,而改以小波转换为主的多解析编码方式。其压缩率比 JPEG高约30%左右,同时支持有损和无损压缩,无损压缩对保存一些重要图片十分有用。
  ?牐燤P3:这个大家应该都认识它了,MP3全称是MPEG 1 Layer 3,是一种高性能的声音压缩编码方案,它可以做出超小“体积”的音乐文件,大小只是原始音频数据的1/10到1/12。但人耳听起来,效果却没有太大差异。它一出世就几乎占领了电脑音乐领域,由于MP3的出现,过去在因特网上半小时才能下载完的一首歌曲,现在以MP3格式仅需短短的几分钟就可以“搞定”。
  ?牐燤PEG:MPEG是Moving Pictures Experts Group(动态图像专家组)的缩写。现在使用的有4个版本:MPEG-1、MPEG-2、MPEG-3、MPEG-4。