蛋白分析领域的“重磅炸弹”——ANTHEPROT 4.3

Author: 谈杰 Date: 1999年 第29期 15版

  对蛋白质的研究是生物化学领域中一个非常重要的部分。近年来,随着基因工程技术的发展与蛋白序列自动测定技术的完善,使我们很容易便能得到大量的蛋白序列数据。但是,用人工的方法是不可能完成其理化特性描述、二级结构预测、类似片段查找等大量数据分析工作的。利用计算机,运用一定的运算规则和网络上免费提供的蛋白数据库,进行蛋白序列分析是唯一有效的方法。蛋白序列分析软件包ANTHEPROT 4.3正是这样的一个工具软件。ANTHEPROT 4.3分为三个版本,分别用于Unix系统、DOS系统与Windows 9x系统。我以Windows系统的版本为例,介绍一下这个软件的基本用法。
#1  一、序列编辑功能
  ANTHEPROT 4.3的主窗口便是其序列编辑窗口。可以使用File/Open命令打开各种序列文件,程序可识别多种文件类型。序列可以从ANTHEPROT编辑窗口以键盘输入,或者以*.SEQ等文件格式载入,也可以从其它文件复制粘贴到编辑窗口。最简单的序列格式是Pearson/Fasta格式,为文本格式文件。输入或载入序列后,便同时打开了一个图像窗口,以彩图的形式显示出蛋白序列,不同的蛋白残基以不同的颜色表示。^291501a^1便是打开一个序列后的主程序窗口的例子。
#1  二、工具栏与基本功能
  当序列格式识别后,Methods菜单便被激活,对应主菜单各项命令的快捷按键也出现在工具栏中(^291501b^2)。
#1  三、基本分析工具介绍
  除了通过单击快捷按键的方式进行各种蛋白序列分析,通过菜单进行各种操作也非常方便。下面让我将一些主要分析工具的功能介绍一下:
  1. 点阵图(Dot Plot)
  Dot Plot分析方法对以下分析工作非常有用:
  * 在一条序列内查找重复序列
  * 在2条序列中不同位置查找类似片段
  * 在不同序列中查找同源性
  只有当程序载入一条序列时,才可以激活Dot Plot程序。选择菜单命令Dot Plot,选择要进行比较的第二条序列。^291501c^3为含有两个蛋白酶序列的点阵图,两个酶具有同源性。
  2. 类似性查找(Similarity Search)
  此程序用来在一个蛋白数据库(可以是本地数据库,也可是网上的数据库)中,找出所有与给定序列具有同源性的序列。选择菜单命令Methods/Similarity Search/WWW or Local Fasta或者Methods/Similarity Search/WWW-Blast at PBIL NPS@ server 便可实现在蛋白数据库中对类似蛋白序列的查找。需注意,如果在本地蛋白数据库中查找,需要先下载SwissProt蛋白数据库。
  3. 查找(Site/Signature)
  在主窗口选取菜单命令Methods / Site detection (Prosite),便进行位点与特征序列的查找。程序查找给定序列是否存在PROSITE数据库中已定义的特征序列,缺省设置为100%匹配,也可设定为Mismatch 1 or 2(一到两个不匹配)或者Similarity level(类似水平)。当前PROSITE数据库是1995年2月发布的,共1054个不同位点与特征序列,含两个文件,PROSITE.DAT 与PROSITE.DOC。这两个文件必须放在ANTHEPROT程序的目录下,程序才能进行。^291501d^4为查找结束后程序输出的结果。
  4. 在序列数据库中查找一个自定义的特征序列(Pattern Search)
  选择菜单命令Databases/Pattern search,便开始在网上的蛋白数据库或本地蛋白数据库中查找含有自定义特征序列的蛋白。所定义的特征序列必须符合PROSITE规定的语法。
  5. 预测物理化学特性曲线
  ANTHEPROT 4.3可以用图示的方法显示出被预测蛋白质的物理化学特性曲线,^291501e^5为一个亲水性特性曲线的例子。在图中,一个可移动的光标显示了目前在序列中的位置为115,此位置的氨基酸残基(L)显示为红色,同时显示前后各5个残基(为AIIHVLHSRHP),特性值(-7)与参数(5)也显示在图中。程序可显示输入序列的多种物理化学特性曲线。
  6. 二级结构预测
  ANTHEPROT 4.3提供了几种方法进行蛋白质二级结构预测,包括:
  * GOR I方法
  * Gibrat方法
  * Double Prediction Method - DPM方法
  * Homologue方法
  * Predator方法
  * 或全部使用以上几种方法。
  7. 计算蛋白序列分子量,比容与各蛋白残基百分组成
  程序可以非常方便地对蛋白序列进行分子量、比容与各蛋白残基百分组成的计算。选取Methods/AA Composition, specific volume, M.Weight进行计算。快捷键为Ctrl+M。
  8. 计算蛋白序列滴定曲线与等电点
  ANTHEPROT 4.3还可根据一定算法,对输入的蛋白序列计算滴定曲线与等电点。选取Methods/Titration curve进行计算,快捷键为Ctrl+U。输出图形如^291501f^6。
  9. 选定一个片段后,绘制Helical Wheel图
  ANTHEPROT 4.3还可先选定一个蛋白片段,绘制其Helical Wheel图。选取Methods/ Helical Wheel进行计算与绘制。在二级结构预测输出窗口,用鼠标左键定义起始点,用鼠标右键定义结束点,选择菜单命令Helical Wheel,也可很方便的绘制此定义片段的Helical Wheel图。输出图形的例子如^291501g^7。
  10. 进行潜在的信号肽与断裂位点预测
  ANTHEPROT 4.3还对输入的蛋白片段,进行潜在的信号肽与断裂位点预测。选取Methods/Potential cleavage site of signal pept.,再选择是原核序列或真核序列便可进行预测。
#1  四、结果的输出以及与其它应用程序进行数据交换
  ANTHEPROT 4.3所输出的所有文字、结果图形与曲线,均可以打印,也可以拷贝到剪贴板,粘贴到其它应用软件如WORD中,或者输出为*.BMP格式的文件,使用其它软件进行再编辑。程序的缺省设置将输出图形背景色设为黑色,在所有图形输出窗口,均可以以Invert Mode(即黑白反色模式)输出,或者可以在Options菜单中由用户定义背景与前景颜色。
  总的来说,ANTHEPROT 4.3蛋白序列分析软件包可以极大地加快研究蛋白序列的速度,并且能够获得具有发表质量的图表与数据。它对生物化学工作者来说,是一个不可多得的好软件。可以毫不夸张地说,ANTHEPROT 4.3蛋白序列分析软件包是蛋白分析领域的“重磅炸弹”。下载网址:ftp://ftp.ibcp.fr/pub/ANTHEPROT/Windows或http://biosoft.yeah.net,后者还有许多其它的生物化学相关软件可供下载。
  编者按:真不敢相信自己的眼睛,如此优秀的一款专业软件竟然是完全免费的!同时也真心地替我们的生物化学工作者们感到高兴,因为他们可以站到一个更高的起点……Let's make things better!