clustalx下载-ClustalX序列比对软件 v2.0 免费版

　　ClustalX多重序列比对软件可以帮助用户分析生物数据，将生物序列数据添加到软件就可以执行分析，支持进行完全对准、只做引导树、从引导树进行对齐、重新排列所选序列、重新调整选定的残留范围、将轮廓2与轮廓1对齐、对齐引导树中的轮廓、将序列与配置文件1对齐等数据处理和分析方案，也可以结合软件提供的树形菜单处理序列，在计算树之前，必须在内存中有一个ALIGNMENT，可以使用FILE菜单的LOAD SEQUENCES选项输入，或者您应该已经进行了完整的多重比对，并且比对仍在内存中，需要注意的是分析之前必须首先对序列进行对齐，新版添加了UPGMA算法以允许更快地构建树，用户现在可以选择使用邻居加入还是UPGMA。默认值仍然是NJ，但是用户可以通过设置clustering参数来更改此设置。

软件功能

　　CLUSTAL X（2.0

　　Clustal X是ClustalW多序列比对程序的Windows界面。它提供了一个集成的环境，用于执行多个序列和配置文件比对并分析结果。序列比对显示在屏幕上的窗口中。包含了通用的着色方案，可让您突出显示路线中的保守特征。窗口顶部的下拉菜单使您可以选择传统的多序列和谱图比对所需的所有选项。

　　您可以剪切和粘贴序列以更改比对的顺序。您可以选择要比对的序列子集；您可以选择要重新对齐的路线的子范围，然后重新插入到原始路线中。

　　可以进行比对质量分析，并且可以突出显示低分片段或异常残基。

　　ClustalX在Linux，Mac和Windows上可用。

　　序列输入

　　使用FILE菜单输入序列和概况（预先存在的比对术语）。无效的选项将被禁用。所有序列必须包含在1个文件中。自动识别7种格式：NBRF / PIR，EMBL / SWISSPROT，Pearson（Fasta），Clustal（* .aln），GCG / MSF（Pileup），GCG9 RSF和GDE平面文件。除用于指示GAP的“-”（MSF / RSF中的“。”）外，所有非字母字符（空格，数字，标点符号）都将被忽略。

　　序列/配置文件对齐

　　Clustal X具有两种模式，可以使用序列显示上方的开关进行选择：多重对齐模式和轮廓对齐模式。

　　要对一组序列进行多重对齐，请确保选择了多重对齐模式。然后显示单个序列数据区域。然后，ALIGNMENT菜单可让您生成用于对齐的引导树，或在引导树之后进行多重对齐，或进行完全多重对齐。

　　在PROFILE ALIGNMENT MODE中，显示两个序列数据区域，使您可以对齐2个比对（称为Profile）。配置文件还用于将新序列添加到旧比对中，或使用二级结构指导比对过程。旧版比对中的GAPS使用“-”字符表示。可以使用任何允许的格式输入个人资料；只需在每个间隙位置使用“-”（对于MSF / RSF，则使用“。”）。在配置文件对齐模式下，将显示“锁定滚动”按钮，您可以使用单个滚动条将两个配置文件一起滚动。当“锁定滚动”关闭时，两个配置文件可以独立滚动。

　　植物树

　　系统发育树可以从旧的比对（使用“-”字符读入以指示间隙）或在多次比对后仍显示比对的情况下计算得出。

　　对齐显示

　　比对显示在屏幕上，序列名称显示在左侧。序列比对仅用于显示，不能在此处进行编辑（通过剪切和粘贴序列名称来更改序列顺序除外）。

　　标尺显示在序列下方，从第一个残基位置的1开始（序列输入文件中的残基编号将被忽略）。

　　路线上方的线用于标记高度保守的位置。使用三个字符（“ *”，“：”和“。”）：

　　“ *”表示具有单个完全保守残基的位置。

　　“：”表示以下“强”组之一是完全保守的：

　　STA

　　NEQK

　　NHQK

　　NDEQ

　　QHRK

　　MILV

　　MILF

　　HY

　　FYW

　　“。”表示以下“较弱”组之一是完全保守的：

　　CSA

　　ATV

　　SAG

　　STNK

　　STPA

　　SGND

　　SNDEQK

　　NDEQHK

　　NEQHRK

　　FVLIM

　　HFY

　　这些都是出现在Gonnet Pam250矩阵中的正得分组。强和弱组分别定义为强得分> 0.5和弱得分= <0.5。

　　对于轮廓对齐，如果在轮廓输入文件中找到任何数据，则在序列上方显示二级结构和空位罚分蒙版。

软件特色

　　对准质量分析

　　质量得分

　　Clustal X通过绘制比对的每一列的“保守分数”来指示比对的质量。高分表示列保存良好；低分表示低保守性。质量曲线绘制在路线下方。

　　还提供了两种方法来指示在比对中得分很差的单个残基或序列片段。

　　低分数残基由于其自然进化过程而稳定发散，因此预期在所有序列中均以中等频率出现。差异最大的序列可能具有最多的异常值。但是，突出显示的残基在指出序列错位时特别有用。请注意，突出显示的残基会聚在一起，强烈表明未对齐。这可能是由于多种原因引起的，例如：

　　由于对齐算法失败而导致的部分或全部未对齐。通常仅在困难的对齐情况下使用。

　　部分或全部错位，因为给定集合中的至少一个序列与其他序列部分或完全不相关。由用户检查序列集是否可比对。

　　蛋白质序列中的移码翻译错误会引起局部错配区域的突出显示。这些在数据库条目中非常常见。如果怀疑，则需要检查源DNA的3帧翻译。

　　有时，突出显示的残基可能指向具有某些生物学意义的区域。例如，如果蛋白质比对包含相对于主要序列集具有新功能的序列，则可能发生这种情况。重要的是在调用生物学解释之前，应排除其他解释，例如错误或序列的自然差异。

　　低分部

　　可以使用“低得分线段”选项突出显示路线中不可靠的区域。序列加权配置文件用于指示序列中评分不佳的任何片段。由于轮廓计算可能需要一些时间，因此提供了一个选项来计算低速分段。然后可以打开或关闭段显示，而不必重复耗时的计算。

　　有关低得分细分计算的详细信息，请参见下面的“计算”部分。

安装方法

　　1、打开clustalx.msi软件直接安装，点击next

　　2、提示软件的安装地址C:\Program Files (x86)\clustal\clustalx\

　　3、提示软件的安装准备界面，点击install

　　4、clustalx成功安装到电脑，点击finish结束安装

使用说明

　　1、点击 Load Sequences功能添加需要分析的序列，如果你有序列文件就加载

　　2、小编电脑没有序列文件所以就无法执行分析了，用户在分析的过程也可以选择追加序列

　　3、这里是软件的编辑功能，可以选择剪切序列、粘贴序列、选择所有序列、选择配置文件1、选择配置文件2

　　4、点击Alignment Parameters可以显示多种对齐方式，可以设置蛋白质数据对齐

　　5、点击Iteration显示迭代内容，支持没有、重复每个对齐步骤、迭代最终对齐

　　6、树形目录，支持画树、Bootstrap N-J树、排除职位空缺、更正多个替代、输出格式选项、聚类算法

　　7、颜色设置功能，支持背景着色、黑和白、默认颜色、加载颜色参数文件

　　8、质量分析；显示得分较低的细分、显示异常残基、低分段参数、列分数参数、将列分数保存到文件

　　9、更多的功能可以点击帮助查看软件相关的操作方式

官方教程

　　低分段参数

　　片段的最小长度：可以通过增加将要显示的片段的最小长度来隐藏短片段（甚至单个残基）。

　　DNA MARKING SCALE用于从突出显示的显示中删除不太重要的片段。增加比例以显示更多细分；减小比例以去除最低有效位。

　　蛋白质重量矩阵：评分表，描述每种氨基酸之间的相似性。该矩阵用于计算序列加权谱得分。提供了四种“内置”对数赔率矩阵：Gonnet PAM 80、120、250、350矩阵。当序列紧密相关时，仅对身份和最喜欢的保守替换给出高分的更严格的矩阵可能更适合。对于更发散的序列，使用“较软”的矩阵是合适的，该矩阵对许多其他频繁的替换给出较高的分数。此选项会自动重新计算得分较低的细分。

　　DNA权重矩阵：提供两种硬编码矩阵：

　　IUB。这是BESTFIT用于比较核酸序列的默认评分矩阵。 X和N被视为与任何IUB模糊度符号的匹配。所有比赛得分1.0； IUB符号的所有不匹配得分均为0.9。

　　CLUSTALW（1.6）。 ClustalW使用的先前系统，其中匹配项得分为1.0，不匹配项得分为0。IUB符号的所有匹配项也得分为0。

　　如果文件名仅包含小写字符，则可以从磁盘上的文件读取新矩阵。新的权重矩阵中的值应该相似并且对于不频繁的替换应该为负。

　　输入格式。用于新矩阵的格式与BLAST程序相同。任何以“＃”字符开头的行均被视为注释。第一个非注释行应包含一个任意顺序的氨基酸列表，使用1个字母代码，后跟一个“ *”字符。然后是分数的方阵，每个氨基酸一行一行，一列。矩阵的最后一行和最后一列（对应于“ *”字符）包含整个矩阵的最小分数。

　　质量得分参数

　　您可以使用以下选项来自定义在对齐显示下方绘制的“质量得分”列。

　　SCORE PLOT SCALE：这是一个从1到10的标量值，可用于更改质量得分图的比例。

　　残渣排除：这是一个标量值，范围是1到10，可用于更改在比对显示中突出显示的残渣例外的数量。（有关此临界值的说明，请参见下面的“残留物的计算”部分。）

　　蛋白质重量矩阵：评分表，描述每种氨基酸之间的相似性。

　　DNA权重矩阵：提供两种硬编码矩阵：IUB和CLUSTALW（1.6）。

　　显示多余的残留物