在过去的几十年,蛋白质序列测定的目的已经发生改变。其最初目的是确定蛋白质的全部或部分序列,以便更好地了解其结构和功能。分子生物学的出现提供了另一种更快速的方法,即通过对相应基因的测序来实现。设计寡核苷酸探针(用于基因克隆过程)和确认分离出的克隆确实是相关的部分都需要部分蛋白质序列。随着全基因组测序的发展,我们离获知所有基因(也可以说是所有蛋白质)序列的不远了。然而,就目前我们对基因序列的了解,并不能为我们提供有关蛋白质功能的重要信息,例如分子间和分子内二硫化物键合模式、修饰或其他处理方式。

蛋白质序列测定则能实现这个功能,并且可以鉴定与特定发展阶段或疾病的发生相关的蛋白质。此方法中,结合其他特性(如蛋白质分子量、pI或数量),仅需一段几个残基那么长的短序列就可用已知基因序列数据库进行筛选。蛋白质序列测定在保证“生物制药”(分子生物学革命的产物)重组治疗性蛋白质的品质上也扮演着重要角色。蛋白质序列测定在保证“生物制药”(分子生物学革命的产物)重组治疗性蛋白质的品质上也扮演着重要角色。

biopython获取蛋白质序列的pssm_数据库


Edman测序反应过程(图片来源:百泰派克)

目前,Edman降解法是蛋白质测序最常用的方法之一。近年来,在各种质谱方法的不断补充和完善,Edman降解法现在可用于鉴定蛋白质及其衍生物的质量,并能根据目标肽到单个氨基酸残基的片段化模式确定肽的序列。通过该法,比对重组蛋白插入位点和表达顺序是否正确,以此实现对蛋白表达产物的验证。此外,Edman降解蛋白质测序法还有很多其他用途,此处借鉴了百泰派克生物所概括的:

(1)验证蛋白表达产物:重组蛋白插入位点和表达顺序是否正确
(2)验证细胞株建立和发酵过程中蛋白产物:验证细胞株建立和发酵过程中蛋白产物N端甲硫氨酸和信号肽是否正确处理;
(3)分析蛋白降解/酶切:对降解/酶切形成的新蛋白片段N端进行分析,确定断裂/酶切位点;
(4)De-novo测序:对于蛋白数据库中不存在的全新蛋白序列进行分析。