蛋白质组全谱数据分析
实验介绍蛋白质组的定义
蛋白质组(Proteome)指由一个基因组或一个细胞、组织表达的所有蛋白质。在转录时,一个基因可以多种mRNA形式剪接,一个蛋白质组不是一个基因组的直接产物,蛋白质组中蛋白质的数目有时可以超过基因组的数目。
蛋白质组全谱分析的意义
蛋白质全谱分析目的在于识别出生物组织、血液或提取物中尽可能多的肽和蛋白质混合物的组分,基于高精度液质联用技术的蛋白自全谱分析,可以对蛋白质混合物进行组分分析,并进行相应的生物信息分析包括蛋白质的鉴定、GO分类和代谢通路的分析等,为蛋白质组学提供有力工具。
全谱分析适用范围:
蛋白质全谱分析适用于肽和蛋白质的鉴定及特殊生理状态下的整体规律研究。
服务流程:
蛋白质全谱分析内容:
1.质谱原始数据格式转换,得到质谱峰图
图1. 蛋白质原始质谱数据解谱
2.原始数据质量筛选,确定多肽片段序列,数据统计
图2. 根据打分值确定多肽序列片段
3.查询nr/swissprot等数据库,鉴定蛋白,数据统计
图3. 数据统计:(左)每个质谱图对应的peak数目分布(右)鉴定到的每个蛋白对应的多肽片段数分布
4.查找特定生理状态下的特有蛋白质,进行后续个性化分析
图4. 对感兴趣的蛋白质利用STRING构建蛋白质互作网络
图5. 筛选到的关键蛋白三维结构展示(图像来自PDB数据,从左到右依次为:蛋白质三维结构,通路中蛋白蛋白相互作用,蛋白质与抑制剂的相互作用)
图6. 可能的关键蛋白的抑制剂
参考文献[1] Szklarczyk, D., Franceschini, A., Kuhn, M., Simonovic, M., Roth, A., Minguez, P., Doerks, T., Stark, M., Muller, J., Bork, P., Jensen, L.J. and von Mering, C. (2011) The STRING database in 2011: functional interaction networks of proteins, globally integrated and scored. Nucleic Acids Res. 39, D561–D568
[2] Shannon, P., Markiel, A., Ozier, O., Baliga, N. S., Wang, J. T., Ramage, D., Amin, N., et al. (2003). Cytoscape : A Software Environment for Integrated Models of Biomolecular Interaction Networks, (Karp 2001), 2498–2504.
[3] D.W. Heinz, W.A. Baase, F.W. Dahlquist, B.W. Matthews (1993) How Amino-Acid Insertions are Allowed in an Alpha-Helix of T4 Lysozyme Nature 361:561.
[4] H.R. Drew, R.M. Wing, T. Takano, C. Broka, S. Tanaka, K. Itakura, R.E.Dickerson (1981) Structure of a B-DNA dodecamer: conformation and dynamics Proc.Natl.Acad.Sci.USA 78: 2179-2183