由同一基因编码的不同蛋白质在细胞中有着迥然不同的功能
兄弟姐妹之间的差异大于相似,这并不罕见:例如,一个成为花匠,另一个成为长笛手,另一个成为物理学家。
加州大学圣地亚哥医学院达纳-法伯癌症研究所和麦吉尔大学的科学家们领导的一项新研究发现,人类细胞中任何单一基因产生的蛋白质的“种类”都具有相同的多样性。在第一次大规模的系统研究中,研究人员发现大多数兄弟蛋白——由同一基因编码的“蛋白质异构体”——经常在组织和细胞中发挥完全不同的作用,无论它们在结构上多么相似。
这项研究今天发表在该杂志的网站上细胞这对人类生物学的理解和未来的研究方向产生了巨大的影响。首先,它可能有助于解释区区2万个蛋白质如何编码基因在人类基因组中——比葡萄基因组中发现的还要少——可以产生如此复杂的生物。科学家们知道,人类细胞中不同蛋白质的数量被认为超过10万种,远远超过了基因的数量,但仍有许多问题有待解决。这些蛋白质中的大多数在细胞中具有独特的功能,还是它们的作用有时重叠?同一基因编码的不同蛋白质异构体可能在更大的范围内具有不同的功能,这一发现表明,它们极大地增加了我们基因的能力。
研究作者表示,这种多样性也表明,每一种蛋白质亚型都需要单独研究,以了解其正常作用及其与疾病的潜在关系。
Dana-Farber癌症系统生物学中心(CCSB)副主任、联合资深作者David E. Hill博士说:“例如,对癌症相关蛋白质的研究通常集中在特定细胞、组织或器官中最常见的亚型上。”“由于较少流行的蛋白质异构体也可能导致疾病,并可能被证明是药物治疗的有价值的靶点,因此也应该研究它们的作用;为了做到这一点,我们还需要全面的克隆集合,涵盖所有表达的异构体。”
以前对蛋白质异构体的功能研究通常是在基因的基础上进行的。此外,研究人员经常将一个基因的“次要”亚型的活性与其在特定组织中的主要亚型的活性进行比较。这项新研究从更大的角度探讨了功能问题——通过收集数百个基因的多种蛋白质异构体,并比较它们如何与其他基因相互作用人类蛋白质.
细胞从单个基因中产生多种蛋白质异构体的方法之一是称为选择性剪接的过程。大多数人类基因包含多个被称为外显子的片段,由被称为内含子的非编码序列隔开。在细胞中,这些单独的外显子的不同组合被“粘合”或拼接在一起,以产生最终表达的基因产物;因此,单个基因可以编码一组不同但相关的蛋白质异构体,这取决于剪接的特定外显子。例如,一种亚型可能是由特定基因的a - b - c - d外显子拼接而成。另一种可能来自外显子C的跳过,导致产品只有外显子a - b - d。
在这项新研究中,研究人员设计了一种名为“ORF-Seq”的技术,使他们能够以开放阅读框架(orf)的形式识别和克隆大量交替剪接的基因产物,并使用它们为数百个基因产生多种蛋白质异构体。
在人类基因组中编码蛋白质的大约2万个基因中,研究人员集中研究了大约8%。使用ORF-Seq,他们最终为506个基因创建了1423个蛋白质异构体的集合,其中超过50%是全新的基因产物。他们对1035种蛋白质异构体进行了大规模筛选测试,将它们与15000种人类蛋白质配对,以观察哪种蛋白质会相互作用。
“令人兴奋的发现是,来自同一基因的异构体经常与不同的蛋白质伙伴相互作用,”达纳法伯学院的格洛丽亚·谢克曼博士说,她是该研究的主要作者之一。“这表明异构体在细胞内扮演着非常不同的角色”——就像不同职业的兄弟姐妹经常与不同的朋友和同事互动一样。
研究人员发现,在大多数情况下,相关异构体共享的蛋白质伴侣不到一半。16%的相关异构体完全没有蛋白质伴侣。“从细胞内所有蛋白质相互作用的角度来看,相关的异构体表现得更像不同的蛋白质,而不是彼此之间的微小变体,”达纳-法伯大学的佟浩(音)断言。
有趣的是,研究人员发现,源于DNA中微小差异的异构体——仅仅是遗传密码中一个字母的差异——有时在细胞中具有完全不同的作用。与此同时,在结构上截然不同的相关异构体可能具有非常相似的作用。
研究人员发现,通常情况下,相关异构体的相互作用伙伴因组织而异。例如,在肝脏中,一种亚型可能与一组蛋白质相互作用。在大脑中,该亚型的亲戚可能与一组迥然不同的蛋白质伙伴相互作用。
更详细的观点蛋白质正如我们论文中提出的那样,互动网络在人类疾病方面尤其重要,”加州大学圣地亚哥分校的共同资深作者莉莉娅·亚库切娃说。“剪接异构体之间相互作用伙伴的巨大差异强烈表明,在基因水平上识别疾病相关途径是不够的。这是因为不同的变异可能参与导致相同疾病甚至不同疾病的不同途径。现在是时候深入研究我们正在构建和分析的网络了。”