一些难以破解的基因组区域携带着使我们与众不同的基因
本周,美国国家人类基因组研究所(National human genome Research Institute)公布了首个完整的、无间隙的人类基因组序列,华盛顿大学医学院的基因组科学家是该序列发表的主要贡献者之一。
西雅图华盛顿大学(University of Washington)基因组科学教授埃文·埃克勒(Evan Eichler)的实验室是《人类基因组的完整序列》(The complete sequence of The human genome)这篇主要论文的主要贡献者之一科学4月1日。这一成就是一个名为端粒到端粒(简称T2T)的大型联盟的成果,该联盟旨在获得所有23种基因的完整序列人类染色体端到端。
埃奇勒的团队和来自其他机构的合作者还发表了一篇配套论文,首次对高度相同的大重复区域(称为分段重复)及其变异提供了全面的看法人类基因组.
人类基因组的这些区域对于理解它们至关重要人类进化而且遗传多样性以及对许多疾病的抵抗力或易感性。2万人中基因在人类基因组中,大约有950个基因起源于片段复制。
然而,由于分段复制的复杂性,它们是人类基因组装配中最后被完全测序的区域之一。
解决这些区域的愿望是推进测序技术的动力之一,比如读取长段DNA的能力。这些技术,以及许多实验室工具、计算生物学方法和其他重要的研究资源,在20多年前首次起草人类基因组时还不具备。
埃奇勒实验室领导的研究小组在一篇伴刊中报告了他们的结果和分析科学本周发表了一篇题为“完整人类基因组中的片段复制及其变异”的论文。这篇论文的主要作者是密歇根大学医学院基因组科学博士后Mitchell R. Vollger。他应用了计算机科学、数据可视化和数学方面的技能来分析新的基因组重复,以进一步了解人类在片段重复中的变异。他们与埃希勒实验室的研究生菲尔·迪什克(Phil Dishuck)合作,表明人类基因组的完成增加了大约180个“新的”蛋白质编码基因,几乎所有这些都映射到片段重复。
“当我还是个孩子的时候,我在2001年看到了关于完整人类基因组的杂志封面,”Vollger回忆道。“我记得我当时认为这是最酷的项目,我有多失望,因为我永远不能做这么酷的事情。在这个项目中,我想了很多,我要为人类基因组测序做出贡献,这让我非常兴奋,我有机会这么做。”
从最近对这些区域的测序中发现了一些有趣的发现。
除了完成组装的医学研究意义之外,它还有bob88体育平台登录助于回答:我们的基因组中包含了什么,使我们成为独特的人类?有些基因是原始基因组中的缺口,现在被认为在帮助人类形成比其他类人猿更大的大脑方面至关重要。
埃奇勒的实验室还从其他非人类灵长类动物基因组中生成了长读序列,并将其与新的无间隙人类基因组序列进行了比较。他们系统地重建了一些生物医学相关基因的进化,以及某些人类特有的复制基因。
这些人类特有的片段复制是新基因的储存库,驱动发育中的大脑形成更多的神经元,并增加神经突触的连通性额叶皮质-大脑的解剖学部分,在这里发生一些高级的思考,推理,逻辑和语言功能,似乎是人类的特征。
在TBC1D3,一个基因家族埃希勒实验室的研究生哈维·吉塔特(Xavi Guitart)的分析显示,在灵长类动物进化的不同阶段,会出现周期性和独立的扩张。最近的一次是在大约200万到260万年前,大约在那个时候人类出现了。令人惊讶的是,人类TBC1D3基因家族在样本的一个子集中表现出显著的、大规模的结构变异。
“不同的人有着完全不同的补充和安排TBC1D3基因家族,”研究人员在他们的论文中解释道。对于一个被认为对大脑功能如此重要的基因来说,这是出乎意料的。科学家们还发现了复杂结构的多样性LPA基因,这种脂蛋白基因的部分变异是由血液中血脂水平异常引起心血管疾病的最重要遗传风险因素。
研究人员还观察了SMN(一种运动神经元基因),其突变与某些神经肌肉疾病有关。脊髓肌萎缩区是5号染色体上最难完成的区域之一,对这一区域有更好的序列分辨,可能在疾病风险判定和作为复制基因的治疗中都具有实际优势SMN2是最有效的基因疗法之一的靶点。
基于这些和其他发现,科学家们指出,新的参考基因组“揭示了对神经发育和人类疾病非常重要的基因中前所未有的人类遗传变异水平。”
最近完成的人类基因组不仅是人类生物学新知识的来源,还可能回答细胞生物学的一些基本问题。例如,组装将有助于更好地理解人类每条染色体中着丝粒的差异。着丝粒的问题会引起细胞分裂的困难。
对着丝粒序列的研究可以找到导致细胞分裂和细胞间遗传物质分配出错的根源。这包括癌症以及影响产前发育的异常,如唐氏综合症或罗伯逊易位。
威斯康星大学医学院基因组科学博士后Glennis a . Logsdon已经有了几个与着丝粒测序相关的发现。
“我们必须开发针对这些地区的新方法,”她解释说。“为了跨越这些区域,我们利用了即将出现的新技术,比如超长读取测序。我们还努力完善基因组序列,以确保它高度准确。”
Eichler评论了T2T项目中早期职业人类基因组研究人员所接受的培训和经验。
“我认为能够真正帮助培养下一代科学家是一种荣幸,”他说。“看到他们从学生开始,为一个大项目做出贡献,然后把它推进到下一个阶段,真是太有趣了。”
早在2001年,埃奇勒就参与了最初的人类基因组计划。他对基因组中复杂的区域很感兴趣,因为它们高度重复,但也编码基因。
当结论的时候人类基因组序列项目被宣布了,很多区域都没有完成。
埃奇勒补充说,从那时起,他就有了完成这些作品的强烈愿望。
“我总是回到这一点上,要全面了解基因变异,我们需要有一个完整的参考。否则,我们就会失去拼图的一部分。对某些人来说,已经解决了95%的难题已经足够好了。但我想,对我来说,获得最后的5%非常重要,因为我相信,我们对疾病或进化的很多不了解,都不成比例地体现在我们没有首先排序的那5%基因组中。”
这还没有结束,他说。“尽管人们会说,‘好吧,我们完成了基因组。我们完成了一个基因组.在接下来的几年里,将会有成百上千的基因组出现。我认为我们对人与人之间差异的看法将会发生转变,更复杂的基因变异不仅对我们人类的形成,而且对我们的不同也很重要。”