以很小的成本推断人类基因组有望促进生物医学研究bob88体育平台登录
成千上万的遗传标记已经与复杂的人类特征紧密相关,如阿尔茨海默病、癌症、肥胖或身高。为了发现这些关联,研究人员需要在数百万个遗传位点或标记上比较许多个体的基因组,因此需要具有成本效益的基因分型技术。由瑞士SIB生物信息学研究所和洛桑大学(UNIL)的Olivier Delaneau小组开发的一种新的统计方法提供了改变游戏规则的可能性。只需不到1美元的计算成本,GLIMPSE就能从非常少量的数据中统计出完整的人类基因组。该方法为目前依赖预定义遗传标记集的方法提供了第一个现实的替代方案,因此可以更广泛地包括代表性不足的人群。这项研究表明,在生物医学研究中数据生成的范式转变,发表在bob88体育平台登录自然遗传学.
一种具有成本效益的方法来探测遗传标记
信号低整基因组测序(LC-WGS)和基因型imputation是一种可以从非常低的测序工作量中统计推断整个基因组的方法。它被认为是SNP阵列的一种更少偏见和更强大的替代方案(见方框),但其高昂的计算成本阻止了它成为一种广泛使用的替代方案。由SIB和UNIL的小组组长Olivier Delaneau领导的科学家团队开发了一种开源软件最终克服了这些问题。Olivier Delaneau解释说:“与其他LC-WGS方法相比,GLIMPSE提供了一个速度快10- 1000倍的框架,因此更便宜,同时对罕见的遗传标记更准确。”“GLIMPSE能够以不到1美元的计算成本,极大地增强数百万个标记的低覆盖率基因组,使其成为SNP阵列的第一个真正替代品。”
迄今为止,全基因组关联研究主要集中在欧洲人身上:80%的GWAS参与者是欧洲血统的个体,但这些人只占世界人口的16%。这是一个重要的伦理问题,涉及到医疗保健的包容性和公平获得的利益生物医bob88体育平台登录学研究因为遗传标记对疾病易感性的影响在不同人群中是不同的。LC-WGS自然地规避了预先建立的集合的固有偏见遗传标记(SNP数组)。因此,它可以成功地应用于代表性不足的人群,正如本研究对非洲裔美国人进行的概念证明所示。Olivier Delaneau团队的博士后研究员、该论文的第一作者Simone Rubinacci说:“除了打破资金障碍,使基于LC-WGS的GWAS研究成为可能之外,这种方法真正令人兴奋的是,它使研究人员能够有效地发现未被研究人群中的关联。”
利用已经测序的基因组
“我们最初的想法是:我们能利用测序基因组的财富来改善那些新测序的基因组吗?换句话说,花更少的钱得到更多:这正是GLIMPSE所做的,”Olivier Delaneau小组的博士后研究员、该论文的合著者Diogo Ribeiro解释道。它是如何工作的?我们都有相对较近的共同祖先,我们的DNA中有一小部分是从祖先那里遗传来的。简而言之,GLIMPSE挖掘了大量已经非常精确测序的人类基因组(高覆盖率WGS),以识别与新测序的基因组共享的DNA部分。这样,GLIMPSE可以可靠地填补低覆盖率数据的空白。
未来基因组研究的新范式,具有广泛的应用
作为开源工具套件的一部分,GLIMPSE为广泛采用低覆盖率WGS铺平了道路,促进了WGS的开发思考模式的转移为未来的基因组研究生成数据。自该软件于2020年4月首次以预印本形式发布以来,正在进行的研究已经开始使用该工具,例如从古代DNA重建数千年前人们的基因组,或作为GWAS研究的一部分,从SARS-CoV-2鼻咽拭子重建COVID-19患者的基因组。
进一步探索