新工具有助于在大型遗传学研究中纳入各种血统的人
全基因组关联研究(GWAS)在寻找具有疾病风险的基因变异时,通常排除了多样性和少数个体。麻省总医院(MGH)、麻省理工学院(MIT)和哈佛大学(Harvard)的布罗德研究所(Broad Institute of MIT)以及世界各地的其他机构的研究人员现在已经开发了一种名为“拖拉机”(Tractor)的免费访问软件包,它增加了未被研究的人群中基因组学的发现能力。一项关于拖拉机性能和精度的研究发表在自然遗传学。
研究人员执行GWAS来确定导致疾病的基因变异在基因组中的位置。最近,遗传学家已经开始根据GWAS公布的数据创建模型来预测个体的疾病风险。但是这些模型的临床效用目前是有限的,因为大多数是基于欧洲人的基因组研究祖先.
“如果您在可用数据上建立疾病风险模型并试图将它们推断到不同的人口,预测将减少病人的准确性,”伊丽莎白阿特金森,博士,纸张和调查员MGH的分析和翻译遗传学单位(ATGU)。“这些误差会使现有的健康差异加剧,部分原因是我们未发现特定的基因变体,可能有助于各种人口中特定疾病的风险更高。”
目前GWA的另一个重要缺点是“他们为所有人口留在桌子上的遗传发现机会,”阿特金森说。例如,非洲人血统的人们平均超过了由于人类移民模式超过年龄的非洲祖先的人的遗传变化。Atkinson表示,用不同种群进行多元化种群的GWA允许遗传学家在整个基因组上的更多斑点上针对疾病进行遗传缔源。
“在GWAS中鉴定的这些基因组区域内,大部分时间都会在祖国中分享疾病的基因突变,”她补充道。通过研究与近期孤立的两个或多个祖先的祖先的血统人口群体,如非洲和欧洲 - “我们可以获得更强大和精确的遗传关联信号,并在取决于因果突变的情况下进行更好的工作,从而提高了对每个人对疾病的理解。”
到目前为止,在GWAS中研究的混合组中没有细微控制祖先组合物。“不同的祖先群体具有由于人口的人口历史而在不同频率下发生的基因变体,”阿特金森解释道。“在GWA中没有考虑到祖先会导致假阳性的命中或者基因变体取消自己,并被驳回并不重要。因此,在现在,排除来自GWA的多个祖国的人更容易排除有多个祖国的人,以避免被禁止被混淆基因变体的不同模式。“
然而,拖拉机允许研究人员以精确的方式考虑祖先,所以混合的个体可以包含在大规模基因发现努力中。根据其祖先起源,该软件颜色是每个人的染色体的碎片,研究人员可以从参考基因组序列推断,并在新的GWAS模型中使用这些信息。“拖拉机考虑了每个遗传变体的血栓骨干,因此我们可以正确校准GWAS结果以发现特定的因果变量人口群体,“阿特金森说。
拖拉机还提供了对血统特定效果尺寸的估计,这在标准GWA中是不可能的。“而不是获得特定的疾病风险效果大小的加权平均值基因变体Atkinson说,“拖拉机可以确定在不同的祖先群体中一个变异的影响是大还是小。”“这将为在不同人群中建立遗传风险评分提供信息。”Tractor的另一个优点是通过检测多个祖先之间的风险基因变异来提高GWAS的能力。阿特金森说:“使用Tractor,我们可以利用祖先基因组的差异获得更强的疾病关联信号。”
她补充说:“牵引车推进了现有的研究多种和少数群体复杂疾病的遗传学方法。”“我们希望这种方法能够在未来的大规模关联研究中增加混合参与者。”
用户评论