新的在线资源有助于将罕见的遗传变异与人类健康和疾病联系起来
2006年,研究人员发现,携带PCSK9基因某些变体的人的胆固醇水平明显低于普通人群。拥有两个断裂基因副本的人(父母双方各有一个)比PCSK9功能正常的人患冠心病的可能性低88%。在这些发现的12年里,科学家们开发出了模仿关闭该基因效果的药物,医生们开始开这些药物来降低病人的胆固醇。
现在,麻省理工学院和哈佛大学布罗德研究所的研究人员创造了一种资源,可以帮助揭示潜在的治疗靶基因,如PCSK9。研究小组扫描了来自英国生物样本库的近40万个人的外显子组(基因组中蛋白质编码的部分),寻找它们之间的联系罕见的基因变异疾病或性状。他们还建立了一个可公开访问的浏览器,叫做Genebass,总结他们的分析。他们的研究结果发表在今天的《细胞基因组学.
这篇论文的共同第一作者、Broad大学的计算科学家康拉德·卡尔切夫斯基(Konrad Karczewski)说,其他研究人员正在研究特定的基因可以使用Genebass来了解更多与之相关的性状或疾病,反之亦然。
“建立这个数据集,并将其发布到公众这是令人兴奋的,因为虽然我们还没有发现下一个PCSK9,但其他人可能会使用这种资源,”Karczewski说。
马修·所罗门森(Matthew Solomonson)是这项研究的共同第一作者,也是布罗德大学基因组数据可视化副主任,他领导了Genebass浏览器的开发。他说:“自去年6月推出以来,我们已经有1.8万名用户试用了这款浏览器,世界各地仍有用户使用它来查找基因。”
这项研究也是由Katherine Chao领导的,她是Broad公司的软件产品经理,也是第一作者之一;布洛德大学医学和人口遗传学项目的联合资深作者和联合主任本杰明·尼尔;艾伯维、百健和辉瑞的研究人员。
系统的研究
在全基因组关联研究在美国,科学家们通过梳理人群的整个基因组,寻找与疾病相关的遗传变异。这些分析对解释从人类身高到精神分裂症等各种特征的基因产生了有价值的见解,但主要是探测常见的变异。通常情况下,一个变异越普遍,它对一个性状的影响就越小。许多已知导致疾病的遗传变异是罕见的,但系统地研究罕见变异需要巨大的数据集和处理能力。
使用大型计算系统由Broad的Hail团队建立,研究人员在英国生物样本库中寻找了4500多个性状和罕见遗传变异之间的联系。该系统利用了云计算中强大的处理能力,在几周内分析了一台128核计算机需要15年才能完成的工作。他们的分析显示,在罕见的变异中,最严重的变异——如完全使基因失去功能的变异——与疾病和性状有更多的联系。
研究小组还发现了与生物过程有关的罕见变异。例如,他们发现SCRIB基因的功能丧失突变与大脑内部特定部分的白质完整性(或被认为支持大脑功能的神经纤维)之间存在以前未报道的联系。Karczewski说,Genebass可以帮助其他用户识别类似的生物学联系,为未来的疾病研究提供新的途径。
接下来,Karczewski和Solomonson希望将他们的浏览器扩展到越来越大的数据集,这些数据集来自具有更多样化血统的人群,比如来自美国国立卫生研究院(National Institutes of Health)的“所有人”(All of Us)研究项目。Karczewski说:“使用这些更全面、更广泛的数据集可能会给我们提供很多有趣的信息,就更好的表达和更好的基因发现能力而言。”