Cell Reports:南方医科大学朱浩团队开发深度学习算法DeepFavored,揭示适应性突变与疾病易感性关联

2022-09-27 测序中国 测序中国

人类和黑猩猩之间的基因差异仅为1%,但就是这1%的差异将人类与黑猩猩区分开来。因此,人类基因组中的许多微小变化决定了人类特有的特征。基因组的单核苷酸多态性(SNP)使人类能够适应不同的环境和生活方式,

人类和黑猩猩之间的基因差异仅为1%,但就是这1%的差异将人类与黑猩猩区分开来。因此,人类基因组中的许多微小变化决定了人类特有的特征。基因组的单核苷酸多态性(SNP)使人类能够适应不同的环境和生活方式,但同时也使人类容易遭受不同的病原体和疾病侵袭。目前,适应性进化和疾病易感性之间平衡的规模和细节还不清楚,这就需要确定不同人群中有多少是有利的突变。

近日,中国南方医科大学朱浩教授团队Cell Reports期刊发表了题为“Uncovering the extensive trade-off between adaptive evolution and disease susceptibility”的研究文章。研究团队开发了一种名为DeepFavored的深度学习算法,该算法通过对已有的全基因组关联研究(GWAS)数据集进行统计测试,可以区分有利突变与“搭便车”突变。研究团队在三个不同的人群中验证了该工具,并确定了基因组进化的协调性:适应特定环境的突变也使人们更容易患上某些疾病,或者携带搭便车突变。

图片

文章发表在Cell Reports

由于搭便车突变与有利突变非常相似,任何方法都很难同时准确地区分两者以及普通突变(图1)。为了避免错误识别,研究团队通过构建深度学习网络,利用不同数据组成训练网络,最后使用训练网络从统计检测的选择信号中鉴定有利突变,最终开发了DeepFavored深度学习算法。此外,研究人员系统地比较DeepFavored与iSAFE、SWIF(r)的性能,这两种方法是识别有利突变的最新方法。结果显示,DeepFavored的性能优于这两种算法,且更加稳定

图片

图1. DeepFavored算法设计原理、输入和输出。

随后,研究团队利用真实世界的GWAS数据检测了东亚(CHB)、欧洲(CEU)、非洲(YRI)三个人群的基因组突变,并比较了DeepFavored、iSAFE和SWIF(r)的性能。该研究重点分析了与饮食相关的基因等位基因,包括与代谢或味觉以及免疫相关的基因,并假设上述三个群体需要适应与病原体和食物供应相关的不同压力。

研究人员分析了CEU、CHB和YRI中的1091个PopHumanScan基因区域,这些区域是识别有利突变的良好候选区域。最终,DeepFavored、iSAFE和SWIF(r)分别在CEU、CHB和YRI中鉴定了1,013(454、287、272)、1,219(560、487、172)和789(350、334、104)个有利突变。此外,以上三种方法共同识别了55个有利突变,研究团队利用这55个有利突变作为测试数据进一步评估了DeepFavored的性能。结果表明,由DeepFavored识别的有利突变应该是合理的

图片

图2. 有利突变和搭便车突变在GWAS位点富集。

在确定了三个人类群体的有利突变后,研究团队综合分析了有利/搭便车突变与GWAS位点之间的相关性。通过计算有利突变、搭便车突变和普通突变的GWAS位点的比例,发现有利突变和搭车突变中GWAS位点的比例明显高于普通突变

为了检验这种基因突变协调性的潜在相关人群特异性和疾病特异性,研究团队分析了DeepFavored在CEU、CHB和YRI中识别的454、287和272个有利突变,以及附近的搭便车突变是否富含神经、代谢和免疫相关疾病/性状位点。结果表明,有利突变和搭便车突变富含GWAS位点,并且这种富集表现出人群和疾病特异性特征(图3)。

图片

图3.不同突变的GWAS位点。

环境变化、病原体进化以及生活方式改变驱动着基因组的适应性进化。基因组区域的许多变化可能会产生有害的搭便车突变。当新的外部变化发生时,有利突变可能会变得不适应,甚至变得与疾病相关。越来越多的研究强调了适应性进化和疾病易感性之间的协调性,但其规模和细节还不清楚。研究团队开发的深度学习算法DeepFavored能够系识别有利突变,为适应性进化和疾病易感性之间的广泛协调性分析提供了证据。此外,人群特异性有利突变和疾病相关突变的联合分析,可以为精准医疗提供有价值的数据和线索。

图片

图4. 研究概要。

参考资料:

1.Ji Tang, Maosheng Huang, Sha He, et al. Uncovering the extensive trade-off between adaptive evolution and disease susceptibility. Cell Reports, 2022. DOI:https://doi.org/10.1016/j.celrep.2022.111351

https://www.cell.com/cell-reports/fulltext/S2211-1247(22)01179-2#secsectitle0080

2.Historic Adaptations May Now Make Us Susceptible to Disease

https://www.the-scientist.com/news-opinion/historic-adaptations-may-now-make-us-susceptible-to-disease-70506



版权声明:
本网站所有注明“来源:梅斯医学”或“来源:MedSci原创”的文字、图片和音视频资料,版权均属于梅斯医学所有。非经授权,任何媒体、网站或个人不得转载,授权转载时须注明“来源:梅斯医学”。其它来源的文章系转载文章,本网所有转载文章系出于传递更多信息之目的,转载内容不代表本站立场。不希望被转载的媒体或个人可与我们联系,我们将立即进行删除处理。
在此留言

相关资讯

Brief Bioinform:肠道菌群和复杂疾病关系的分析方法

近日,西安交大公共卫生学院的论文“Identifying psychiatric disorder-associated gut microbiota using microbiota-related gene set enrichment analysis”在国际生物信息学权威期刊《Briefings in Bioinformatics》在线发表。

Blood:伯基特淋巴瘤亚型的全基因组特征

伯基特淋巴瘤(BL)是一种侵袭性、MYC驱动的淋巴瘤,包括3种不同的临床亚型:全球均有发生的散发性BLs、主要发生于撒哈拉以南非洲的地方性BLs和主要发生在HIV感染后的免疫缺陷相关性BLs。在本研究中,研究人员对101份肿瘤样本(包含3个BL亚型)进行全基因组测序来全面的阐述BL的基因组学基础,鉴别72个驱动基因。本研究数据还通过CRISPR编辑从BL细胞系中得到额外的信息,从而在功能上注释致癌

Br J Dermatol :全基因组扫描银屑病潜在的结构变异

每个人类基因组都包含许多结构变异(SVS):DNA片段的插入、缺失、倒置和拷贝数变异等。随着我们进入生物库规模的遗传学时代,更清晰的SV介导的银屑病风险的图景应该是容易实现的。

Science:对癌症中体细胞非编码突变模式的全基因组分析

这些研究结果表明非编码突变与一系列不同的生物过程有关,它们在基因组中的位置对于准确解释它们至关重要。

Nature:基于空间分辨转录组学分析良、恶性组织拷贝数状态,揭示全基因组CNV的独特克隆模式

研究团队对前列腺器官进行了深入的空间分析,生成了一个前所未有的图谱,包含单个患者多达50000个组织结构域以及10个患者约120000个组织结构域。

JNNP:全基因组测序对早发性痴呆患者的临床影响

早发性痴呆(EOD),通常定义为痴呆发作≤65岁,影响约40-100的/100 000人。 但是EOD具有临床异质性,需要考虑大量的鉴别诊断,给治疗临床医生带来诊断和管理挑战。.最