Nature:用机器学习预测基因组修复结果,实现精准的无模板Cas9编辑

2018-11-11 Nature自然科研 Nature自然科研

《自然》本周在线发表的一篇论文Predictable and precise template-free CRISPR editing of pathogenic variants中报告了一种方法,可以通过机器学习对致病基因变异实现精准且可预测的编辑。这项成果为遗传疾病的研究和潜在疗法提供了新的可能性。

《自然》本周在线发表的一篇论文Predictable and precise template-free CRISPR editing of pathogenic variants中报告了一种方法,可以通过机器学习对致病基因变异实现精准且可预测的编辑。这项成果为遗传疾病的研究和潜在疗法提供了新的可能性。



Cas9介导的DNA修复产物的高通量测定有助于inDelphi模型的设计。

虽然CRISPR–Cas9彻底改变了用于研究的基因组编辑技术,但保证这项技术的准确性尤其重要。

CRISPR–Cas9基因组编辑常用DNA“模板”来确保DNA修复的准确性,或将特定的DNA序列导入基因组中。因此,缺少这些模板的DNA修复常被认为不够准确。

现在,美国布列根和妇女医院及哈佛医学院的Richard Sherwood及同事发明了一种用机器学习预测基因组修复结果的方法,实现了精准的无模板Cas9编辑。作者用一个含有近2000对Cas9向导RNA(gRNA)和人体DNA靶点的数据库,训练了一个名为“inDelphi”的机器学习模型。

经该模型识别,5-11%靶向人体基因组的Cas9 gRNA能在超过50%的情况下(被称为“精准-50”)产生单一且可预测的修复结果。inDelphi还能利用无模板Cas9编辑识别并预测出合适的致病基因变异靶标,包括一些曾被认为无法用该方法找到的靶标。



inDelphi准确地预测了几乎所有的编辑结果。

最后,作者通过实验证明,人体细胞中与Hermansky-Pudlak综合征、Menkes病以及家族性高胆固醇血症这三种疾病有关的近200种致病变异,其编辑和修复的准确性都能达到精准50的标准。

这一研究结果建立了一种实现精准、无模板基因组编辑的方法。

原始出处:
Max W. Shen, Mandana Arbab, Jonathan Y. Hsu, et al. Predictable and precise template-free CRISPR editing of pathogenic variants. Nature. Nov 7, 2018.

作者:Nature自然科研



版权声明:
本网站所有注明“来源:梅斯医学”或“来源:MedSci原创”的文字、图片和音视频资料,版权均属于梅斯医学所有。非经授权,任何媒体、网站或个人不得转载,授权转载时须注明“来源:梅斯医学”。其它来源的文章系转载文章,本网所有转载文章系出于传递更多信息之目的,转载内容不代表本站立场。不希望被转载的媒体或个人可与我们联系,我们将立即进行删除处理。
在此留言
评论区 (5)
#插入话题

相关资讯

详解:如何用Python实现机器学习算法(6)

七、异常检测 Anomaly Detection 全部代码 https://github.com/lawlite19/MachineLearning_Python/blob/master/AnomalyDetection/AnomalyDetection.py 1、高斯分布(正态分布)Gaussian distribution 分布函数: 其中

机器学习的明天——迁移学习

DeepMind创造的AlphaGo让人为之赞叹,让柯洁为之疯狂。而背后,从机器学习的角度,充分证明了深度强化学习和大数据的重要意义。DeepMind就是将深度学习应用到强化学习的范例,DeepMind把端到端的深度学习应用在强化学习上,使强化学习能够应付大数据,因此可以在围棋上把人类完全击倒,它做到这样是通过完全的自学习、自优化,然后一直迭代。 从科学的角度看AlphaGo到底有没有弱

收藏:机器学习27张速查表、13种算法和4种学习方法

机器学习的算法很多。很多时候困惑人们都是,很多算法是一类算法,而有些算法又是从其他算法中延伸出来的。这里,我们从两个方面来给大家介绍,第一个方面是学习的方式,第二个方面是算法的分类。 一、4大主要学习方式 1.监督式学习 在监督式学习下,输入数据被称为“训练数据”,每组训练数据有一个明确的标识或结果,如对防垃圾邮件系统中“垃圾邮件”“非垃圾邮件”,对手写数字识别中的“1“,”2“,”

Cell:里程碑研究揭示肿瘤进化与前列腺癌严重性存在关联

在一项新的研究中,来自加拿大前列腺癌基因组网络(Canadian Prostate Cancer Genome Network, CPC-GENE)分析了293例与临床结果数据相关联的局限性前列腺癌的全基因组序列。他们进一步利用机器学习(一种统计学技术)推断肿瘤的进化过程和评估它们的轨迹。他们发现那些已进化出多种类型的癌细胞或者亚克隆的肿瘤是最具侵袭性的。在这项研究中,55%的肿瘤具有这种遗传多样

Sci Rep:使用临床指标的狼疮性肾炎病理预测

通过机器学习评估狼疮性肾炎具有评估狼疮性肾炎的潜力。

CLIN CHEM:利用机器学习助力尿液类固醇信息解释

尿类固醇信息可用于临床诊断和监测类固醇生成和肾上腺疾病。机器学习(ML)算法是一种强大的计算工具,广泛用于识别大型数据集中的模式。在这里,研究人员分析了各种ML算法在尿液类固醇信息的自动生化解释中的应用,以对当前的临床实践进行帮助。 本研究回顾性收集了2012年6月至2016年10月期间处理的4619份尿液类固醇样本数据。其中,用1314份样品来测试各种ML分类器区分无显著异常和“?异常”的