TCGA数据库使用教程:官网、数据下载与数据挖掘分析

2020-08-15 网络 网络

肿瘤基因组图谱 (TCGA) 计划由美国 National Cancer Institute(NCI) 和 National Human Genome Research Institute(NHGRI

肿瘤基因组图谱 (TCGA) 计划由美国 National Cancer Institute(NCI) 和 National Human Genome Research Institute(NHGRI)于 2006 年联合启动的项目,其主要收录各种人类癌症(包括亚型在内的肿瘤)的临床数据,基因组变异,mRNA表达,miRNA表达,甲基化等数据,是癌症研究者很重要的数据来源,目前共计研究 36 种癌症类型。 TCGA 利用大规模测序为主的基因组分析技术,通过广泛的合作,理解癌症的分子机制。提高人们对癌症发病分子基础的科学认识及提高我们诊断、治疗和预防癌症的能力。 最终完成一套完整的与所有癌症基因组改变相关的「图谱」。 一、TCGA数据库说明与数据下载  首先,TCGA官网:https://cancergenome.nih.gov/abouttcga/overview 1. 数据等级: TCGA存储的数据可分为三个级别: Level 1: 原始的测序数据(fasta,fastq等) Level 2:比对好的bam文件 Level 3:为经过处理及标准化的数据 Level



版权声明:
本网站所有注明“来源:梅斯医学”或“来源:MedSci原创”的文字、图片和音视频资料,版权均属于梅斯医学所有。非经授权,任何媒体、网站或个人不得转载,授权转载时须注明“来源:梅斯医学”。其它来源的文章系转载文章,本网所有转载文章系出于传递更多信息之目的,转载内容不代表本站立场。不希望被转载的媒体或个人可与我们联系,我们将立即进行删除处理。
在此留言
评论区 (6)
#插入话题
  1. 2023-12-03 ms6000002093617293

    想看

    0

  2. 2021-07-14 ms6000000525429959

    想看

    0

  3. 2021-05-12 ms9000001273488727

    想看

    0

  4. 2020-10-25 ms4000001327670760

    写的很有用

    0

  5. 2020-08-16 翟子卿

    写得还可以哦

    0

相关资讯

数据挖掘算法全景图——Clementine12.0算法

                                 &n

数据挖掘在医学上的应用

本篇将再多讲一讲数据挖掘在医学上的应用,希望能对感兴趣的朋友有所启发,也供从事其他行业数据挖掘应用的同仁参考。 数据挖掘,又称知识发现(KDD),是从大量的数据中抽取潜在的、有价值的知识的过程。数据挖掘所探寻的模式是一种客观存在的、但隐藏在数据中未被发现的知识。例如,数据挖掘可直接挖掘疾病高发人群,发现疾病及症状间的未知联系,探索化验指标间的影响关系及化验指标与疾病间的潜在影响,对未知的

数据挖掘与虚拟医药科研

我们在前面的博客里初步谈论了一些数据挖掘的实践应用。我们说数据挖掘的应用很广泛,在某些领域也已很成熟,实用价值很高。其中数据挖掘在医药学领域就有一些比较成熟可靠的应用了。但有时,我们也听说有些人将数据挖掘在某些领域的应用说成是“讲故事”。这实际上是反映了这些案例的开发和应用很不成熟,可信度很低。成熟的数据挖掘应用绝不是“讲故事”。本人在北美工作了多年,从来没有听说过数据挖掘是“讲故事”(也许是

R进行数据统计与数据挖掘:手把手教你!

R是一种广泛用于数据分析和统计计算的强大语言,于上世纪90年代开始发展起来。得益于全世界众多爱好者的无尽努力,大家继而开发出了一种基于R但优于R基本文本编辑器的R Studio(用户的界面体验更好)。也正是由于全世界越来越多的数据科学社区和用户对R包的慷慨贡献,让R语言在全球范围内越来越流行。其中一些R包, 例如MASS,SparkR, ggplot2,使数据操作,可视化和计算功能越来越强大。

基于数据挖掘的《理虚元鉴》用药规律研究

分析《理虚元鉴》用药规律,探讨汪绮石治疗虚证用药特点及辨治思路,为临床提供参考。

案例精讲:甲基化与基因表达数据挖掘的思路与过程

口腔鳞状细胞癌(OSCC)是最常见的头颈部鳞状细胞癌(HNSCC),由于对OSCC的发生、发展、进展、侵袭和转移的理解有限,导致该病的早期诊断大大延迟。因此,鉴定与OSCC相关的重要癌基因或肿瘤抑制基