Somatic Variation Detection

gene_x 0 like s 11 view s

Tags: processing

🔬 癌症驱动基因与突变分析流程总览

一、常见癌症的驱动基因(Driver Genes)

| 癌症类型 | 常见驱动基因 | 说明 | |----------------|-------------------------------------------|--------------------------------------------| | 肺癌(NSCLC) | EGFR, KRAS, ALK, TP53, BRAF | EGFR 和 KRAS 突变常用于靶向治疗判断 | | 肝癌(HCC) | TP53, CTNNB1, AXIN1, TERT | TERT 启动子突变常见 | | 胃癌 | TP53, ARID1A, PIK3CA, CDH1 | 与 WNT/PI3K 通路相关 | | 大肠癌(CRC) | APC, KRAS, TP53, PIK3CA | Wnt 通路异常(APC 突变) | | 乳腺癌 | BRCA1/2, PIK3CA, TP53, ERBB2(HER2) | BRCA 突变相关于遗传性乳癌 | | 黑色素瘤 | BRAF, NRAS, NF1 | BRAF-V600E 为靶向治疗重要突变 | | 白血病(AML) | FLT3, NPM1, DNMT3A, IDH1/2 | 多个基因可能共突变 |


🧪 二、常用的癌症突变检测工具和数据库

🛠️ 工具类(基因组分析)

| 工具名 | 用途/特点 | |---------------|--------------------------------------------------| | Mutect2 (GATK) | 检测肿瘤样本中的体细胞突变(与正常对照) | | Strelka2 | 高灵敏度检测 SNV 和 InDel | | VarScan2 | 检测突变和 CNV,适合低深度数据 | | SomaticSniper | 老牌体细胞突变检测工具 | | FACETS | 拷贝数变异与纯度/杂合度估计 |

🧬 数据库类(已知突变注释)

| 数据库/平台 | 功能 | |----------------------|----------------------------------------------------| | COSMIC | 全球最大癌症突变数据库 | | TCGA (via GDC) | 大规模癌症全基因组数据平台(含表达、突变等) | | cBioPortal | 可视化 TCGA、ICGC 数据;浏览癌症基因突变 | | OncoKB | 癌症突变功能注释库,适合靶向药物关联 | | ClinVar | 提供临床意义注释,如是否为致病突变 |


📘 三、推荐突变分析流程

bash 样本准备 ↓ 比对 (BWA) ↓ 去除重复 (Picard) ↓ 突变检测 (Mutect2, Strelka2, VarScan2) ↓ 注释 (ANNOVAR / VEP) ↓ 功能解释 (OncoKB, COSMIC, cBioPortal)


🧬 四、突变检测与注释:实际操作(从 BAM 到注释 VCF)

✅ 输入需求:

  • 肿瘤 BAM 文件(推荐同时有正常对照 BAM)
  • 参考基因组(例如 hg38.fasta
  • 索引文件(.bai, .fai
  • 工具安装:GATK, VEP, 或 ANNOVAR

🛠️ 常见工具推荐

| 工具 | 特点 | 输入要求 | |--------------|-------------------------------|---------------------| | Mutect2 (GATK) | 最佳的肿瘤–正常突变检测 | 肿瘤 + 正常 BAM | | Strelka2 | 快速、准确检测 SNV/InDel | 肿瘤 + 正常 BAM | | VarScan2 | 可支持 tumor-only 模式 | mpileup / VCF | | LoFreq | 高分辨率 SNV 检测 | 肿瘤 BAM(可选) |


🧪 示例:使用 GATK Mutect2 检测体细胞突变

🔹 Tumor–Normal 模式(推荐)

```bash gatk Mutect2 \ -R hg38.fasta \ -I tumor.bam \ -I normal.bam \ -tumor TumorSample \ -normal NormalSample \ --germline-resource af-only-gnomad.vcf.gz \ --panel-of-normals pon.vcf.gz \ -O somatic_raw.vcf

gatk FilterMutectCalls \ -V somatic_raw.vcf \ -R hg38.fasta \ -O somatic_filtered.vcf ```

🔹 Tumor-Only 模式(无对照)

bash gatk Mutect2 \ -R hg38.fasta \ -I tumor.bam \ -tumor TumorSample \ --germline-resource af-only-gnomad.vcf.gz \ -O somatic_raw.vcf


🧠 突变注释工具

1. Ensembl VEP

bash vep -i somatic_filtered.vcf \ -o annotated.vep.vcf \ --vcf \ --cache \ --offline \ --assembly GRCh38 \ --dir_cache /path/to/.vep \ --everything

✅ 适用于通用功能预测、插件丰富(如 COSMIC、gnomAD)


2. ANNOVAR

```bash convert2annovar.pl -format vcf4 somatic_filtered.vcf > input.avinput

table_annovar.pl input.avinput humandb/ \ -buildver hg38 \ -out annotated_annovar \ -remove \ -protocol refGene,clinvar_20240129,cosmic70,gnomad_genome \ -operation g,f,f,f \ -nastring . \ -vcfinput ```

✅ 适合癌症、临床相关变异注释(COSMIC、ClinVar、gnomAD)


🚦 工具选择建议

| 使用场景 | 推荐工具 | |----------------|-------------| | 全面功能预测 | VEP | | 癌症为重点 | ANNOVAR | | 兼顾两者 | 同时使用更好 |


like unlike

点赞本文的读者

还没有人对此文章表态


本文有评论

没有评论

看文章,发评论,不要沉默


© 2023 XGenes.com Impressum