学术堂首页 | 文献求助论文范文 | 论文题目 | 参考文献 | 开题报告 | 论文格式 | 摘要提纲 | 论文致谢 | 论文查重 | 论文答辩 | 论文发表 | 期刊杂志 | 论文写作 | 论文PPT
学术堂专业论文学习平台您当前的位置:学术堂 > 图书档案学论文 > 文献计量学论文

肺癌、鼻咽癌和神经胶质瘤文献特征数据分析挖掘

来源:学术堂 作者:姚老师
发布于:2014-08-04 共3841字
论文摘要

  全基因组关联研究(genome - wide associationstudy,GWAS) 是利用高通量基因芯片技术,对人类全基因组范围内常见遗传变异———单核苷酸多态性(single nucleotide polymorphism,SNP) 和拷贝数变异(copy number variation,CNV) 进行总体关联分析的研究方法。它基于 DNA 是可遗传的且和临近的等位基因从上一代传递给下一代这一理论。国际人类基因组测序完成,单体型图谱工程的完成和经济高效的高通量基因分型技术的开展,使得全基因组范围内筛检与疾病相关的序列变异成为可能,它可以在病例和对照中比较全基因组范围内所有变异的等位基因频率,从中发现与疾病相关联的序列变异。GWAS 研究设计类型有单个阶段研究、两个阶段研究和多阶段研究设计,其统计分析的基本原则是减少系统偏倚和加大研究强度,譬如进行强有力的 SNP 设定分析。2007年 4 月 Duggan 等和 Murabito 等利用 Illumi-na 及 Affymetrix 的基因芯片对前列腺癌进行了GWAS,其结果同时首次在 Science 杂志上发表,自此以后越来越多肿瘤方面的 GWAS 研究结果陆续发表。肿瘤方面 GWAS 研究处于生物医学科技前沿,所有原始研究文选均以第一时间在高质量的英文科技刊物发表。现通过对最新 GWAS 数据库之一———NHGRI,进行肺癌、鼻咽癌和神经胶质瘤文献特征数据分析挖掘,所获得的 GWAS 数据信息或许能对国内呼吸系统肿瘤、头颈部肿瘤和脑肿瘤GWAS 产生参考作用。

  1、 材料与方法

  研究资料来源于 NHGRI,该数据库由 Hindorff等始建于 2008 年 11 月 25 日。登入页面http: / /www. genome. gov /page. cfm? pageid = 26525384 #searchForm。在页面下 Disease /Trait 一栏中输入“Lung cancer”,点击“Search”后,再点击“DownloadSpreadsheet of Search Result ”保 存“MyGWAS-Search. xls”,并改名为“Lung cancer. xls”,并用同样的步骤获得“Lung adenocarcinoma. xls”、“squamouscell carcinoma. xls”、“Small - cell lung cancer. xls”、“Nasopharyngeal carcinoma. xls”和“Glioma. xls”。

  2、 结果

  2. 1 文献分布特点 数据库原记录包含 26 篇论文 (肺癌 18 篇,鼻咽癌 4 篇,神经胶质瘤 4篇) 、涉及 79 个 SNP(肺癌 44 个 SNP,鼻咽癌 17 个SNP,神经胶质瘤 18 个 SNP) 。论文分别发表在Nat Genet (IF: 35. 209 /2012 ) 9 篇,Nature (IF:38. 597 /2012) 1 篇,Hum Genet(IF: 4. 633 /2012) 1篇,BMC Med Genet(IF: 2. 536/2012) 1 篇,HumMol Genet (IF: 7. 692 /2012) 2 篇,Plos Gene (IF:8. 517 /2012) 3 篇,J Hum Genet(IF: 2. 365 /2012) 1篇,Am J Hum Genet(IF: 11. 202/2012) 2 篇,Lan-cet Oncol (IF: 25. 117 /2012) 1 篇,J Natl CancerInst (IF: 14. 336 /2012) 1 篇,Cancer Res(IF: 8. 65 /2012) 2 篇,Cancer Lett(IF: 4. 258 /2012) 1 篇,Int JCancer(IF: 6. 198 /2012) 1 篇。详见图 1。

论文摘要

  2. 2 第一(筛选) 阶段样本量 在 26 篇呼吸系统肿瘤、头颈部肿瘤和脑肿瘤 GWAS 研究文献第一阶段病例组样本量从111 病例,到超过14,900 例不等; 对照组例数从 219 例到 29,485 例。按病例数/对照数的研究文献分布见图 2。3. 85%文献没有明确报告对照组样本量。

  2. 3 第二(验证) 阶段样本量 第二阶段病例组样本量从 168 病例到 7,561 例,没有报告第二阶段病例数据的文献占到 11. 54%。对照组例数从 252例到 13,818 例。3. 85%文献没有报告对照组样本量,按病例数/对照数的研究文献分布见图 3。

论文摘要

  2. 4 染色体区域相关 SNP(NCBI rs 登记号) 所定位的染色体区域分布大致与染色体长度近似。其中5 号和 6 号染色体明显多于邻近的染色体。详见图 4。

  2. 5 对照组相关风险等位基因频率 对照组中与最强 SNP 相关风险等位基因频率在呼吸系统肿瘤、头颈部肿瘤和脑肿瘤 GWAS 文献中的分布。未发现稀有变异(即在对照人群中的发生频率 <1%) 的呼吸系统肿瘤、头颈部肿瘤和脑肿瘤 GWAS 文献。

  详见图 5。

  2. 6 P 值文献中最强 SNP 相关风险等位基因 P值选择 <1 ×10- 6为录入标准,最小 P 值 5 ×10- 67。

  P 值分布见图 6。

  2. 7 优势比(odds ratio,OR) 或 β 相关系数 文献中最强 SNP 相关风险等位基因优势比(或 β 相关系数) 从 β 相关系数等于 1. 08 到 3. 85。详见图7。

  2. 8 实验平台及检测 SNP 数量 文献中 SNP 试验平台见图。超过一半(76. 92%) 的呼吸系统肿瘤、头颈部肿瘤和脑肿瘤 GWAS 独立使用了 Illu-mina 研究平台,不到三分之一(23. 08%) 使用 Af-fimetrix 芯片系统。检测 SNP 数量从 116,204 个到906,703 个。详见图 8 ~ 9。

  3、 讨 论

  3. 1 概述

  目前呼吸系统肿瘤、头颈部肿瘤及脑肿瘤 GWAS 方面的报道主要在肺癌、鼻咽癌和胶质瘤领域,其中肺癌 GWAS 方面英国学者 Wang等研究发现染色体 6p21. 33 区域(BAT3/MSH5基因) rs3117582 和 5p15. 33 (CLPTM1L 基 因)rs401681 这两个位点与肺癌的遗传易感性相关联。

  肺腺癌领域 Miki 等研究发现新的易感位点3q28 区域(TP63 基因) rs10937405 多态性可能会影响东亚肺腺癌人群的易感性。肺鳞癌领域 Dong等研究发现 12q23 区域 (SLC17A8、NR1H4、SCYL2 和 GAS2L3 基因) 上 rs12296850 与肺鳞癌遗传易感性相关。肺小细胞肺癌领域 Wu 等发现 11q22. 3 区域(DYNC2H1 基因) rs716274 位点多态性对小细胞肺癌患者存活率显著相关。鼻咽癌 GWAS 方面 Tse 等研究发现中国台湾地区染色体 6p22. 1 区域(HLA - A 基因、GABBR1 基因和 HLA - F 基 因) 上 rs2517713、rs29232 和rs3129055 多态性与鼻咽癌遗传易感性相关联,随后 Bei 等新发现 13q12 区域(TNFRSF19 基因)rs9510787、3q26 区域(MDSIEVI1 基因) rs6774494和 9p21 区域(CDKN2A/2B 基因) rs1412829 三个位点与鼻咽癌高发有关。胶质瘤 GWAS 方面 Sh-ete 等研究发现 5p15. 33 区域(TERT 基因) 上rs2736100 和 rs2853676,8q24. 21 区域 (CCDC26基因) 上 rs891835 和 rs4295627,9p21. 3 区域(CD-KN2A /CDKN2B 基因) rs4977756,20q13. 33 区域(RTEL1 基 因 ) rs6010620 和 11q23. 3 区 域(PHLDB1 基因) rs6010620 与神经胶质瘤发生风险相关; 随后 Sanson 等研究新发现 7p11. 2 区域(EGFR 基因) 上 rs2252586 和 rs11979158 多态性也与神经胶质瘤发生风险相关,并验证了 Shete 等神经胶质瘤六个发生风险相关的基因 SNP。

论文摘要

  3. 2 NHGRI 数据库分析 通过对 NHGRI 数据。

  库中呼吸系统肿瘤、头颈部肿瘤和脑肿瘤中八项数据进行不完全统计后,作者发现呼吸系统肿瘤、头颈部肿瘤和脑肿瘤有如下特点: (1) 在文献分布特点方面: 呼吸系统肿瘤、头颈部肿瘤和脑肿瘤在 NatGenet 发表的文献最多,占 34. 15%,其次 PLoSGene 占 11. 54%,Am J Hum Genet、Cancer Res占 7. 69%,Nature、Hum Genet、BMC Med Genet、Hum Mol Genet、J Hum Genet、Lancet Oncol、JNatl Cancer Inst、Cancer Lett 和 Int J Cancer 各 1篇。作者推测 Nat Genet 以其影响力将是优质呼吸系统肿瘤、头颈部肿瘤和脑肿瘤 GWAS 的主要阵地。目前罕见胚胎性肿瘤肺母细胞瘤、视网膜母细胞瘤等罕见肿瘤仍然缺乏预防及预后的指标数据,作者期待其 GWAS 结果能够在 Nat Genet,甚至在N Engl Med 上发表; (2) 呼吸系统肿瘤、头颈部肿瘤和脑肿瘤 GWAS 第一、二阶段的病例组样本量方面: 一般从几百例到几万例不等,且以千例为主,最大样本量均不超过 15,000 例; 对照组样本量也从几百例到几万例不等,但以千例以上为主,最大样本量均为超过 30,000 例; (3) 染色体区域相关SNP 方面: 以 5 号和 6 号染色体区域 SNP 居多,其中 5 号和 6 号染色体区域 SNP 在罕见肿瘤中也居多; (4) 对照组相关风险等位基因频率方面: 呼吸系统肿瘤、头颈部肿瘤和脑肿瘤 GWAS 中风险等位基因以 Risk Allele Frequency = 0. 30 左右最多,其次是 Risk Allele Frequency = 0. 40,但未发现稀有变异; (5) P 值文献中最强 SNP 方面: 呼吸系统肿瘤、头颈部肿瘤和脑肿瘤 P 值以 1 × 10- 10为主,其中最强 P 值2 ×10- 67; (6) 优势比(odds ratio,OR) 或β 相关系数方面: 呼吸系统肿瘤、头颈部肿瘤和脑肿瘤OR 以 1. 00 左右的弱相关占多数,2. 00 以上的强相关占的比例相对比较少; (7) 实验平台及检测 SNP 数量方面: 呼吸系统肿瘤、头颈部肿瘤和脑肿瘤实验平台方面 Illumina 研究平台占大多数,其次是 Affymetrix 芯片系统,未见 Perlegen 或 Invader 研究平台的报道。

  检测 SNP 数量从16,204 个到 906,703 个,相比常见消化系统、血液系统、泌尿生殖系统、甲状腺、乳腺、皮肤和妇科肿瘤相对过少。

  3. 3 总结 肿瘤方面 GWAS 的最终目标是应用

  于临床,主要体现在对正常人群进行肿瘤的危险度预测评估和指导肿瘤的个体化治疗。个体化治疗推崇在肿瘤遗传谱指导下的个体化医学(personal-ized medicine) ,为肿瘤发生和治疗疗效提供早期预测,促进肿瘤预防和治疗。呼吸系统肿瘤、头颈部肿瘤和脑肿瘤 GWAS 经过 7 年的发展,已在肺癌、鼻咽癌和神经胶质瘤遗传易感性研究方面取得了很大成功,为个体化治疗打下了基础。本文通过运用文献计量学方法客观分析了 NHGRI 的文献基本特征、第一、二阶段样本量、染色体区域相关 SNP、对照组相关风险等位基因频率、P 值文献中最强 SNP、优势比(odds ratio,OR) 或 β 相关系数和实验平台及检测SNP 数量八项数据,找到了呼吸系统肿瘤、头颈部肿瘤和脑肿瘤 GWAS 的一些共性特点,为把握呼吸系统肿瘤、头颈部肿瘤和脑肿瘤 GWAS 的研究现状和发展趋势奠定基础,并对国内呼吸系统肿瘤、头颈部肿瘤和脑肿瘤 GWAS 提供参考作用。

  参考文献:
  [1] 张学军. 全基因组关联分析对银屑病遗传学研究的启示. 浙江大学学报(医学版) ,2009,38(4) : 333.
  [2] 严卫丽. 复杂疾病全基因组关联研究进展———研究设计和遗传标记. 遗传,2008(4) : 400.
  [3] 严卫丽. 复杂疾病全基因组关联研究进展———遗传统计分析. 遗传,2008(05) : 543.

相关标签:
  • 报警平台
  • 网络监察
  • 备案信息
  • 举报中心
  • 传播文明
  • 诚信网站