插 入 / 缺 失 多 态 性 (i n s e r t i o n / d e l e t i o npolymorphisms,InDel)是指基因组中插入或缺失不同大小的DNA片段所形成的多态性遗传标记[1].2002年,Weber等[2]最早报道了2000个二等位基因InDel标记的遗传特征、定位以及在四大种群中的等位基因频率.在此基础上,Mills等[3]2006年在Genome Research杂志上发表了一个包含了人类基因组中415 000余个InDel标记的图谱,这一工作大大地促进了InDel在各领域的应用研究[4-7].从法医学应用角度来看,InDel遗传标记具备更低的突变率(代间突变率STR 10-3;SNP 2.3×10-8;InDel 2.3×10-9[8-9])、扩增片段长度可以极大缩短应用于DNA高度降解检材,由于其兼具了STR和SNP两种遗传标记的双重优点且能够与普遍使用的STR分型技术平台相兼容,受到了国内外法医学者的关注[10-13].目前成熟的InDel商品化试剂盒为Investigator DIP,本研究拟对该体系中的30个InDel位点在新疆维吾尔族人群中的等位基因频率和遗传多态性进行分析,以建立新疆维吾尔族群体30个InDel位点的群体遗传学资料,为法医学个体识别和亲权鉴定、疾病相关基因分析及人类学等相关领域研究提供参考数据.
1 材料与方法
1.1 实验样本及仪器 本研究在当地卫生行政部门的支持配合下采取知情同意的原则, 随机选取采集223名新疆维吾尔族无关男性个体外周血样,置于FTA采血卡上,-20℃保存.Investigator DIP试剂盒(Qiagen公司,德国);9700型扩增仪(PE公司,美国);3130 XL型遗传分析仪(Life Technologies公司,美国);微量移液器、高速离心机(Eppendorf公司,德国).
1.2 实验方法 采用5% Chelex-100快速提取法提取样本DNA.采用5μl复合扩增体系,含反应混合物A1.0μl,引物1.0μl,多重Taq2 DNA聚合酶0.2μl,模板DNA 0.5~1.0ng,补灭菌去离子水至5μl.PCR扩增条件为:94℃预变性4min;94℃变性30s,61℃复性120s,72℃延伸75s,30个循环;最后68℃延伸60min,10℃保温.PCR 产物变性后在3130 XL型遗传分析仪上进行毛细管电泳,用GeneMapper ID v3.2软件对30个InDel位点和性别基因座Amelogenin进行分型,每批样本检测均采用XX28和超纯水分别作为阳性对照和阴性对照.
1.3 统计学处理 运用 Power Stats v12. x ls软件统计分析30个InDel位点的等位基因频率、个体识别率(probability of discrimination power,DP)、多态信息含量(polymorphism information content,PIC)和非父排除率(probability of exclusion,PE)等法医学相关参数;采用Cervus 3.0( genetics.com/pages/home.jsp)软件计算三联体非父排除率(PEtrio)和二联体非父排除率(PEduo).采用Arlequin3.5软件(arlequin3.5)计算30个InDel位点的观察值杂合度(heterozygosityof observation,Ho)和期望值杂合度(heterozygosityofex pect,He),并进行各位点Hardy-Weinberg平衡、位点间连锁不平衡检验.采用Wrigh公式[14]计算各群体间遗传分化系数Fst.采用XLSTAT(version2009.4.07;Addinsoft SARL/ c o m pa ny / ) 进行多维尺度 (m u l t i - d i m e n s i o n a lscaling,MDS)分析.
2 结 果
2.1 30个InDel位点的等位基因分型结果 在223份新疆维吾尔族无关男性个体血样中,Investigator?DIP试剂盒中的30个InDel位点都得到了有效扩增,无Stutter峰,扩增片段长度均在76~158bp之间,纯合子只显现1个等位基因峰,杂合子则有2个等位基因峰且峰高比例>70%(图1).
2.2 新疆维吾尔族族群体30个Indel位点的群体遗传学参数 统计分析结果见表1,各位点观察值杂合度(Ho)为0.3857~0.5381,平均观察值杂合度为0.4686;期望值杂合度(He)为0.3770~0.5011,平均期望值杂合度为0.4738.采用Bonferroni法校正,将P值设为0.0017(0.05/30),30个InDel位点的基因型频率分布在新疆维吾尔族群体中均达到Hardy-Weinberg平衡(P>0.0017).30个InDel位点的缺失等位基因频率在0.2510~0.6860之间,除HLD64、HLD81位点外,其余28个位点的缺失等位基因频率在0.3000~0.7000之间,显示30个InDel位点在新疆维吾尔族群体的等位基因频率分布相对较均衡;个体识别率(DP)为0.5430~0.6470,平均为0.6095;多态信息含量(PIC)为0.31~0.37,平均为0.36;三联体非父排除率(PEtrio)为0.1050~0.2190;二联体非父排除率(PEduo)为0.0707~0.1250.(表1略)
2.3 新疆维吾尔族群体30个InDel位点的连锁不平衡检验 30个InDel位点两两之间共进行435次连锁不平衡检验,其中有23次比较结果的P值低于检验水准0.05,界于0.004 28~0.048 67之间,且该23对两两比较的位点均位于不同的染色体上,经过Bonferroni法校正,将P值设为0.000 115(0.05/435)后各位点间均不存在连锁不平衡现象(P>0.000 115).
2.4 新疆维吾尔族群体与其他群体的遗传分化系数Fst及多维尺度分析(MDS) 从已报道的文献中找到与本研究相同的30个InDel位点的群体:北京汉族[14]、广东汉族[15]、汉族[16]、维吾尔族[16]、哈萨克族[16]、藏族[16]、朝鲜[17]、葡萄牙[18]、丹麦[19]、捷克[20]、德国[20]、西班牙[21]、巴斯克[21]、高加索裔美国人[22]、拉美裔美国人[22]、非裔美国人[22]及亚裔美国人[22],计算的遗传分化系数Fst值见表2,遗传距离见表3,多维尺度分析结果见图2.(表2,表3略)
3 讨 论
维吾尔族是古代北亚民族的回鹘和中亚中世纪各穆斯林的后裔,世界维吾尔族人口1250万,其中大部分都在中国新疆维吾尔自治区居住,2011年中国第六次人口普查显示,中国境内的维吾尔族人口为10 069 347人,占中国人口的0.7555%,是中国第4大少数民族.本研究选择Investigator DIPplex试剂盒中的30个InDel位点对新疆维吾尔族群体进行遗传多态性调查,同时探讨其与其他群体之间的遗传学关系,有助于分析InDel遗传标记在不同民族或同一民族不同群体间的遗传、进化的相互关系,为科学应用InDel遗传标记提供理论基础.
本研究结果显示,经过Bonferroni法校正,30个InDel位点的基因型频率分布在新疆维吾尔族群体中达到Hardy-Weinberg遗传平衡,因此本研究样本是可靠的.连锁不平衡检验结果表明,30个InDel位点在西藏藏族群体中不存在连锁不平衡现象(P>0.000 115),提示这些位点是相互独立的遗传标记,可以应用于法医学鉴定.对InDel遗传标记的多态性及其法医学应用价值一般可用PIC、Ho、He、PD和PE等指标来衡量,本研究各位点等位基因频率F(del)为0.2510~0.6860,观察值杂合度(Ho)为0.3857~0.5381,平均观察值杂合度为0.4686;期望值杂合度(He)为0.3770~0.5011,平均期望值杂合度为0.4738;多态信息含量(PIC)为0.31~0.37;个体识别率(DP)为0.5430~0.6470,累积个体识别率(TDP)为0.999 999 999 999 5;30个InDel位点的累积非父排除率(CPEtrio)为0.995 478,二联体累积非父排除率(CPEduo)为0.972 007,综合各文献群体[15-23]的相应数据亦均不能达到0.9999,因此Investigator D I P 试剂盒目前只能作为法医常规 ST R 分型试剂盒的有效补充.由表1观察发现维吾尔族群体中F(del)、Ho、DP、PIC、PEduo、PEtrio的最小值均在HLD64位点出现,此外,HLD111、HLD118、HLD99及HLD39等位点在本研究及已报道的研究群体[15-17]中的杂合度及PIC也较低,提示这些位点可能在亚洲人群中的遗传多态性较低.
F s t 又称为近交系数,是进行群体间遗传分化概括分析最常用的方法之一.Fst指示特定基因座位在群体间的分化程度.Wright等[14]认为群体间Fst值在0~0.05表示群体间不存在分化;Fst值在0.05~0.15则为中度分化;Fst值在0.15~0.25则为高度分化,大于0.25则分化度极大.本研究中,HLD111和HLD118等位点Fst值均大于0.15,在18个群体中遗传分化贡献率相对较高.提示这两个位点在不同民族尤其是不同人种中基因型分布有很大差异,反映群体差异性大,在群体遗传学和种群识别方面有重要的应用价值.
遗传距离亦是表示群体间遗传差异或遗传分化的重要参数,是以两个群体间同一座位上相同等位基因的频率差异的函数来测定的.本研究中的新疆维吾尔族和国内汉族、其他民族及欧美等群体的遗传距离差异由小到大依次为:维吾尔族2(0.240)→哈萨克族(0.312)→藏族(0.575)→欧美白种人(0.507~0.686)→汉族及亚洲裔群体(0.577~0.734)→非裔美国人(1.089),维吾尔族群体与汉族群体间的遗传距离大于其与欧美白种人群.从MDS的散点图结果亦可以看出,18个比较人群大致可以划分成4个类群,分别是:第一类群,非裔美国人(尼格罗人种);第二类群,丹麦、捷克、高加索裔美国人、德国、拉美裔美国人、西班牙、巴斯克、葡萄牙构成的白种人组群;第三类群,两个维吾尔族及哈萨克族;第四类群,藏族、汉族、北京汉族、广东汉族、亚裔美国人及朝鲜人构成的蒙古人种族群.结合本研究结果,并参考有关历史文献、当地的地理、民俗和文化人类学研究的成果[24-25],我们认为,维吾尔族有较大比例的高加索人种的混杂程度,有别于属于蒙古人种的汉族和藏族.另外,维吾尔族和哈萨克族有着共同的宗教信仰,而且在两个民族的形成和发展中很可能有着相同或相近的渊源,因此遗传距离相近.这些结果基本符合从历史、考古、语言、地理和体质人类学等方面进行的划分,充分表明以InDel遗传标记的等位基因频率为基础计算的遗传距离及MDS分析,能够适用于群体遗传学和民族、种族研究.
综上,本研究首次获得了新疆维吾尔族群体HLD77等30个InDel位点的等位基因频率及基因型分布数据,为建立新疆地区维吾尔族群体InDel分布数据库、群体遗传关系的分析及法医学应用提供了良好的遗传背景数据.
【参考文献】
[1] Liu XD, Fan QL, Yao L, et al. Association of ACE gene I/D polymorphism and diabetic nephropathy in Chinese Hanpopulation: a Meta-analysis[ J]. J Logist Univ CAPF (Med Sci),2012, 21(6): 412-416, 420. [刘晓丹, 范秋灵, 姚丽, 等. 中国汉族人群糖尿病肾病ACE基因I/D多态性的Meta-分析[J]. 武警后勤学院学报(医学版), 2012, 21(6): 412-416, 420.]
[2] Weber JL, David D, Heil J, et al. Human diallelic insertion/deletion polymorphisms[ J]. Am J Hum Genet, 2002, 71(4):854-862.
[3] Mills RE, Luttig CT, Larkins CE, et al. An initial map of insertionand deletion (INDEL) variation in the human genome[ J].Genome Res, 2006, 16(9): 1182-1190.
[4] Bhangale TR, Rieder MJ, Livingston RJ, et al. Comprehensiveidentification and characterization of diallelic insertion-deletionpolymorphisms in 330 human candidate genes[ J]. Hum MolGenet, 2005, 14(91): 59-69.
[5] Bastos-Rodrigues L, Pimenta JR, Pena SD. The genetic structureof human populations studied through short insertion-deletionpolymorphisms[ J]. Ann Hum Genet, 2006, 70(Pt 5): 658-665.
[6] Mills RE, Pittard WS, Mullaney JM, et al. Natural geneticvariation caused by small insertions and deletions in the humangenome[ J]. Genome Res, 2011, 21(6): 830-839.
[7] Pereira R, Phillips C, Alves C, et al. A new multiplex for humanidentification using insertion/deletion polymorphisms[ J].Electrophoresis, 2009, 30(21): 3682-3690.
[8] Levy S, Sutton G, Ng PC, et al. The diploid genome sequence ofan individual human[ J]. PLoS Biol, 2007, 5(10): e254.
[9] Nachman MW, Crowell SL. Estimate of the mutation rate pernucleotide in humans[ J]. Genetics, 2000, 156(1): 297-304.
[10] Manta F, Caiafa A , Pereira R , et al. Indel markers: Geneticdiversity of 38 polymorphisms in Brazilian populations andapplication in a paternity investigation with post mortemmaterial[ J]. Forensic Sci Int Genet, 2012, 6(5): 658-661.
[11] Santos NP, Ribeiro-Rodrigues EM, Ribeiro-Dos-Santos AK, etal. Assessing individual interethnic admixture and populationsubstructure using a 48-insertion-deletion (INSEL) ancestry-informative marker (AIM) panel[ J]. Hum Mutat, 2010, 31(2):184-190.
[12] Zhao SM, Zhang SH, Li CT. InDel_Ty per30: A multiplexPCR system for DNA identif ication among f ive Chinesepopulations[ J]. J Forensic Med, 2010, 26(5): 343-348, 356. [赵书民, 张素华, 李成涛. InDel-typer30: 用于中国5个主要民族DNA鉴定的多重PCR系统[ J]. 法医学杂志, 2010, 26(5): 343-348, 356.]
[13] Li CT, Zhang SH, Zhao SM. Genetic analysis of 30 InDelmarkers for forensic use in five different Chinese populations[ J].Genet Mol Res, 2011, 10(2): 964-979.
[14] Wright S. Evolution and the genetics of populations. In:Variability within and among natural populations[C]. Chicago:University of Chicago Press, 1978.
[15] Bai RF, Jiang LZ, Zhang Z, et al. Genetic polymorphism andforensic application of 30 InDel loci of Han population inBeijing[ J]. Hereditas (Beijing), 2013, 35(12): 1368-1376. [百茹峰, 姜立喆, 张中, 等. 北京汉族群体30个常染色体InDel位点群体遗传学及法医学研究[J]. 遗传, 2013, 35(12): 1368-1376.]
[16] Hong L, Wang XG, Liu SJ, et al. Genetic polymorphisms of 30Indel loci in Guangdong Han population[ J]. J Sun Yat-sen Univ(Med Sci), 2013, 34(2): 299-304. [洪丽, 王小广, 刘素娟, 等.30个插入/缺失多态性位点在中国广东汉族人群中的遗传多态性[J]. 中山大学学报(医学科学版), 2013, 34(2): 299-304.]