潮汕人与广府、客家人母系遗传背景差异的分析
李晓昀;苏敏;黄海花;李辉;田东萍;高玉霞
【摘 要】目的 广东汉族3大民系即潮汕、广府和客家人都是内陆中原汉族移民的后裔,本研究利用反映母系遗传的线粒体DNA(mtDNA)证据分析3大民系的遗传背景差异.方法 收集89份潮汕人血样和48份内陆中原河南太行山食管癌高发区人血样,构建每个个体的mtDNA单倍;广府和客家人的单倍数据来自文献.将这3大民系人的单倍分布情况与河南太行山人和南方原住民族人进行比较分析.结果 河南太行山人主要由北方汉族主要单倍构成,广府和客家人则以南方原住民族主要单倍为主,潮汕人表现为北方汉族主要单倍稍高于南方原住民族主要单倍.基于单倍频率的主成分分析显示,河南太行山和潮汕人聚在一起,客家和广府人则与南方原住民族体聚在一起.结论 3大民系中,只有潮汕人的中原汉族血统更纯正,与河南太行山人的关系最近,这可能也是其为南方沿海食管癌高危人的原因之一;而客家和广府人则与南方原住民族在母系血统上有更多的交融.
【期刊名称】《西安交通大学学报(医学版)》
【年(卷),期】2010(031)006
【总页数】5页(P664-668)
【关键词】潮汕;广府;客家;mtDNA;遗传背景
【作 者】李晓昀;苏敏;黄海花;李辉;田东萍;高玉霞
【作者单位】汕头大学医学院病理教学研究室,广东省教育厅重点免疫病理实验室,汕头广东,515031;汕头大学医学院病理教学研究室,广东省教育厅重点免疫病理实验室,汕头广东,515031;汕头大学医学院病理教学研究室,广东省教育厅重点免疫病理实验室,汕头广东,515031;复旦大学生命科学学院遗传工程国家重点实验室及现代人类学研究中心,上海,200433;汕头大学医学院病理教学研究室,广东省教育厅重点免疫病理实验室,汕头广东,515031;汕头大学医学院病理教学研究室,广东省教育厅重点免疫病理实验室,汕头广东,515031
【正文语种】中 文
【中图分类】Q987
向南方
广东汉族3大民系,分别是操潮汕、白话和客家方言的潮汕、广府和客家人。潮汕人居住地潮汕地区地处华南沿海闽粤两省交界处,广府人以广州为中心分布于珠三角及周边地区,客家人主要集中于广东和福建、江西的交界处。据历史记载,中国南方古老的原住民主要是百越、荆蛮族[1-2],而3大民系都是中原汉族在不同时期迁到广东不同地区后形成的。3大民系中,只有潮汕人是食管癌高发人,发病风险最高的潮汕南澳岛人1995~2004年间的食管癌世界人口标化年发病率为109.28/10万[3],始终徘徊于世界食管癌高发区行列。而且潮汕食管癌发病率、家族聚集现象与病理类型和众所周知的食管癌高发区——内陆中原太行山区(山西、河南、河北交界处)基本类似[4-7]。这是否提示3大民系虽然都是中原移民后裔,但遗传背景上存在差异,潮汕人和中原食管癌高发区人间可能存在更近的遗传关系?本研究选用已被广泛应用于人进化和遗传关系研究的反映母系遗传背景的线粒体DNA(mtDNA)多态性标记,将3大民系与中原太行山和南方原住民族人的母系遗传背景比较,分析他们的遗传背景差异。
1 材料与方法
1.1 材料 在知情同意原则下,分别于2002~2004年间在潮汕地区和河南太行山区共采集137个相互间无亲缘关系的成年汉族男性个体的静脉血。具体采样包括:潮汕人血样89份,来自潮
汕地区操潮汕方言的的南澳、澄海、潮阳、潮州;河南太行山人血样48份,来自河南的食管癌高发区林县和新乡;广府和客家人的数据由复旦大学生命科学院人类学研究室提供,分别来自广州(68个个体)和福建长汀客家人(54个个体)。
1.2 线粒体多态性分析 常规苯-酚抽提基因组DNA。线粒体高变1区(HVS-1)用引物L15974(序列为 TCCACCA TTAGCACCCAAAG)和 H16488 (序列为AGGAACCAGATGTCGGATACAG)进行PCR扩增,扩增产物经虾碱酶(shrimp alkaline phosphatase,SAP)和核酸外切酶Ⅰ(ExoncleaseⅠ)纯化后,通过Big-Dye末端荧光标记试剂盒(美国PE公司)进行测序反应。测序反应产物经乙醇沉淀后用ABI PRISM 3100测序仪(美国PE公司)进行核苷酸序列测定。另外参照东亚人线粒体单倍系统树[8],选取线粒体编码区6个多态性位点(COII-tRNALys9bp缺失、9824HinfI、4831HhaI、5176AluI、10310NlaⅢ、10397AluI),它们包含了大多数中国人mtDNA基因型。9 bp缺失位点PCR产物直接用35 g/L的琼脂糖凝胶电泳检测;其余位点PCR产物使用相应限制性内切酶酶切,用PCR-限制性片段长度多态性(PCR-RFLP)的方法进行基因分型。引物在上海生物工程公司合成,限制性内切酶、虾碱酶和外切酶均购自纽英伦生物技术公司(New England Biolabs,USA)。
1.3 数据分析
1.3.1 mtDNA单倍推断 参照校对后的mtDNA剑桥标准序列(rCRS)[9],用 DNAStart和 BioEdit7.0软件对线粒体 HVS-I区序列进行分析比对。根据东亚人线粒体单倍系统树[8],结合HVS-I区序列的某些特征性多态位点和编码区检测的6个多态位点,推断所检测的潮汕和河南太行山区每个个体所属的mtDNA单倍。所谓mtDNA单倍是用来命名在mtDNA系统关系树中处于一个单系位置上的一组mtDNA,它们共享一些特定突变,是由一个最近的共同祖先及其所有后代组成的一组mtDNA[10]。
1.3.2 统计学分析 分别统计所研究人中mtDNA单倍的频率分布情况,并进一步总结北方汉族人主要单倍(A、C、D、G、M8a、Y和Z)和南方原住民族主要单倍(B、F、R9a、R9b和N9a)在所研究人中的分布。据文献报道[11-14],东亚北部的主要mtDNA单倍A、C、D、G、M8a、Y和Z在中国北方汉族中的频率明显高于南方汉族,是北方汉族人的主要单倍,而南方原住民族的主要单倍B、F、R9a、R9b和N9a在南方汉族的频率则比北方汉族明显高。
基于各人单倍频率分布情况,用SPSS11.5软件进行主成分分析(principal component analysis, PC),研究人间母系亲缘关系的远近。在主成分分析中加入了4个百越族(傣族98
个个体、壮族26个个体、水族30个个体、仫佬族39个个体)和4个荆蛮族(苗族39个个体、土瑶41个个体、八排瑶35个个体、盘瑶32个个体)共8个南方主要原住民族人单倍数据(由复旦大学生命科学院人类学研究室提供)。考虑到同一单倍下的各亚间有比较近的亲缘关系,若各亚作为独立的变量可能会导致分析结果的误差,故主成分分析时将B、D、F、M7单倍下的亚各自合并一起分析。所谓主成分分析,就是根据各观察变量间的相互关系,用较少的综合指标即主成分来反应存在于各变量中的各类信息,观察变量的总方差在各主成分上重新分配,第一主成分(PC1)有最大方差,其所包含的信息占总信息的比值最大,后续主成分可解释的方差逐个减少。此外,主成分值与单倍频率间的相关分析也在SPSS11.5软件上进行。
2 结 果
表1 mtDNA单倍在3大民系与河南太行山人的频率分布Tab.1 mtDNA haplogroup frequency distribution among the three ethnic populations and the Taihang Mountain population (%)A包括MG*、N*及R11;加*的单倍表示属于该单倍的个体不能排除属于下一级某个亚的可能性,但目前尚不能进一步明确。单倍 潮汕人(n=89) 广州人(n=68)
长汀客家人(n=54) 河南太行山人(n=48) A 7.87 0 0 6.25 B4 0 8.82 1.85 0 B4A 3.37 14.71 1.85 4.17 B4B1 3.37 5.88 1.85 2.08 B4C1 5.62 0 0 0 B5* 2.25 0 0 0 B5a 2.25 0 5.56 2.08 B5b 1.12 1.47 3.70 10.42 C 3.37 0 3.70 6.25 D* 5.62 8.82 9.26 16.67 D4a 6.74 0 0 0 D4b 1.12 0 0 0 D5 2.25 5.88 3.70 2.08 D5a 3.37 0 0 6.25 F* 3.37 4.41 3.70 2.08 F1a 3.37 17.65 14.81 6.25 F1b 2.25 1.47 5.56 2.08 F10 0 0 0 F1c 0 1.47 0 2.08 F2a 1.12 1.47 0 0 F2*0 0 0 0 G* 5.62 1.47 1.85 10.42 M* 0 5.88 5.56 0 M7* 1.12 1.47 0 0 M7b 5.62 5.88 5.56 0 M7b1 2.25 2.94 5.56 0 M7b2 1.12 0 0 2.08 M7c 0 1.47 7.41 0 M8a 4.49 2.94 3.70 6.25 M9a 3.37 0 0 2.08 N* 1.12 1.47 0 0 N9a 3.37 1.47 5.56 4.17 M10 0 0 0 2.08 R* 0 1.47 0 0 R9a 4.49 1.47 0 0 R9b 1.12 0 0 0 R11 1.12 0 0 2.08 Y 3.37 0 1.85 2.08 Z 3.37 0 7.41 0