CpG位点(英语:CpG sites,或称为CG位点)是指DNA的某个区域,其上的碱基序列以胞嘧啶接着鸟嘌呤出现。“CpG”是“—C—磷酸—G—”的缩写 ,指磷酸二酯键连接了胞嘧啶和鸟嘌呤,其中C位于5'端而G位于3'端。

在CpG位点中的胞嘧啶可以被甲基化5-甲基胞嘧啶。在哺乳动物中,基因内CpG位点的甲基化会改变此基因的表达,对这一表达调控的研究是表观遗传学的重要组成部分。涉及添加甲基基团的称为DNA甲基转移酶英语DNA methyltransferase

在哺乳动物中,70%到80%的CpG位点的胞嘧啶是甲基化的。[1]

未甲基化的CpG位点可以被免疫系统的浆细胞样树突状细胞单核细胞NK细胞B细胞上的TLR9(Toll样受体9)识别[2],来检测体内的微生物感染。

不要混淆CpG位点(左)和C:G配对(右)

在脊椎动物基因组中的出现频率

 
CpG位点的胞嘧啶被甲基化再脱氨变成胸腺嘧啶的过程

一个被发现已久的现象:相对于正常的随机概率期望,CpG位点在脊椎动物基因组中出现的概率非常低。以人类基因组为例(GC含量约为42%),CpG位点的出现概率应为0.21*0.21 = 4.41%;而人类基因组中CpG的实际含量约为1% -- 这尚未达到随机概率的四分之一。根据E Scarano等的论文[3],这一现象发生的原因是脊椎动物基因组中CpG的胞嘧啶被甲基化为5-甲基胞嘧啶后再发生脱氨作用变成胸腺嘧啶,从而形成了从C到T的突变,致使CpG位点的出现概率降低。这种现象被称为CG抑制(CG suppression)。

CpG岛

CpG岛是一个富含CpG位点的区域,但客观精确描述所谓“富含”的定义尚不明确。通常对于CpG岛的正式定义为:一个长度至少为200bp的片段,其GC含量高于50%,且“观察期望比”(observed-to-expexted)高于60%。

注:观察期望比:即CpG位点的观察值(片段实际含有的CpG位点数目)和“期待值”的比值。“期待值”通常有两种算法:(C*G)/LS[4]或((C+G)/2)^2/LS[5]。其中,C、G代表胞嘧啶和鸟嘌呤的数目;LS代表片段长度(length of sequence)。

很多哺乳动物基因组中的CpG岛和基因的起始位点相联系[6]。因此,CpG岛的存在对于基因的预测和解释具有帮助作用。

在哺乳动物基因组中,CpG岛的序列长度通常为300-3000bp,在约40%的基因的启动子附近都有发现[7]。在人基因组中则有约70%的基因启动子有高CpG含量。如前文提及,CpG位点的实际存在率比随机概率的结果要低得多[5]

2002年的某研究阐述了CpG岛的预测规则,使用这种规则可以排除一些高GC含量的基因组序列,如Alu重复序列。基于对人21和22号染色体的完全测序研究成果,长度大于500bp、GC含量高于55%、CpG位点“观察期望比”高于65%的DNA序列更有可能是“真正的”CpG岛[8]

CpG岛以至少达到60%的理论CpG位点含量(可达到4-6%)为特征,而基因组中平均CpG含量只有约1%(CG抑制)。和在基因编码区中的CpG位点不同,在基因正常表达时,位于基因启动子区中的CpG位点往往不会被甲基化;这种现象表明启动子序列中的CpG位点的甲基化很可能导致基因表达被抑制。DNA甲基化和组蛋白修饰是基因铭印的核心过程[9]。大多数组织间或正常样本和癌症样本间的甲基化差异发生在CpG岛附近(CpG island shores)而非CpG岛内部[10]

 
一种CpG岛形成的假说图解:通过未被甲基化,从而在漫长的进化史上保留下来

在脊椎动物中,CpG岛往往位于基因转录起始位点附近,尤其是持家基因。CpG位点有被甲基化的倾向,借助这种甲基化可以分辨新合成的DNA链和母链,这在DNA序列复制后的最终校对环节起重要作用。甲基化的胞嘧啶容易脱氨转变成胸腺嘧啶,导致T/G错误配对。胸腺嘧啶DNA糖苷酶英语Thymine-DNA glycosylase(TDG)是人类用于修复TG错配的酶。但由于CpG位点的稀少性,TDG在理论上没有足够高的效率来消除这些快速发生的突变。通常认为CpG岛存在的原因是因受如下选择压力导致的:需要相对更高的CpG含量、更低的甲基化水平或是调控基因需要。最近也有研究称大多数的CpG岛是由非选择压力形成的[11]

甲基化、基因沉默、癌症与老化

对位于基因启动子内部CpG位点的甲基化可能导致该基因沉默,这种现象在部分人类肿瘤中表现为抑癌基因的沉默。与之对应的,CpG位点的去甲基化则和某些肿瘤的原癌基因过表达相关[12]。甲基化CpG可能激活B细胞、增加抗体、抑制淋巴细胞凋亡、表达促炎细胞因子及TH1型细胞因子,导致全身性免疫疾病产生,或导致SLE、类风湿性关节炎(rheumatoid arthritis)等疾病[13]。妊娠过程中CpG浓度过度升高可能导致妊娠毒血症(preeclampsia)、胎儿早产或畸形等问题[14]

基于衰老和上万个CpG位点的甲基化重要联系,学者已能根据DNA的甲基化情况对人类和黑猩猩的细胞组织寿命进行精确的预测[15]

CpG寡脱氧核苷酸

CpG寡脱氧核苷酸(CpG oligodeoxynucleotide,CpG ODN)是人工合成的CpG类似物,具有临床应用价值。CpG ODN自身通过修饰硫代磷酸酯以抗核酸酶降解,提高稳定性,其免疫 刺激功能广泛应用于各种疾病,而其不同类型决定了不同刺激方式,A型CpG(CpG-A)倾向以双链聚集形式存在,主要激活STING通路,留存于人类pDC细胞早期内体,刺激IFN-α形成;B型CpG(CpG-B)倾向以单链形式存在,激活TLR9通路,从早期内体迅速转移到晚期内体,强烈刺激促炎细胞因子产生;C型CpG(CpG-C)则兼具前两者免疫刺激效果[16]

CpG ODN作为抗原可刺激CD4+及CD8+ T细胞启动增殖分化程序产生免疫反应,因此通过CpG递送的免疫刺激疗法应时而生,CpG佐剂也得到广泛研究[17]。CpG ODN预先刺激可诱导交叉耐受性(cross tolerance),使机体应对LPS感染时产生更强免疫作用[18]

细胞内炎症信号通路涉及TLR9及NF-κB激活,游离CpG ODN皆可摄取进入内体,但甲基化CpG ODN因未能定位内体TLR9而缺乏免疫活性,无法激活下游通路,因此CpG-B作为炎症治疗靶点具有潜在价值[19]。实验及临床中,不同CpG-B序列在啮齿类与灵长类动物TLR9中特异性也不同:对小鼠而言,其CpG-B特异性序列为5'GACGTT3',常用CpG1826(5'TCCATCACGTTCCTGACGTT3')序列;而人类TLR9激活核心序列为5'GTCGTT3',在临床治疗及人类细胞相关实验中最常用的序列为CpG2006(5'TCGTCGTTTTGTCGTTTTGTCGTT3')[20]

参见

  • TLR9,一种用于探测未甲基化CpG序列的受体
  • 生物钟

参考文献

  1. ^ Jabbari, Kamel; Bernardi, Giorgio. Cytosine methylation and CpG, TpG (CpA) and TpA frequencies. Gene. 2004-05-26, 333 [2022-08-28]. ISSN 0378-1119. doi:10.1016/j.gene.2004.02.043. (原始内容存档于2015-09-24) (英语). 
  2. ^ Ramirez-Ortiz, Zaida G.; Specht, Charles A.; Wang, Jennifer P.; Lee, Chrono K.; Bartholomeu, Daniella C.; Gazzinelli, Ricardo T.; Levitz, Stuart M. Toll-Like Receptor 9-Dependent Immune Activation by Unmethylated CpG Motifs in Aspergillus fumigatus DNA. Infection and Immunity. 2008-05, 76 (5) [2022-08-28]. ISSN 0019-9567. PMC 2346696 . PMID 18332208. doi:10.1128/IAI.00047-08. (原始内容存档于2022-08-28) (英语). 
  3. ^ Scarano, E; Iaccarino, M; Grippo, P; Parisi, E. The heterogeneity of thymine methyl group origin in DNA pyrimidine isostichs of developing sea urchin embryos.. Proceedings of the National Academy of Sciences. 1967-05, 57 (5). ISSN 0027-8424. PMC 224485 . PMID 5231746. doi:10.1073/pnas.57.5.1394 (英语). 
  4. ^ Gardiner-Garden, M.; Frommer, M. CpG Islands in vertebrate genomes. Journal of Molecular Biology. 1987-07-20, 196 (2) [2022-08-28]. ISSN 0022-2836. doi:10.1016/0022-2836(87)90689-9. (原始内容存档于2019-03-26) (英语). 
  5. ^ 5.0 5.1 Saxonov, Serge; Berg, Paul; Brutlag, Douglas L. A genome-wide analysis of CpG dinucleotides in the human genome distinguishes two distinct classes of promoters. Proceedings of the National Academy of Sciences. 2006-01-31, 103 (5) [2022-08-28]. ISSN 0027-8424. PMC 1345710 . PMID 16432200. doi:10.1073/pnas.0510310103. (原始内容存档于2022-08-28) (英语). 
  6. ^ Zhang, Wei. Genetics: Analysis of Genes and Genomes, Sixth Edition. Neuro-Oncology. 2005-04-01, 7 (2). ISSN 1523-5866. PMC 1871880 . doi:10.1215/S1152851704200059 (英语). 
  7. ^ Fatemi, M. Footprinting of mammalian promoters: use of a CpG DNA methyltransferase revealing nucleosome positions at a single molecule level. Nucleic Acids Research. 2005-11-27, 33 (20) [2022-08-28]. ISSN 0305-1048. PMC 1292996 . PMID 16314307. doi:10.1093/nar/gni180. (原始内容存档于2022-03-27) (英语). 
  8. ^ Takai, Daiya; Jones, Peter A. Comprehensive analysis of CpG islands in human chromosomes 21 and 22. Proceedings of the National Academy of Sciences. 2002-03-19, 99 (6) [2022-08-28]. ISSN 0027-8424. PMC 122594 . PMID 11891299. doi:10.1073/pnas.052410099. (原始内容存档于2022-08-28) (英语). 
  9. ^ Feil, Robert; Berger, Frédéric. Convergent evolution of genomic imprinting in plants and mammals. Trends in Genetics. 2007-04-01, 23 (4) [2022-08-28]. ISSN 0168-9525. PMID 17316885. doi:10.1016/j.tig.2007.02.004. (原始内容存档于2013-01-02) (英语). 
  10. ^ Irizarry, Rafael A.; Ladd-Acosta, Christine; Wen, Bo; Wu, Zhijin; Montano, Carolina; Onyango, Patrick; Cui, Hengmi; Gabo, Kevin; Rongione, Michael; Webster, Maree; Ji, Hong. The human colon cancer methylome shows similar hypo- and hypermethylation at conserved tissue-specific CpG island shores. Nature Genetics. 2009-02, 41 (2) [2022-08-28]. ISSN 1546-1718. PMC 2729128 . PMID 19151715. doi:10.1038/ng.298. (原始内容存档于2022-08-28) (英语). 
  11. ^ Cohen, Netta Mendelson; Kenigsberg, Ephraim; Tanay, Amos. Primate CpG Islands Are Maintained by Heterogeneous Evolutionary Regimes Involving Minimal Selection. Cell. 2011-05-27, 145 (5). ISSN 0092-8674. PMID 21620139. doi:10.1016/j.cell.2011.04.024 (英语). 
  12. ^ Jones, Peter A.; Laird, Peter W. Cancer-epigenetics comes of age. Nature Genetics. 1999-02, 21 (2) [2022-08-28]. ISSN 1546-1718. PMID 9988266. doi:10.1038/5947. (原始内容存档于2022-08-28) (英语). 
  13. ^ Roh, Jong Seong; Sohn, Dong Hyun. Damage-Associated Molecular Patterns in Inflammatory Diseases. Immune Network. 2018, 18 (4). ISSN 1598-2629. doi:10.4110/in.2018.18.e27. 
  14. ^ Konečná, B.; Lauková, L.; Vlková, B. Immune activation by nucleic acids: A role in pregnancy complications. Scandinavian Journal of Immunology. 2018-03-25, 87 (4). ISSN 0300-9475. doi:10.1111/sji.12651. 
  15. ^ Horvath, Steve. DNA methylation age of human tissues and cell types. Genome Biology. 2013, 14 (10) [2022-08-28]. ISSN 1465-6906. PMC 4015143 . PMID 24138928. doi:10.1186/gb-2013-14-10-r115. (原始内容存档于2022-09-01) (英语). 
  16. ^ Bode, Christian; Poth, Jens M.; Fox, Mario; Schulz, Susanne; Klinman, Dennis M.; Latz, Eicke; Steinhagen, Folkert. Cytosolic <scp>d</scp> ‐type CpG‐oligonucleotides induce a type I interferon response by activating the cGAS‐STING signaling pathway. European Journal of Immunology. 2021-05-12, 51 (7). ISSN 0014-2980. doi:10.1002/eji.202048810. 
  17. ^ Seder, Robert A; Ahmed, Rafi. Similarities and differences in CD4+ and CD8+ effector and memory T cell generation. Nature Immunology. 2003-09, 4 (9). ISSN 1529-2908. doi:10.1038/ni969. 
  18. ^ Slotta, Jan E.; Scheuer, Claudia; Menger, Michael D.; Vollmar, Brigitte. Immunostimulatory CpG-oligodeoxynucleotides (CpG-ODN) induce early hepatic injury, but provide a late window for protection against endotoxin-mediated liver damage. Journal of Hepatology. 2006-03, 44 (3). ISSN 0168-8278. doi:10.1016/j.jhep.2005.08.014. 
  19. ^ de Jong, Susan D.; Basha, Genc; Wilson, Kaley D.; Kazem, Mikameh; Cullis, Pieter; Jefferies, Wilf; Tam, Ying. The Immunostimulatory Activity of Unmethylated and Methylated CpG Oligodeoxynucleotide Is Dependent on Their Ability To Colocalize with TLR9 in Late Endosomes. The Journal of Immunology. 2010-06-01, 184 (11). ISSN 0022-1767. doi:10.4049/jimmunol.0802442. 
  20. ^ Lim, Hye-Sun. Tectorigenin Attenuates Pro-inflammatory Mediators by Inhibiting NF-&[kappa]B Activation in Lipopolysaccharide-Stimulated BV-2 Microglia. dx.doi.org. 2016-11-01 [2023-07-03].