基因組進化

基因組進化基因組 的結構(序列)或大小隨時間變化過程。 基因組進化的研究涉及多個領域,如基因組的結構分析,基因組寄生蟲的研究,基因和古代基因組重複,多倍體比較基因組學。由於原核生物和真核生物的基因序列是穩定增加的,故基因組進化是一個不斷變化和發展的領域,況且這些基因序列可以從科學界和廣大公眾中獲取。

使用JCVI在線基因組工具創建的麻風分枝桿菌基因組的圓形圖示。

歷史

自從20世紀70年代末人類第一次獲得基因組序列以來,[1] 科學家就一直在使用比較基因組學來研究各種基因組之間的差異和相似性。基因組測序已經成功地進行了包括越來越複雜的基因組研究,包括在2001年的整個人類基因組的最終測序。 [2]通過比較近親和遠距祖先的基因組,物種之間的明顯差異性和相似性以及基因組隨時間演化的機制開始出現。

 
原核生物進化的主要力量及其對古菌和細菌基因組的影響。 水平線顯示了對數標度上的古細菌和細菌基因組大小(以兆鹼基對)和大致相應的基因數目(在括號中)。原核基因組進化的主要力量的影響由三角形表示, 在基因組大小的範圍內,相應的效應被認為是最顯着的。

原核和真核基因組

原核生物

原核基因組有兩個主要的進化機制:突變水平基因轉移[3]。第三種機制,在真核生物的有性繁殖中突顯但在細菌中並沒有發現,儘管原核生物可以通過細菌接合過程獲得新的遺傳物質,其中質體和整個染色體可以在生物體之間傳遞。這個過程的一個常被引用的例子是利用質體DNA轉移抗生素抗性[4]。基因組進化的另一種機制通過轉導提供,其中噬菌體將新的DNA引入細菌基因組。 細菌中的基因組進化被很好地理解,是因為我們能獲得數千個完全測序的細菌基因組。由於適應性基因組的精簡和純化選擇,遺傳變化可能導致基因組複雜性的增加或減少。[5] 一般來說,自由生活的細菌已經發展出具有更多基因的更大基因組,使得它們可以更容易地適應變化的環境條件。相比之下,大多數寄生細菌具有相對少的基因組,因為它們的宿主提供許多(即使不是大多數)營養物,使得它們的基因組不需要編碼產生這些營養物的酶[6]

真核生物

性質 大腸桿菌基因組 人類基因組
基因組大小(鹼基對) 4.6 Mb 3.2 Gb
基因組結構 環狀 線性
染色體數目 1 46
存在質體
存在組蛋白
基因數目 4,288 約20,000
存在內含子 [7]
平均基因大小 700 bp 27,000 bp

真核基因組通常大於原核生物。大腸桿菌基因組的長度大約為4.6Mb,[8] 相比之下,人類基因組要大得多,約為3.2Gb。[9] 真核基因組是線性的,並且可以由封裝在細胞核中的多個染色體組成。基因的非編碼部分,稱為內含子,其大部分不存在於原核生物中,在蛋白質翻譯發生之前通過RNA剪接除去。真核基因組隨時間推移通過許多機制包括有性繁殖而演變,其向後代引入比原核生物複製過程更複雜的遺傳多樣性,其中後代理論上是親代細胞的遺傳克隆。

基因組大小

基因組大小通常以鹼基對(或單鏈DNARNA中的鹼基)來衡量。C值是基因組大小的另一種度量。原核基因組研究表明,原核生物的C值與構成基因組的基因數量之間存在顯著的正相關。[10] 這表明基因數是影響原核基因組大小的主要因素。在真核生物中,有這樣的一個矛盾,即構成基因組的基因的數量與基因組大小不相關。換句話說,基因組大小遠遠大於預期給定的蛋白質編碼基因的總數。[11]

基因組大小可以通過重複插入多倍體來增加。重組可導致DNA損失或增加。基因組也可以由於缺失而收縮。這種基因衰減的一個著名例子是麻風分枝桿菌麻風病原體的基因組。 由於假基因的形成,麻風桿菌已經失去了許多一次性功能基因。[12] 這也就證實了其最接近的是祖先結合分支桿菌[13]麻風分枝桿菌在宿主內部生活和複製,並且由於這種安排,它不需要許多已經攜帶的基因,這允許它可以在宿主以外的環境中生存和繁殖。因此,隨着時間的推移,這些基因通過諸如使其成為假基因的突變機制使其喪失了它們的功能。有機體擺脫非必需基因是有益的,因為它使得複製其DNA更快,需要更少的能量。[14]

在絲狀植物病原體中看到了基因組大小隨時間增加的實例。這些植物病原體基因組在過去幾年中由於重複驅動的擴增而一直在增長。富含重複區含有編碼與宿主相互作用的蛋白基因。隨着向這些區域添加越來越多的重複,植物通過突變和其他形式的遺傳重組增加了發展新的毒性因子的可能性。以這種方式,這些植物病原體具有更大的基因組是有益的。[15]

基因組進化的機制

基因複製

基因複製是一種複製編碼基因的DNA區域的過程。這可以作為重組中的錯誤或通過反轉錄事件的結果而發生。重複基因對通常存在於基因的選擇壓力是免疫的。這可導致在重複基因密碼中累積大量突變。這可以使基因無功能或在一些情況下賦予生物體一些益處。[16][17]

全基因組重複

類似於基因複製,全基因組複製是一個有機體的整個遺傳信息被複製,一次或多次被稱為多倍體的過程。[18] 這可以通過向生物體提供多個拷貝的基因,從而產生更多的功能和選擇優選基因的可能性,從而為生物體提供進化上的益處。1997年,Wolfe&Shields為釀酒酵母酵母)基因組的原始重複提供了證據。 [19]最初指出,這種酵母基因組包含許多個別基因重複。Wolfe&Shields假設這實際上是酵母遠處進化歷史中整個基因組重複的結果。他們發現32對同源染色體區,占酵母基因組的一半以上。他們還指出,儘管同源物存在,但它們通常位於不同的染色體上。 基於這些觀察,他們確定釀酒酵母在其從克魯維酵母屬,子囊菌屬酵母屬的進化分裂之後很快經歷了全基因組重複。 隨着時間的推移,許多複製基因被刪除並且變得無作用。許多染色體重排將原始的重複染色體打破成同源染色體區域的當前現狀。 這個想法進一步鞏固了在酵母的近親棉阿舒囊霉的基因組。[20] 全基因組複製在真菌以及植物物種中是常見的。極端基因組複製的一個例子是由大米草(Spartina anglica)表示的,它是一種十二倍體,意味着它含有12組染色體,[21] 與人類二倍體結構形成鮮明對比,其中每個個體只有兩組23染色體。

轉座效應

轉座子是可以通過以下兩種機制自我轉移位置的DNA片段。這些機制與文字處理程序中的「剪切-粘貼」和「複製-粘貼」功能類似。「剪切-粘貼」機制通過從基因組中的一個位置切除DNA並將其自身插入到序列的另一個位置來工作。「複製-粘貼」機制通過複製DNA的特定區域形成拷貝並將這些拷貝插入序列中的其他地方來工作[22][23]人類基因組中最常見的可轉座因子是Alu序列,其在基因組中存在超過一百萬次。[24]

基因突變

自發突變常常發生,其可以引起基因組中的各種變化。突變可以改變一個或多個核苷酸的身份,或導致一個或多個核苷酸鹼基的添加或缺失。這種變化可能導致移碼突變,導致整個代碼以與原始序列不同的順序讀取,通常導致蛋白質變得無作用[25]啟動子區、增強子區或轉錄因子結合區中的突變也可導致這些調節元件靶向的基因的轉錄中的功能喪失或上調或下調。突變在生物體的基因組中不斷發生,並且可能導致負效應,正效應或中性效應(根本沒有效果)。[26][27]

假基因

假基因由相關的基因失去其功能而來,通常是基因突變的結果。有許多造成假基因的機制,比如在功能基因缺失或插入一個或多個核苷酸,可以造成閱讀框的偏移,使基因不再編碼原先的蛋白,或者提前引入終止密碼子以及在啟動子區域的突變等等[28]。在人類基因組中最常提到的假基因的例子是嗅覺相關的基因家族。隨着時間的流逝,人類基因組中的許多嗅覺基因變為假基因不再生成蛋白,從而使人類的嗅覺能力遠低於其它哺乳動物[29][30]

外顯子重排

外顯子重排是新基因產生的又一種機制,可發生在擁有兩個或更多外顯子的基因之間,或在外顯子複製之時。 外顯子重排通過改變當前的內含子 - 外顯子結構而產生新的基因。這可以通過任何以下過程發生:轉座因子媒介的重排、性重組或非同源重組(也稱為非正式重組)。外顯子重排可以將新基因引入基因組,其可以選擇針對和缺失或選擇性地傾向和保守。.[31][32][33]

基因組減少和基因丟失

當許多物種不再需要它們的基因的子集時,便會呈現出基因組減少的狀態。 這通常在有機體適應寄生生活方式時發生,例如:當它們的營養物由宿主提供時。因此,它們丟棄產生這些營養物所需的基因。在許多情況下,自由生活物種和寄生物種可以相互比較同時確定他們失去的基因。好的實例是結核分枝桿菌麻風分枝桿菌的基因組,後者的基因組顯着降低。

另一個好的例子是內共生體物種。例如,多核桿菌必須首先被描述為細胞質的游仆蟲的細胞質內共生菌。在不存在必需氨基酸的少數情況下,不同的和更罕見的細菌顯然提供相同的功能。嘗試在他們的宿主外生長共生的必需氨基酸尚未成功,就明顯地表明這種關係對於兩者都是必須的。然而,已確定密切相關的自由生活親緣關係與其自由生活親緣相比(1.56Mbp對2.16Mbp),內共體具有顯著降低的基因組。[34]

基因組進化與物種形成

 
Cichlids such as Tropheops tropheops from Lake Malawi provide excellent models for genome evolution.

進化生物學的一個主要問題是基因組如何改變以創造新物種。物種形成需要行為, 形態, 生理, or 代謝(或其組合)的變化。在物種形成過程中基因組的進化只在最近才得到新一代測序技術的研究。 例如,非洲湖中的麗魚在形態上和行為上都不同。5種物種的基因組已經揭示了序列以及許多基因的表達模式在相對短的時間(100,000至幾百萬年)內快速改變。值得注意的是,20%的重複基因對獲得了一個完全新的組織特異性表達模式,表明這些基因也獲得了新的功能。 假定基因表達由短調節序列驅動,這表明需要相對少的突變來驅動物種形成。麗魚基因組還表明在參與基因表達的微小RNA中的進化速度增加。 [35][36]

基因表達

突變可導致基因功能的改變,或者可能更經常地導致基因表達模式的改變。事實上,對12種動物物種的研究為其提供了強有力的證據,組織特異性基因表達在不同物種的直系同源物之間大部分保守。然而,同一物種內的旁系同源物之前通常具有不同的表達模式。 也就是說,在基因複製後,經常改變它們的表達模式,例如通過在另一組織中表達並因此採用新的功能。[37]

核苷酸組成(GC含量)

遺傳密碼由四個核苷酸鹼基的序列組成:腺嘌呤鳥嘌呤胞嘧啶胸腺嘧啶,通常稱為A,G,C和T。GC含量是基因組內G&C鹼基的百分比。不同生物體之間的GC含量差異很大。 [38] 基因編碼區已顯示具有較高的GC含量,並且基因越長,存在的G和C鹼基的百分比越大。更高的GC含量賦予了益處,因為鳥嘌呤 - 胞嘧啶鍵由三個氫鍵組成,而腺嘌呤 - 胸腺嘧啶鍵僅由兩個組成。 因此,三個氫鍵給予DNA鏈更大的穩定性。因此,重要的基因通常具有比生物體基因組的其他部分更高的GC含量也就不足為奇。[39] 由於這個原因,許多生活在非常高的溫度的物種,例如圍繞熱液噴口的生態系統,具有非常高的GC含量。在調節序列例如表示基因起始的啟動子中也觀察到高GC含量。許多啟動子含有CpG島,基因組的區域,其中胞嘧啶核苷酸以較大比例在鳥嘌呤核苷酸旁邊出現。 還表明,屬中物種之間的GC含量的廣泛分佈顯示更古老的祖先。由於物種有更多的時間進化,它們的GC含量發生了進一步的分化。[40]

遺傳密碼的進化翻譯

氨基酸由三個鹼基長密碼子組成,並且甘氨酸丙氨酸的特徵在於在前兩個密碼子鹼基位置處具有鳥嘌呤 - 胞嘧啶鍵的密碼子。 這種GC鍵給予DNA結構更多的穩定性。 已經假設,由於第一生物在高熱和壓力環境中進化,它們需要這些GC鍵在其遺傳密碼中的穩定性。

基因的從頭起源

新基因可來自非編碼DNA。例如,Levine及其同事報道了來自非編碼DNA的黑腹果蠅基因組中5個新基因的起源。 [41][42] 隨後,基因的新生起源也在其他生物體中顯示,如酵母,[43] 水稻水稻[44] 和人類。[45]例如,吳等人。(2011)報道了60個推定的新的人特異性基因,所有這些基因都是短的,包括單個外顯子(除了一個外)。[46]

參考文獻

  1. ^ Fiers, W.; Contreras, R.; Duerinck, F.; Haegeman, G.; Iserentant, D.; Merregaert, J.; Min Jou, W.; Molemans, F.; Raeymaekers, A.; Van Den Berghe, A.; Volckaert, G.; Ysebaert, M. Complete nucleotide sequence of bacteriophage MS2 RNA: primary and secondary structure of the replicase gene. Nature. Apr 8, 1976, 260 (5551): 500–7. Bibcode:1976Natur.260..500F. PMID 1264203. doi:10.1038/260500a0. 
  2. ^ Venter JC, Adams MD, Myers EW, Li PW, Mural RJ, Sutton GG, et al. The sequence of the human genome. Science. 2001, 291 (5507): 1304–51. PMID 11181995. doi:10.1126/science.1058040. 
  3. ^ Toussaint, Ariane; Chandler, Mick. Prokaryote genome fluidity: toward a system approach of the mobilome. Methods in molecular biology (Clifton, N.J.). Methods in Molecular Biology. 2012, 804: 57–80. ISBN 978-1-61779-360-8. PMID 22144148. doi:10.1007/978-1-61779-361-5_4. 
  4. ^ Ruiz, Joaquim; Pons, Maria J.; Gomes, Cláudia. Transferable mechanisms of quinolone resistance. International journal of antimicrobial agents. September 2012, 40 (3): 196–203. PMID 22831841. doi:10.1016/j.ijantimicag.2012.02.011. 
  5. ^ Koonin, Eugene V.; Wolf, Yuri I. Genomics of bacteria and archaea: the emerging dynamic view of the prokaryotic world. Nucleic Acids Research. 2008-12-01, 36 (21): 6688–6719. ISSN 0305-1048. PMC 2588523 . PMID 18948295. doi:10.1093/nar/gkn668. 
  6. ^ Tortora, Gerard J. Microbiology: An Introduction. 2015. ISBN 0321929152. 
  7. ^ Dai, Lixin; Zimmerly, Steven. The dispersal of five group II introns among natural populations of Escherichia coli. RNA. October 2002, 8 (10): 1294–307. PMC 1370338 . PMID 12403467. doi:10.1017/S1355838202023014. 
  8. ^ Blattner, F. R.; Plunkett g, 3rd; Bloch, CA; Perna, NT; Burland, V; Riley, M; Collado-Vides, J; Glasner, JD; Rode, CK; Mayhew, GF; Gregor, J; Davis, NW; Kirkpatrick, HA; Goeden, MA; Rose, DJ; Mau, B; Shao, Y. The complete genome sequence of Escherichia coli K-12. Science. Sep 5, 1997, 277 (5331): 1453–62. PMID 9278503. doi:10.1126/science.277.5331.1453. 
  9. ^ International Human Genome Sequencing Consortium. Finishing the euchromatic sequence of the human genome. Nature. Oct 21, 2004, 431 (7011): 931–45. Bibcode:2004Natur.431..931H. PMID 15496913. doi:10.1038/nature03001. 
  10. ^ Gregory, T. Ryan. Coincidence, coevolution, or causation? DNA content, cell size, and the C-value enigma. Biological reviews of the Cambridge Philosophical Society. February 2001, 76 (1): 65–101. PMID 11325054. doi:10.1017/S1464793100005595. 
  11. ^ Gregory, TR. A bird's-eye view of the C-value enigma: genome size, cell size, and metabolic rate in the class aves. Evolution; international journal of organic evolution. January 2002, 56 (1): 121–30. PMID 11913657. doi:10.1111/j.0014-3820.2002.tb00854.x. 
  12. ^ Singh, Pushpendra; Cole, Stewart T. Mycobacterium leprae: genes, pseudogenes and genetic diversity. Future microbiology. January 2011, 6 (1): 57–71. PMC 3076554 . PMID 21162636. doi:10.2217/fmb.10.153. 
  13. ^ Eiglmeier, K; Parkhill, J; Honoré, N; Garnier, T; Tekaia, F; Telenti, A; Klatser, P; James, KD; Thomson, NR; Wheeler, PR; Churcher, C; Harris, D; Mungall, K; Barrell, BG; Cole, ST. The decaying genome of Mycobacterium leprae. Leprosy review. December 2001, 72 (4): 387–98. PMID 11826475. 
  14. ^ Rosengarten, Renate; Citti, Christine; Glew, Michelle; Lischewski, Axel; Droeße, Martina; Much, Peter; Winner, Florian; Brank, Marion; Spergser, Joachim. Host-pathogen interactions in mycoplasma pathogenesis: virulence and survival strategies of minimalist prokaryotes. International journal of medical microbiology : IJMM. March 2000, 290 (1): 15–25. PMID 11043978. doi:10.1016/S1438-4221(00)80099-5. 
  15. ^ Raffaele, Sylvain; Kamoun, Sophien. Genome evolution in filamentous plant pathogens: why bigger can be better. Nature reviews. Microbiology. May 8, 2012, 10 (6): 417–30. PMID 22565130. doi:10.1038/nrmicro2790. 
  16. ^ Zhang, Jianzhi. Evolution by gene duplication: an update. Trends in Ecology & Evolution. 2003, 18 (6): 292–298. doi:10.1016/S0169-5347(03)00033-8. 
  17. ^ Taylor, John S.; Raes, Jeroen. Duplication and divergence: the evolution of new genes and old ideas. Annual Review of Genetics. 2004, 38: 615–43. PMID 15568988. doi:10.1146/annurev.genet.38.072902.092831. 
  18. ^ Song, Can; Liu, Shaojun; Xiao, Jun; He, Weiguo; Zhou, Yi; Qin, Qinbo; Zhang, Chun; Liu, Yun. Polyploid organisms. Science China Life Sciences. April 2012, 55 (4): 301–11. PMID 22566086. doi:10.1007/s11427-012-4310-2. 
  19. ^ Wolfe, Kenneth H.; Shields, Denis C. Molecular evidence for an ancient duplication of the entire yeast genome. Nature. Jun 12, 1997, 387 (6634): 708–13. PMID 9192896. doi:10.1038/42711. 
  20. ^ Dietrich, F. S.; Voegeli, S; Brachat, S; Lerch, A; Gates, K; Steiner, S; Mohr, C; Pöhlmann, R; Luedi, P; Choi, S; Wing, RA; Flavier, A; Gaffney, TD; Philippsen, P. The Ashbya gossypii genome as a tool for mapping the ancient Saccharomyces cerevisiae genome. Science. Apr 9, 2004, 304 (5668): 304–7. Bibcode:2004Sci...304..304D. PMID 15001715. doi:10.1126/science.1095781. 
  21. ^ Buggs, Richard J. A. Monkeying around with ploidy. Molecular Ecology. November 2012, 21 (21): 5159–61. PMID 23075066. doi:10.1111/mec.12005. 
  22. ^ Wicker, Thomas; Sabot, François; Hua-Van, Aurélie; Bennetzen, Jeffrey L.; Capy, Pierre; Chalhoub, Boulos; Flavell, Andrew; Leroy, Philippe; Morgante, Michele; Panaud, Olivier; Paux, Etienne; Sanmiguel, Phillip; Schulman, Alan H. A unified classification system for eukaryotic transposable elements. Nature Reviews Genetics. December 2007, 8 (12): 973–82. PMID 17984973. doi:10.1038/nrg2165. 
  23. ^ Ivics, Zoltán; Izsvák, Zsuzsanna. A whole lotta jumpin' goin' on: new transposon tools for vertebrate functional genomics. Trends in genetics : TIG. January 2005, 21 (1): 8–11. PMID 15680506. doi:10.1016/j.tig.2004.11.008. 
  24. ^ Oler, Andrew J; Traina-Dorge, Stephen; Derbes, Rebecca S; Canella, Donatella; Cairns, Brad R; Roy-Engel, Astrid M. Alu expression in human cell lines and their retrotranspositional potential. Mobile DNA. Jun 20, 2012, 3 (1): 11. PMC 3412727 . PMID 22716230. doi:10.1186/1759-8753-3-11. 
  25. ^ Griffiths, Anthony. Slipping and sliding: frameshift mutations in herpes simplex virus thymidine kinase and drug-resistance. Drug resistance updates : reviews and commentaries in antimicrobial and anticancer chemotherapy. December 2011, 14 (6): 251–9. PMC 3195865 . PMID 21940196. doi:10.1016/j.drup.2011.08.003. 
  26. ^ Eyre-Walker, Adam; Keightley, Peter D. The distribution of fitness effects of new mutations. Nature Reviews Genetics. August 2007, 8 (8): 610–8. PMID 17637733. doi:10.1038/nrg2146. 
  27. ^ Gillespie, John H. Molecular Evolution Over the Mutational Landscape. Evolution. 1 September 1984, 38 (5): 1116. JSTOR 2408444. doi:10.2307/2408444. 
  28. ^ Pink, R. C.; Wicks, K.; Caley, D. P.; Punch, E. K.; Jacobs, L.; Carter, D. R. Pseudogenes: pseudo-functional or key regulators in health and disease?. RNA. May 2011, 17 (5): 792–8. PMC 3078729 . PMID 21398401. doi:10.1261/rna.2658311. 
  29. ^ Sharon, Dror; Glusman, Gustavo; Pilpel, Yitzhak; Horn-Saban, Shirley; Lancet, Doron. Genome dynamics, evolution, and protein modeling in the olfactory receptor gene superfamily. Annals of the New York Academy of Sciences. Nov 30, 1998, 855: 182–93. Bibcode:1998NYASA.855..182S. PMID 9929603. doi:10.1111/j.1749-6632.1998.tb10564.x. 
  30. ^ Mombaerts, Peter. The human repertoire of odorant receptor genes and pseudogenes. Annual Review of Genomics and Human Genetics. 2001, 2: 493–510. PMID 11701659. doi:10.1146/annurev.genom.2.1.493. 
  31. ^ Liu, Mingyi; Grigoriev, Andrei. Protein domains correlate strongly with exons in multiple eukaryotic genomes--evidence of exon shuffling?. Trends in genetics : TIG. September 2004, 20 (9): 399–403. PMID 15313546. doi:10.1016/j.tig.2004.06.013. 
  32. ^ Froy, Oren; Gurevitz, Michael. Arthropod and mollusk defensins--evolution by exon-shuffling. Trends in genetics : TIG. December 2003, 19 (12): 684–7. PMID 14642747. doi:10.1016/j.tig.2003.10.010. 
  33. ^ Roy, Scott William. Recent evidence for the exon theory of genes. Genetica. July 2003, 118 (2–3): 251–66. PMID 12868614. doi:10.1023/A:1024190617462. 
  34. ^ Boscaro, V.; Felletti, M.; Vannini, C.; Ackerman, M. S.; Chain, P. S. G.; Malfatti, S.; Vergez, L. M.; Shin, M.; Doak, T. G.; Lynch, M.; Petroni, G. Polynucleobacter necessarius, a model for genome reduction in both free-living and symbiotic bacteria. Proceedings of the National Academy of Sciences. 2013, 110 (46): 18590–18595. Bibcode:2013PNAS..11018590B. PMID 24167248. doi:10.1073/pnas.1316687110. 
  35. ^ Brawand, D; Wagner, C. E.; Li, Y. I.; Malinsky, M; Keller, I; Fan, S; Simakov, O; Ng, A. Y.; Lim, Z. W.; Bezault, E; Turner-Maier, J; Johnson, J; Alcazar, R; Noh, H. J.; Russell, P; Aken, B; Alföldi, J; Amemiya, C; Azzouzi, N; Baroiller, J. F.; Barloy-Hubler, F; Berlin, A; Bloomquist, R; Carleton, K. L.; Conte, M. A.; d'Cotta, H; Eshel, O; Gaffney, L; Galibert, F; et al. The genomic substrate for adaptive radiation in African cichlid fish. Nature. 2014, 513 (7518): 375–81. Bibcode:2014Natur.513..375B. PMID 25186727. doi:10.1038/nature13726. 
  36. ^ Jiggins, C. D. Evolutionary biology: Radiating genomes. Nature. 2014, 513 (7518): 318–9. Bibcode:2014Natur.513..318J. PMID 25186726. doi:10.1038/nature13742. 
  37. ^ Kryuchkova, Nadezda,; Robinson-Rechavi, Marc,. Tissue-specificity of gene expression diverges slowly between orthologs, and rapidly between paralogs. figshare. 2016-07-21 [2017-01-06]. doi:10.6084/m9.figshare.3493010.v2. (原始內容存檔於2020-02-12) (美國英語). 
  38. ^ Li, Wentian. On parameters of the human genome. Journal of Theoretical Biology. Nov 7, 2011, 288: 92–104. PMID 21821053. doi:10.1016/j.jtbi.2011.07.021. 
  39. ^ Galtier, Nicolas. Gene conversion drives GC content evolution in mammalian histones. Trends in genetics : TIG. February 2003, 19 (2): 65–8. PMID 12547511. doi:10.1016/S0168-9525(02)00002-1. 
  40. ^ Snel, Berend; Bork, Peer; Huynen, Martijn A. Genome phylogeny based on gene content. Nature Genetics. 1999, 21 (1): 108–110. PMID 9916801. doi:10.1038/5052. 
  41. ^ Begun, M. T.; Jones, C. D.; Kern, A. D.; Lindfors, HA; Begun, DJ. Novel genes derived from noncoding DNA in Drosophila melanogaster are frequently X-linked and exhibit testis-biased expression. Proc Natl Acad Sci U S A. 2006, 103 (26): 9935–9939. Bibcode:2006PNAS..103.9935L. PMC 1502557 . PMID 16777968. doi:10.1073/pnas.0509809103. 
  42. ^ Zhou, Q.; Zhang, G.; Zhang, Y.; Xu, S; Zhao, R; Zhan, Z; Li, X; Ding, Y; Yang, S; Wang, W. On the origin of new genes in Drosophila. Genome Res. 2008, 18 (9): 1446–1455. PMC 2527705 . PMID 18550802. doi:10.1101/gr.076588.108. 
  43. ^ Cai, J.; Zhao, R.; Jiang, H.; Wang, W. De novo origination of a new protein-coding gene in Saccharomyces cerevisiae. Genetics. 2008, 179 (1): 487–496. PMC 2390625 . PMID 18493065. doi:10.1534/genetics.107.084491. 
  44. ^ Xiao, Wenfei; Hongbo, Liu; Li, Yu; Li, Xianghua; Xu, Caiguo; Long, Manyuan; Wang, Shiping. El-Shemy, Hany A , 編. A rice gene of de novo origin negatively regulates pathogen-induced defense response. PLoS ONE. 2009, 4 (2): e4603. Bibcode:2009PLoSO...4.4603X. PMC 2643483 . PMID 19240804. doi:10.1371/journal.pone.0004603. 
  45. ^ Knowles, DG; McLysaght, A. Recent de novo origin of human protein-coding genes. Genome Res. 2009, 19 (10): 1752–1759. PMC 2765279 . PMID 19726446. doi:10.1101/gr.095026.109. 
  46. ^ Wu, D. D.; Irwin, D. M.; Zhang, Y. P. De novo origin of human protein-coding genes. PLoS Genetics. 2011, 7 (11): e1002379. PMC 3213175 . PMID 22102831. doi:10.1371/journal.pgen.1002379.