技術(shù)文章
人類基因組
閱讀:373 發(fā)布時(shí)間:2013-2-20人類基因組包括細(xì)胞核內(nèi)的基因組及細(xì)胞質(zhì)內(nèi)線粒體基因組,它們大致結(jié)構(gòu)如圖3-8。
一、細(xì)胞核基因組
每條染色體含1個(gè)DNA分子,1個(gè)細(xì)胞的全部遺傳信息(基因)都編碼在線狀的DNA分子上。由于每個(gè)體細(xì)胞中有2套染色體(2n),故所含的DNA是由兩個(gè)基因組(genome)構(gòu)成。每個(gè)單倍體基因組約含3.2×109bp。人類基因的平均長度為1-1.5kb,所以基因組以足以編碼1.5×106蛋白質(zhì),但實(shí)際上編碼蛋白質(zhì)的結(jié)構(gòu)基因只不過5萬-10萬個(gè),僅占總基因組的2%-3%。其余的DNA順序包括基因之間的間隔順序、基因內(nèi)插入順序、重復(fù)順序等。目前,對(duì)它們的功能知之甚少,絕大多數(shù)重復(fù)順序只不過是過剩的DNA。但是,其中一些則有著特殊的功能,包括:調(diào)節(jié)基因的表達(dá),增強(qiáng)同源染色體之間的配對(duì)和重組,維持染色體結(jié)構(gòu),調(diào)節(jié)前mRNA的加工以及參與DNA的復(fù)制等。
?。ㄒ唬﹩我豁樞?/p>
人類基因組單一順序(unique sequence)約占基因組的60%-65%,這種順序在一個(gè)基因組中一般僅有單個(gè)或幾個(gè)拷貝,大多數(shù)編碼蛋白質(zhì)和酶基因?qū)儆诖祟?。單一順序還以間隔順序和散在分布在重復(fù)順序構(gòu)成側(cè)翼。
?。ǘ┲貜?fù)順序
重復(fù)順序(repetitive sequence)是指在一個(gè)基因組中有很多拷貝,又可分為幾類:
1.高度重復(fù)順序(highly repetitive sequence) 其長度可能2、4、6、8等幾個(gè)bp,較長的順序可達(dá)200bp,但是重復(fù)拷貝數(shù)可達(dá)106次以上,例如染色體著絲粒、端粒和Y染色體長臂上的異染區(qū)就是由高度重復(fù)順序的衛(wèi)星DNA(salite DNA)構(gòu)成的,高度重復(fù)順序不能轉(zhuǎn)錄,它們參與染色體結(jié)構(gòu)的維持,形成結(jié)構(gòu)基因間隔,可能與減數(shù)分裂時(shí)同源染色體的聯(lián)會(huì)配對(duì)有關(guān)。
2.中度重復(fù)順序(moderay repetitive sequence) 其長度300-7000bp,一般都是不編碼的順序。據(jù)認(rèn)為在基因調(diào)控中起重要作用,包括開啟或關(guān)閉基因,促進(jìn)或終止轉(zhuǎn)錄,DNA復(fù)制的起始,參與前mRNA加工等。例如人類Alu家族(Alu family),占人類基因組的3%-6%,由300bp構(gòu)成,在第170位附近都AGCT順序,可被內(nèi)切酶AluⅠ所切割(AG↓CT)故得名。這些順序在基因中重復(fù)達(dá)30-50萬次,平均5kbDNA就有一個(gè)Alu順序。此外還有KpnⅠ家族(KpnⅠfamily),約占基因組的3%-6% ,由3000-4800個(gè)拷貝構(gòu)成,其功能不詳。此外,還有小衛(wèi)星DNA和微衛(wèi)星DNA(參閱第十三章)。
3.基因家族和基因簇真核基因組中有許多來源相同.結(jié)構(gòu)相似.功能相關(guān)的基因,這組基因稱為基因家族(gene family)。基因家族的成員可以分布于幾條不同染色體上,也可集中于一條染色體上。集中成簇的一組基因稱為基因簇(gene cluster)。例如人類白細(xì)胞抗原(HLA)系統(tǒng)的7個(gè)連鎖基因座位,排列成A-C-B-D-DR-DQ-DP,形成一個(gè)基因簇。此外,人類的類α和β珠蛋白基因簇分別集群串聯(lián)排列于16p13和11p15上,而組蛋白基因簇則群集于7q32-q36。有些基因家族的成員并不集中排列為基因簇,而是散布在基因組中不同部位,如微管蛋白基因家簇,微管相關(guān)蛋白2(MAP2)定位于2q34-q35,微管相關(guān)蛋白tau,β(MAPT1)定位于17q21,微管相關(guān)蛋白tau-2(MAPT2)定位于6q21。
?。ㄈ┘倩?/p>
在基因家族中的某些成員并不產(chǎn)生有功能的基因產(chǎn)物,稱為假基因(pseudogene),如Ψξ、Ψα、Ψβ等。假基因起始也可能有功能,后來由于缺失、倒位或點(diǎn)突變等原因使這些基因成為無功能的基因。假基因可以與有功能基因連鎖,也可以由于染色體易位或作為轉(zhuǎn)座子,從一部位移到另一新的部位。
此外,中還有一些特殊的短順序位于各基因的側(cè)翼,它們是起到調(diào)控作用的調(diào)節(jié)順序(啟動(dòng)子、增強(qiáng)子等)。有的是與細(xì)胞惡性轉(zhuǎn)化有關(guān)的原癌基因(proto-onco-gene)等構(gòu)成了五花八門的結(jié)構(gòu)。
二、線粒體基因組
人類線粒體DNA(mitochondrial DNA,mtDNA)是獨(dú)立于細(xì)胞核染色體外的又一基因組,它能自主復(fù)制,由16569個(gè)堿基對(duì)組成,每一個(gè)mtDNA分子為環(huán)狀雙鏈DNA分子,外環(huán)為重鏈,內(nèi)環(huán)為輕鏈?;蚪M含有37個(gè)基因,其中13個(gè)為蛋白質(zhì)基因(包含1個(gè)細(xì)胞素b基因,2個(gè)ATP酶復(fù)合體組成成分基因,3個(gè)細(xì)胞色素c氧化酶亞單位的基因及7個(gè)呼吸鏈NADH脫氫酶亞單位的基因),2個(gè)為rRNA基因,還有22個(gè)tNRA基因(圖3-9)。
人類線粒體基因組具有下列特點(diǎn):
1.人類線粒體的基因排列得非常緊湊,除與mtDNA復(fù)制及轉(zhuǎn)錄有關(guān)的一小段區(qū)域外,無內(nèi)含子序列。在37個(gè)基因之間,基因間隔區(qū)總共只有87bp,只占DNA總長度的的0.5%,有些基因之間沒有間隔,有時(shí)基因有重疊,即前一個(gè)基因的zui后一段堿基與下一個(gè)基因的*段堿基相銜接。因此,mtDNA的任何突變都會(huì)累及到基因組中一個(gè)重要功能區(qū)域。
2.mtDNA為利用DNA。有5個(gè)閱讀框架,缺少終止密碼子,僅以U或UA結(jié)尾。
3.mtDNA的突變率高于核中DNA,并且缺乏修復(fù)能力。
4.mtDNA為母系遺傳。
5.部分mtDNA的密碼子不同于核內(nèi)DNA的密碼子。
遺傳密碼是在長期進(jìn)化中形成并保持不變的,因此細(xì)胞核內(nèi)所列的密碼是一種通用密碼,但是真核生物線粒體的密碼卻有若干處不同于通用密碼。以人類線粒為例:①UGA不是終止密碼子,而是色氨酸的密碼子;②AGA、AGG不是精氨酸的密碼子而是終止密碼子。這樣,加上通用密碼中的UAA和UAG,線粒體共有4個(gè)終止密碼子;③內(nèi)部甲硫氨酸密碼子有2個(gè),即AUG和AUA,起始甲硫酸密碼子有4個(gè),即AUN。
總之,線粒體的密碼表排列得比較整齊,各種氨基酸的密碼子以及起始和終止密碼子的數(shù)目或是2,或是4,或是6。
目前,由于發(fā)現(xiàn)有些遺傳病如Leber遺傳性視神經(jīng)病,肌陣攣性癲癇等與線粒體基因突變有關(guān),因而它的基因結(jié)構(gòu)引起普遍關(guān)注。