! ! "#$%氮吹儀年美國科學(xué)家 &’()*+ ,(-./012提出了基因組學(xué)(3.4()01+),指對所有基因進(jìn)行基因組作圖(包 括遺傳圖譜、物理圖譜、轉(zhuǎn)錄圖譜),核苷酸序列分析,基因定位和基因功能分析的一門科學(xué)?;蚪M學(xué)包 括兩方面的內(nèi)容:以全基因組測序為目標(biāo)的結(jié)構(gòu)基因組學(xué)( +5/6156/*7 8.4()01+)和以基因功能鑒定為目標(biāo) 的功能基因組學(xué)(964150(4*7 8.4()01+)。基因組學(xué)的研究成果對于人類認(rèn)識自然和人類本身,闡明所有生 物的生命活動的分子基礎(chǔ),具有十分重要的意義。 一、真核生物基因組的特點 !!真核生物基因組與原核生物基因組比較有很大的差異,有其自身的特點,歸納如下。 !!(")真核生物基因組遠(yuǎn)大于原核生物的基因組,如哺乳類動物基因組 :;<約 = > "?# @A。真核生物 基因組 :;<與蛋白質(zhì)結(jié)合形成染色體,儲存于細(xì)胞核內(nèi),除配子細(xì)胞外,體細(xì)胞內(nèi)的基因組是雙份的(即 雙倍體, -0A7(0-),即有兩份同源的基因組。原核生物基因組較小,沒有核膜包裹,且形式多樣,如大腸桿菌 基因組僅由 B >"?% @A組成,約含 B C??個基因。細(xì)菌染色體基因組則常為裸露的環(huán)狀雙鏈 :;<分子,并 與其中央的 ,;<和支架蛋白構(gòu)成一致密的區(qū)域,
稱為類核。 !!(C)真核生物基因占整個基因組的比例很小,基因組中非編碼序列遠(yuǎn)遠(yuǎn)多于編碼序列,非編碼序列可 占 $?D E #?D。如哺乳動物約含 =? ???個 E B? ???個基因,只占整個基因組的 FD左右。原核生物的 :;<分子絕大部分用于編碼蛋白質(zhì),只有一小部分是不翻譯的,不翻譯區(qū)(又稱間隔區(qū))通常包含控制基 因表達(dá)的序列。病毒基因組具有重疊基因((G./7*AA048 8.4.)的結(jié)構(gòu),即多個基因在同一 :;<分子上部分 或完全重疊,該 :;<序列能夠編碼兩種甚至三種蛋白質(zhì)分子;而真核基因組及細(xì)菌的基因組沒有這種結(jié) 構(gòu)。 !!(=)真核細(xì)胞基因轉(zhuǎn)錄產(chǎn)物為單順反子 ),;<,即一個結(jié)構(gòu)基因轉(zhuǎn)錄生成一個 ),;<分子,經(jīng)翻譯生 成一條多肽鏈。原核生物功能相關(guān)的幾個結(jié)構(gòu)基因常常串聯(lián)在一起,受一套調(diào)控基因的調(diào)節(jié),組成操縱子 ((A./(4)結(jié)構(gòu),并轉(zhuǎn)錄生成同一個 ),;<分子,稱為多順反子 ),;<( A(7H10+5/(401 ),;<),作為多種蛋白 質(zhì)合成的模板。 !!(B)真核生物存在大量重復(fù)序列,即在整個基 因組中有許多重復(fù)出現(xiàn)的核苷酸序列,重復(fù)序列長 短不一,短的僅含兩個核苷酸,長的多達(dá)數(shù)百、乃至 上千個。重復(fù)頻率也不盡相同:高度重復(fù)序列重復(fù) 頻率可達(dá) "?%次,包括衛(wèi)星 :;<(散在于基因組中的 圖 " C"!反向重復(fù)序列 一些小片段的重復(fù)序列)、反向重復(fù)(04G./5.-/.A.*5) 序列(也稱回紋結(jié)構(gòu),圖 " C",見第十三章第二
節(jié))和較復(fù)雜的重復(fù)單位組成的重復(fù)序列;中度重復(fù)序列 重復(fù)頻率為 "?= E"?B次,一些編碼區(qū)序列如 /,;<基因、 5,;<基因、組蛋白基因等都屬于這類重復(fù)序列; 單拷貝或低度重復(fù)序列,指在整個基因組中只出現(xiàn)一次或很少幾次的核苷酸序列,包括編碼蛋白質(zhì)的結(jié)構(gòu) 基因以及基因的間隔序列。重復(fù)序列有種屬特異性以及個體差異,基因組越大,重復(fù)序列越多。 !!重復(fù)序列在基因組中可以是串聯(lián)存在于 :;<分子上,也可以是散布在整個基因組中;可以是編碼序 列,也可以是非編碼序列。重復(fù)序列是由模板序列通過復(fù)制、擴(kuò)增和 I或轉(zhuǎn)座形成,其功能尚不清楚。 !!(F)真核生物的基因是不連續(xù)的,其結(jié)構(gòu)基因內(nèi)部存在許多不編碼蛋白質(zhì)的間隔序列,稱為內(nèi)含子 (045/(4),編碼序列則稱為外顯子( .J(4)。內(nèi)含子與外顯子相間排列,轉(zhuǎn)錄時一起被轉(zhuǎn)錄下來,然后 ,;< 中的內(nèi)含子經(jīng)一定規(guī)律的剪接機(jī)制被切掉,外顯子連接在一起形成成熟的 ),;<,作為指導(dǎo)蛋白質(zhì)合成的 模板。不同的轉(zhuǎn)錄后加工與修飾方式,可以形成不同的 ),;<,翻譯出不同的多肽鏈。原核生物的基因是 連續(xù)的,基因內(nèi)部沒有非編碼序列。