Wikinomic-sự cộng tác đại chúng làm biến đổi thế giới như thế nào
Các hệ gen và sự tiến hóa của chúng
Transcript of Các hệ gen và sự tiến hóa của chúng
426
21.1. C¸c ph−¬ng ph¸p míi ®� gióp gia t¨ng tèc ®é gi¶i tr×nh tù c¸c hÖ gen
21.2. C¸c nhµ khoa häc øng dông tin sinh häc ®Ó ph©n tÝch c¸c hÖ gen vµ chøc n¨ng cña chóng
21.3. C¸c hÖ gen kh¸c nhau vÒ kÝch cì, sè gen vµ mËt ®é gen
21.4. Sinh vËt nh©n thËt ®a bµo cã nhiÒu ADN kh«ng m� hãa vµ nhiÒu hä ®a gen
21.5. LÆp ®o¹n, t¸i s¾p xÕp vµ ®ét biÕn trong tr×nh tù ADN ®ãng gãp vµo qu¸ tr×nh tiÕn hãa
21.6. So s¸nh c¸c tr×nh tù hÖ gen cung cÊp b»ng chøng vÒ c¸c qu¸ tr×nh tiÕn hãa vµ ph¸t triÓn
g−êi phô n÷ trªn Hinh 21.1 vµ con tinh tinh bªn c¹nh c« ®ang c−êi ®ïa víi nhau – cã thËt vËy kh«ng? Hä cã hiÓu nh÷ng “c©u ®ïa giìn” vµ ®¸p l¹i b»ng vÎ mÆt cïng
víi c¸c tiÕng ph¸t ©m cña nhau kh«ng? Nhê nh÷ng kü thuËt ®−îc ph¸t triÓn gÇn ®©y trong viÖc gi¶i tr×nh tù nhanh toµn bé c¸c hÖ gen, giê ®©y chóng ta cã thÓ tuyªn bè vÒ c¬ së di truyÒn liªn quan ®Õn c¸c c©u hái hÊp dÉn nh− võa ®−îc nªu. Tinh tinh (Pan troglodytes) lµ loµi cã quan hÖ sèng gÇn
chóng ta nhÊt trªn c©y tiÕn hãa cña sù sèng. HÖ gen cña nã ®−îc gi¶i tr×nh tù hoµn toµn vµo n¨m 2005, nghÜa lµ kho¶ng 2 n¨m sau khi viÖc gi¶i tr×nh tù hÖ gen ng−êi hoµn thµnh phÇn lín. Giê ®©y chóng ta ®· cã thÓ so s¸nh hÖ gen cña chóng ta víi hÖ gen cña tinh tinh vµ ®èi chiÕu tõng baz¬ nit¬ nh»m lµm s¸ng tá nh÷ng th«ng tin di truyÒn kh¸c nhau nµo ®· dÉn ®Õn c¸c ®Æc ®iÓm kh¸c biÖt gi÷a hai loµi linh tr−ëng nµy. Ngoµi viÖc ®· x¸c ®Þnh ®−îc tr×nh tù hÖ gen ®Çy ®ñ cña
ng−êi vµ tinh tinh, c¸c nhµ nghiªn cøu còng ®· thu ®−îc tr×nh tù hÖ gen ®Çy ®ñ cña vi khuÈn E. coli vµ nhiÒu loµi sinh vËt nh©n s¬ kh¸c, còng nh− cña mét sè loµi sinh vËt nh©n thËt, bao
gåm Saccharomyces ceriviseae (nÊm men bia), Caenorhabitis elegans (mét loµi giun trßn), Drosophila melanogaster (ruåi giÊm), Mus musculus (chuét b¹ch) vµ Macaca mulatta (khØ rhezut). ThËm chÝ c¸c ph©n ®o¹n ADN tõ c¸c loµi ®· bÞ tuyÖt chñng, nh− gÊu hang (Ursus spelaneus) hay voi mamót l«ng (Mammuthus primigenius) còng ®· ®−îc gi¶i tr×nh tù. C¸c tr×nh tù hÖ gen ®Çy ®ñ hoÆc tõng phÇn b¶n th©n chóng lµ ®èi t−îng ®−îc quan t©m nghiªn cøu, ®ång thêi chóng cung cÊp nh÷ng th«ng tin s©u h¬n vÒ tiÕn hãa vµ nhiÒu qu¸ tr×nh sinh häc kh¸c. B»ng viÖc më réng so s¸nh hÖ gen ng−êi vµ tinh tinh víi c¸c loµi linh tr−ëng kh¸c còng nh− víi c¸c loµi ®éng vËt cã quan hÖ di truyÒn xa h¬n, chóng ta cã thÓ t×m thÊy tËp hîp c¸c gen quy ®Þnh sù kh¸c biÖt râ rÖt cña mçi nhãm sinh vËt. Xa h¬n mét chót, sù so s¸nh víi c¸c hÖ gen vi khuÈn, vi khuÈn cæ (archaea), nguyªn sinh ®éng vËt vµ c¸c loµi thùc vËt sÏ gióp chóng ta lµm s¸ng tá lÞch sö tiÕn hãa l©u dµi liªn quan ®Õn c¸c gen ®−îc c¸c loµi cïng nhau “chia sΔ cïng víi c¸c s¶n phÈm cña chóng. Víi viÖc hÖ gen cña nhiÒu loµi ®· ®−îc gi¶i tr×nh tù ®Çy ®ñ,
c¸c nhµ khoa häc cã thÓ nghiªn cøu c¸c tËp hîp gen hoµn chØnh vµ sù t−¬ng t¸c cña chóng theo mét h−íng nghiªn cøu ®−îc gäi lµ hÖ gen häc (genomics). C¸c nç lùc gi¶i tr×nh tù theo h−íng nghiªn cøu nµy ®· vµ ®ang tiÕp tôc t¹o ra nh÷ng khèi d÷ liÖu khæng lå. Nhu cÇu cÇn xö lý mét l−îng th«ng tin trµn ngËp ®ang t¨ng lªn nhanh chãng ®· dÉn ®Õn sù h×nh thµnh cña lÜnh vùc tin sinh häc (bioinformatics), lÜnh vùc øng dông c¸c ph−¬ng ph¸p khoa häc m¸y tÝnh vµo viÖc l−u gi÷ vµ ph©n tÝch c¸c sè liÖu sinh häc. Chóng ta sÏ b¾t ®Çu ch−¬ng nµy b»ng viÖc th¶o luËn vÒ hai
h−íng nghiªn cøu, gåm c¸c kü thuËt gi¶i tr×nh tù hÖ gen vµ mét sè tiÕn bé trong viÖc øng dông tin sinh häc. Sau ®ã chóng ta sÏ s¬ l−îc vÒ nh÷ng hiÓu biÕt thu nhËn ®−îc tõ viÖc gi¶i tr×nh tù c¸c hÖ gen ®· ®−îc tiÕn hµnh ®Õn nay. Sau ®ã chóng ta sÏ m« t¶ vÒ thµnh phÇn hÖ gen ng−êi nh− mét hÖ gen ®¹i diÖn cho c¸c sinh vËt nh©n thËt ®a bµo. Cuèi cïng, chóng ta sÏ cïng t×m hiÓu nh÷ng quan ®iÓm vÒ qu¸ tr×nh tiÕn hãa vµ c¸c c¬ chÕ ph¸t triÓn vèn lµ c¬ së t¹o nªn sù ®a d¹ng vÜ ®¹i cña sù sèng hiÖn cã trªn Tr¸i §Êt.
N
C¸c kh¸i niÖm chÝnh
Tæng quan
§äc c¸c l¸ trªn c©y sù sèng
� H×nh 21.1 Th«ng tin nµo trong hÖ gen ®· t¹o nªn con ng−êi vµ tinh tinh ?
C¸c hÖ gen vµ sù tiÕn hãa cña chóng
Ch−¬ng 21 C¸c hÖ gen vµ sù tiÕn hãa cña chóng 427
ViÖc gi¶i tr×nh tù hÖ gen ng−êi, mét dù ¸n tham väng víi tªn gäi Dù ¸n HÖ gen Ng−êi (HGP) ®−îc b¾t ®Çu vµo n¨m 1990. §−îc tæ chøc thµnh mét Tæ hîp (conxoocxi«m) gåm nhiÒu nhµ khoa häc quèc tÕ ®−îc céng ®ång tµi trî, dù ¸n ®· ®−îc triÓn khai ë 20 trung t©m gi¶i tr×nh tù lín thuéc 6 quèc gia bªn c¹nh nhiÒu phßng thÝ nghiÖm nhá thùc hiÖn c¸c nh¸nh cña dù ¸n. Sau khi viÖc gi¶i tr×nh tù hÖ gen ng−êi ®−îc hoµn thµnh
phÇn lín vµo n¨m 2003, tr×nh tù cña mçi nhiÔm s¾c thÓ ®· ®−îc ph©n tÝch kü l−ìng vµ ®−îc m« t¶ trong hµng lo¹t c¸c bµi b¸o khoa häc, trong ®ã bµi b¸o cuèi cïng liªn quan ®Õn tr×nh tù cña nhiÔm s¾c thÓ sè 1 ®−îc c«ng bè vµo n¨m 2006. Víi kÕt qu¶ nµy, c¸c nhµ nghiªn cøu coi viÖc gi¶i tr×nh tù hÖ gen ng−êi ®· “chÝnh thøc hoµn thµnh”. §Ó ®¹t ®−îc nh÷ng cét mèc ®ã, dù ¸n ®· ®−îc triÓn khai qua ba giai ®o¹n víi c¸c ph¸t hiÖn ngµy cµng chi tiÕt h¬n vÒ hÖ gen ng−êi; ba giai ®o¹n ®ã gåm: lËp b¶n ®å liªn kÕt, lËp b¶n ®å vËt lý vµ gi¶i tr×nh tù ADN.
Gi¶i tr×nh tù hÖ gen qua ba giai ®o¹n Tr−íc khi Dù ¸n HÖ gen Ng−êi b¾t ®Çu, c¸c nghiªn cøu tr−íc ®ã ®· ph¸c th¶o ®−îc mét b−íc tranh s¬ bé vÒ tæ chøc hÖ gen cña nhiÒu c¬ thÓ sinh vËt kh¸c nhau. VÝ dô nh−, viÖc ph©n tÝch kiÓu h×nh nhiÔm s¾c thÓ cña nhiÒu loµi ®· cho biÕt sè l−îng nhiÔm s¾c thÓ vµ kiÓu h×nh nhuém b¨ng cña chóng (xem H×nh 13.3). Vµ ®èi víi mét sè gen, vÞ trÝ cña chóng trªn nhiÔm s¾c thÓ ®· ®−îc x¸c ®Þnh bëi ph−¬ng ph¸p lai huúnh quang t¹i chç (FISH), ph−¬ng ph¸p mµ trong ®ã ng−êi ta ®em lai c¸c mÉu dß ph¸t huúnh quang víi c¸c nhiÔm s¾c thÓ nguyªn vÑn ®−îc cè ®Þnh (xem H×nh 15.1). B¶n ®å di truyÒn tÕ bµo ®−îc x©y dùng theo c¸ch nµy ®· cung cÊp nh÷ng th«ng tin khëi ®Çu cho viÖc lËp b¶n ®å chi tiÕt h¬n sau nµy. Khi ®· cã trong tay b¶n ®å di truyÒn tÕ bµo cña c¸c nhiÔm
s¾c thÓ, giai ®o¹n ®Çu tiªn cña tiÕn tr×nh gi¶i tr×nh tù hÖ gen ng−êi lµ x©y dùng mét b¶n ®å liªn kÕt (mét lo¹i b¶n ®å di truyÒn; xem Ch−¬ng 15) cña kho¶ng vµi ngh×n dÊu chuÈn di truyÒn ®−îc ph©n bè kh¾p c¸c nhiÔm s¾c thÓ (Hinh 21.2 giai ®o¹n �). TrËt tù vÞ trÝ cña c¸c dÊu chuÈn vµ kho¶ng c¸ch gi÷a chóng trªn b¶n ®å ®−îc x¸c ®Þnh trªn c¬ së tÇn sè t¸i tæ hîp (xem H×nh 15.11). C¸c dÊu chuÈn di truyÒn cã thÓ lµ c¸c gen hoÆc lµ c¸c ®o¹n tr×nh tù ADN kh¸c cã thÓ x¸c ®Þnh ®−îc, ch¼ng h¹n nh− c¸c RFLP hay c¸c tr×nh tù lÆp l¹i kÕ tiÕp ng¾n (STR) ®· ®−îc ®Ò cËp ë Ch−¬ng 20. TÝnh ®Õn n¨m 1992, c¸c nhµ nghiªn cøu ®· tËp hîp ®−îc mét b¶n ®å liªn kÕt ë ng−êi gåm kho¶ng 5000 dÊu chuÈn kh¸c nhau. Mét b¶n ®å nh− vËy ®· gióp hä x¸c ®Þnh ®−îc vÞ trÝ cña c¸c dÊu chuÈn kh¸c, bao gåm c¶ c¸c gen, b»ng viÖc kiÓm tra tÝnh liªn kÕt di truyÒn cña chóng víi c¸c dÊu chuÈn ®· biÕt tr−íc ®ã. Ngoµi ra, nã cßn cã gi¸ trÞ lµ phÇn cèt lâi cña viÖc lËp b¶n ®å chi tiÕt h¬n t¹i nh÷ng vïng nhÊt ®Þnh trong hÖ gen. Giai ®o¹n tiÕp theo lµ viÖc lËp b¶n ®å vËt lý hÖ gen ng−êi.
Trong b¶n ®å vËt lý, kho¶ng c¸ch gi÷a c¸c dÊu chuÈn ®−îc biÓu diÔn bëi ®¬n vÞ vËt lý, th−êng lµ sè cÆp baz¬ nit¬ (bp) däc theo ph©n tö ADN. §Ó lËp mét b¶n ®å hÖ gen hoµn chØnh, mét b¶n ®å vËt lý ®−îc thiÕt lËp b»ng c¸ch c¾t ph©n tö ADN t−¬ng
øng víi mét nhiÔm s¾c thÓ thµnh mét sè c¸c ph©n ®o¹n giíi h¹n råi x¸c ®Þnh trËt tù cña c¸c ph©n ®o¹n trªn ph©n tö ADN nhiÔm s¾c thÓ gèc. Ch×a khãa ®Ó thùc hiÖn ®iÒu nµy lµ cÇn t¹o ra c¸c ph©n ®o¹n ADN gèi lªn nhau, råi sö dông c¸c mÉu dß hoÆc ph−¬ng ph¸p gi¶i tr×nh tù tù ®éng c¸c tr×nh tù ®Çu cuèi cña nh÷ng ph©n ®o¹n nµy ®Ó t×m ra c¸c tr×nh tù gèi lªn nhau ®ã (H×nh 21.2, giai ®o¹n �). B»ng c¸ch ®ã, cã thÓ ®Æt c¸c ph©n ®o¹n vµo ®óng trËt tù t−¬ng øng cña chóng trªn nhiÔm s¾c thÓ. Nguån cung cÊp c¸c ph©n ®o¹n ADN dïng cho viÖc lËp b¶n
®å vËt lý dùa trªn viÖc nh©n dßng ADN. §Ó gi¶i tr×nh tù c¸c hÖ gen lín, c¸c nhµ khoa häc ph¶i thùc hiÖn lÆp l¹i nhiÒu lÇn c¸c c«ng viÖc c¾t ADN, nh©n dßng vµ lËp b¶n ®å vËt lý. C¸c vect¬ nh©n dßng ®Çu tiªn th−êng ®−îc sö dông lµ nhiÔm s¾c thÓ nh©n t¹o nÊm men (YAC) cho phÐp mang nh÷ng ®o¹n ADN cµi dµi ®Õn hµng triÖu bp, hoÆc nhiÔm s¾c thÓ nh©n t¹o vi khuÈn (BAC) vèn ®iÓn h×nh cã thÓ mang c¸c ®o¹n cµi dµi tõ 100.000 ®Õn 300.000 bp. Sau khi nh÷ng ®o¹n ADN dµi nh− vËy ®· ®−îc x¸c ®Þnh trËt tù trªn nhiÔm s¾c thÓ chÝnh x¸c, chóng sÏ ®−îc c¾t thµnh nh÷ng ph©n ®o¹n nhá h¬n, råi ®−îc nh©n dßng vµo c¸c
21.1 Kh¸i niÖm
C¸c ph−¬ng ph¸p míi ®� gióp gia t¨ng tèc ®é gi¶i tr×nh tù c¸c hÖ gen
� H×nh 21.2 Ph−¬ng ph¸p gi¶i tr×nh tù toµn hÖ gen qua ba giai ®o¹n. B¾t ®Çu tõ mét b¶n ®å di truyÒn tÕ bµo cña mçi nhiÔm s¾c thÓ, c¸c nhµ nghiªn cøu liªn quan ®Õn Dù ¸n HÖ gen Ng−êi ®· tiÕn hµnh c¸c nghiªn cøu qua ba giai ®o¹n ®Ó ®¹t ®−îc môc tiªu cuèi cïng, ®ã lµ gi¶i tr×nh tù toµn bé tõng nucleotide trªn mçi nhiÔm s¾c thÓ.
B¶n ®å di truyÒn tÕ bµo
KiÓu h×nh nhuém b¨ng cña nhiÔm s¾c thÓ vµ vÞ trÝ c¸c gen ®Æc thï ®−îc x¸c ®Þnh b»ng ph−¬ng ph¸p lai insitu (FISH) VÞ trÝ gen ®−îc x¸c
®Þnh b»ng FISH
C¸c b¨ng nhiÔm s¾c thÓ sau khi ®−îc nhuém
B¶n ®å liªn kÕt
X¸c ®Þnh trËt tù cña c¸c dÊu chuÈn di truyÒn nh− RFLP, STR vµ c¸c ®a h×nh di truyÒn kh¸c (kho¶ng 200 dÊu chuÈn trªn mçi nhiÔm s¾c thÓ)
B¶n ®å vËt lý
X¸c ®Þnh trËt tù cña c¸c ph©n ®o¹n lín gèi lªn nhau ®−îc nh©n dßng bëi c¸c vect¬ YAC vµ BAC; sau ®ã lµ trËt tù cña c¸c ®o¹n ng¾n h¬n ®−îc nh©n dßng bëi c¸c vect¬ plasmid vµ phag¬
Gi¶i tr×nh tù ADN
X¸c ®Þnh tr×nh tù cña c¸c nucleotide trªn mçi ®o¹n ng¾n vµ ghÐp nèi c¸c tr×nh tù thµnh phÇn víi nhau thµnh tr×nh tù hÖ gen hoµn chØnh
C¸c dÊu chuÈn di truyÒn
C¸c ®o¹n gèi lªn nhau
428 khèi kiÕn thøc 3 Di truyÒn häc
vect¬ plasmid hoÆc phag¬, tr−íc khi nh÷ng ph©n ®o¹n nhá nµy ®−îc dïng ®Ó gi¶i tr×nh tù chi tiÕt. Môc tiªu cuèi cïng cña viÖc lËp b¶n ®å mét hÖ gen lµ x¸c
®Þnh ®−îc tr×nh tù nucleotide hoµn chØnh cña mçi nhiÔm s¾c thÓ (H×nh 21.2, giai ®o¹n �). §èi víi hÖ gen ng−êi, giai ®o¹n nµy ®−îc thùc hiÖn nhê c¸c m¸y gi¶i tr×nh tù sö dông ph−¬ng ph¸p kÕt thóc chuçi dideoxy ®−îc m« t¶ trªn H×nh 20.12. Ngay c¶ khi ®· ®−îc tù ®éng hãa, viÖc gi¶i tr×nh tù cña toµn bé 3,2 tØ cÆp baz¬ trong bé nhiÔm s¾c thÓ ®¬n béi cña ng−êi vÉn cßn lµ mét th¸ch thøc khñng khiÕp. Trong thùc tÕ, mét ®ét ph¸ chÝnh cña Dù ¸n HÖ gen Ng−êi lµ sù ph¸t triÓn cña c«ng nghÖ gi¶i tr×nh tù nhanh. Nh÷ng c¶i tiÕn kü thuËt ®−îc tÝch lòy qua nhiÒu n¨m ®· “mµi dòa” tõng b−íc cña qui tr×nh kü thuËt vèn tèn nhiÒu thêi gian, vµ nhê vËy tèc ®é gi¶i tr×nh tù ®· ®−îc gia tèc mét c¸ch Ên t−îng. NÕu nh− mét phßng thÝ nghiÖm hiÖu qu¶ cã thÓ gi¶i tr×nh tù ®−îc 1000 bp mçi ngµy vµo nh÷ng n¨m 1980, th× ®Õn n¨m 2000, mçi trung t©m nghiªn cøu thuéc Dù ¸n HÖ gen Ng−êi cã thÓ gi¶i tr×nh tù 1000 bp mçi gi©y trong suèt 24 giê mçi ngµy vµ 7 ngµy mçi tuÇn. C¸c ph−¬ng ph¸p nh− vËy cã thÓ ph©n tÝch rÊt nhanh c¸c vËt liÖu sinh häc vµ t¹o ra c¸c khèi d÷ liÖu khæng lå trong thêi gian ng¾n vµ ®−îc gäi chung lµ c¸c ph−¬ng ph¸p “hiÖu n¨ng cao”. C¸c m¸y gi¶i tr×nh tù tù ®éng lµ mét vÝ dô vÒ c¸c thiÕt bÞ thÝ nghiÖm hiÖu n¨ng cao. Trong thùc tiÔn, ba giai ®o¹n ®−îc m« t¶ trªn H×nh 21.2 gèi
lªn nhau theo mét c¸ch phøc t¹p h¬n m« h×nh gi¶n l−îc võa ®−îc chóng ta ®Ò cËp; tuy vËy, m« h×nh nµy ph¶n ¸nh ®óng chiÕn l−îc nghiªn cøu tæng thÓ ®−îc dïng trong Dù ¸n HÖ gen Ng−êi. Trong qu¸ tr×nh thùc hiÖn dù ¸n, mét chiÕn l−îc kh¸c nh»m gi¶i tr×nh tù hÖ gen ®· xuÊt hiÖn vµ sau ®ã ®−îc ¸p dông réng r·i nhê hiÖu qu¶ cùc kú cao cña nã. PhÇn tiÕp theo, chóng ta ®Ò cËp ®Õn chiÕn l−îc gi¶i tr×nh tù nµy.
Gi¶i tr×nh tù ngÉu nhiªn toµn hÖ gen N¨m 1992, m¹nh d¹n dùa trªn c¸c thµnh tùu míi cña kü thuËt gi¶i tr×nh tù vµ c«ng nghÖ m¸y tÝnh, J. Craig Venter - mét nhµ sinh häc ph©n tö - ®· ph¸t minh ra mét ph−¬ng ph¸p gi¶i tr×nh tù toµn hÖ gen míi. §−îc ®Æt tªn lµ ph−¬ng ph¸p gi¶i tr×nh tù ngÉu nhiªn toµn hÖ gen (hay ph−¬ng ph¸p shotgun), thùc chÊt ph−¬ng ph¸p nµy ®· bá qua c¸c giai ®o¹n lËp b¶n ®å liªn kÕt vµ b¶n ®å vËt lý; thay vµo ®ã, nã b¾t ®Çu ngay b»ng viÖc gi¶i tr×nh tù c¸c ph©n ®o¹n ADN ngÉu nhiªn cña toµn hÖ gen. Sau ®ã, c¸c ch−¬ng tr×nh m¸y tÝnh m¹nh sÏ tiÕn hµnh s¾p xÕp mét sè l−îng lín c¸c ph©n ®o¹n ADN ®· ®−îc gi¶i tr×nh tù, dùa trªn c¸c ®o¹n tr×nh tù ng¾n n»m gèi lªn nhau cña chóng, thµnh mét tr×nh tù liªn tôc duy nhÊt (Hinh 21.3). MÆc dï ban ®Çu bÞ hoµi nghi bëi nhiÒu nhµ khoa häc, gi¸ trÞ
cña ph−¬ng ph¸p Vender trë nªn râ rµng vµo n¨m 1995 khi «ng vµ céng sù c«ng bè hÖ gen cña mét loµi sinh vËt ®−îc gi¶i tr×nh tù hoµn chØnh ®Çu tiªn, ®ã lµ vi khuÈn g©y bÖnh tiªu ch¶y Haemophilus influenza. N¨m 1998, Venter thµnh lËp mét c«ng ty cã tªn lµ Celera Genomics vµ tuyªn bè dù ®Þnh gi¶i tr×nh tù toµn bé hÖ gen ng−êi cña m×nh. N¨m n¨m sau, Cerela Genomics vµ Tæ hîp HGP ®ång thêi th«ng b¸o viÖc gi¶i tr×nh tù hÖ gen ng−êi ®· hoµn thµnh phÇn lín, nghÜa lµ sím h¬n hai n¨m so víi tiÕn ®é dù kiÕn ban ®Çu cña Dù ¸n HÖ gen Ng−êi. C¸c ®¹i diÖn cña Tæ hîp HGP chØ ra r»ng viÖc hoµn thµnh
gi¶i tr×nh tù hÖ gen ng−êi cña Celera ph¶i dùa nhiÒu vµo c¸c b¶n ®å di truyÒn vµ sè liÖu tr×nh tù cña hä, còng nh− c¸c trang thiÕt bÞ mµ hä thiÕt lËp cho dù ¸n ®· hç trî nhiÒu cho c¸c nç lùc
cña Celera. Ng−îc l¹i, Venter còng ®· dïng lý lÏ ®Ó biÖn hé cho hiÖu qu¶ vµ gi¸ thµnh h¹ trong ph−¬ng ph¸p gi¶i tr×nh tù cña Celera, ®ång thêi chØ ra r»ng Tæ hîp HGP còng ®· sö dông c¸c sè liÖu cña hä. Râ rµng c¶ hai ph−¬ng ph¸p ®Òu cã gi¸ trÞ vµ cïng ®ãng gãp vµo viÖc nhanh chãng hoµn thµnh viÖc gi¶i tr×nh tù hÖ gen cña mét sè loµi. HiÖn nay ph−¬ng ph¸p gi¶i tr×nh tù ngÉu nhiªn toµn hÖ gen
®ang ®−îc dïng réng r·i. Theo mét c¸ch ®iÓn h×nh, c¸c ph©n ®o¹n ADN ®−îc nh©n dßng b»ng ba lo¹i vect¬ kh¸c nhau, mçi lo¹i ®−îc cµi mét ph©n ®o¹n x¸c ®Þnh. Kho¶ng c¸ch ®· biÕt gi÷a c¸c ®Çu cña ph©n ®o¹n ADN cµi lµ mét th«ng tin bæ sung gióp m¸y tÝnh cã thÓ s¾p xÕp ®óng c¸c tr×nh tù. Mét nghiªn cøu gÇn ®©y so s¸nh hai chiÕn l−îc gi¶i tr×nh tù ®· chØ ra r»ng ph−¬ng ph¸p shotgun cã thÓ m¾c lçi bá qua mét sè tr×nh tù lÆp l¹i, v× vËy cã thÓ ph¶n ¸nh kh«ng chÝnh x¸c kÝnh th−íc thùc cña hÖ gen vµ cã thÓ bá qua mét sè gen trong nh÷ng vïng nh− vËy trªn nhiÔm s¾c thÓ. C¸c ph−¬ng ph¸p phèi hîp cuèi cïng ®· ®−îc ¸p dông cho hÖ gen ng−êi; trong ®ã ph−¬ng ph¸p shotgun cã tèc ®é nhanh ®−îc hç trî bëi b¶n ®å di truyÒn cña c¸c dßng gen cã lÏ lµ c¸ch h÷u hiÖu nhÊt cho nh÷ng øng dông l©u dµi. §Õn n¨m 2007, vÉn cßn mét phÇn nhá cña hÖ gen ng−êi
ch−a ®−îc gi¶i tr×nh tù. Do sù cã mÆt cña tr×nh tù ADN lÆp l¹i vµ bëi mét sè nguyªn nh©n ch−a biÕt kh¸c, mét sè phÇn nhÊt
C¾t ADN tõ nhiÒu b¶n sao cña mét nhiÔm s¾c thÓ thµnh c¸c ph©n ®o¹n gèi lªn nhau cã chiÒu dµi ®ñ ng¾n ®Ó cã thÓ gi¶i tr×nh tù.
Nh©n dßng mçi ph©n ®o¹n trong c¸c vect¬ plasmid hoÆc phag¬ (xem c¸c H×nh 20.4 vµ 20.5)
Gi¶i tr×nh tù tõng ph©n ®o¹n (xem H×nh 20.12)
Sö dông phÇn mÒm m¸y tÝnh s¾p xÕp c¸c ph©n ®o¹n theo ®óng trËt tù vÞ trÝ cña chóng
� H×nh 21.3 Gi¶i tr×nh tù ngÉu nhiªn toµn hÖ gen. Theo ph−¬ng ph¸p nµy, ®−îc ph¸t triÓn bëi Craig Venter vµ c¸c ®ång nghiÖp t¹i C«ng ty Celera Genomics do chÝnh «ng s¸ng lËp, c¸c ®o¹n ADN ®−îc gi¶i tr×nh tù ngÉu nhiªn, råi sau ®ã chóng ®−îc s¾p xÕp theo ®óng trËt tù vÞ trÝ t−¬ng ®èi víi nhau. H·y so s¸nh ph−¬ng ph¸p nµy víi ph−¬ng ph¸p gi¶i tr×nh tù toµn hÖ gen qua ba giai ®o¹n ®−îc m« t¶ trªn H×nh 21.2.
C¸c ph©n ®o¹n ë giai ®o¹n 2 trªn h×nh nµy ®−îc vÏ n»m r¶i r¸c, trong khi nh÷ng ph©n ®o¹n ë giai ®o¹n 2 trªn H×nh 21.2 ®−îc vÏ n»m theo trËt tù vÞ trÝ. Sù kh¸c biÖt trong c¸ch vÏ nh− vËy ph¶n ¸nh sù kh¸c biÖt gi÷a hai ph−¬ng ph¸p nh− thÕ nµo?.
Ch−¬ng 21 C¸c hÖ gen vµ sù tiÕn hãa cña chóng 429
®Þnh trªn nhiÔm s¾c thÓ cña c¸c c¬ thÓ ®a bµo rÊt khã gi¶i tr×nh tù chi tiÕt bëi c¸c ph−¬ng ph¸p th«ng th−êng. Tho¹t nh×n th× d−êng nh− tr×nh tù hÖ gen cña ng−êi vµ c¸c
sinh vËt kh¸c ®¬n gi¶n chØ lµ nh÷ng tr×nh tù “kh« khèc” cña c¸c nucleotide, nghÜa lµ hµng triÖu c¸c “ch÷ c¸i” A, T, G vµ C s¾p xÕp kÕ tiÕp nhau mét c¸ch “buån ch¸n”. §iÒu cèt yÕu ®Ó l−îng d÷ liÖu khæng lå nµy trë nªn cã nghÜa lµ c¸c ph−¬ng ph¸p ph©n tÝch mµ chóng ta sÏ ®Ò cËp ®Õn ë tiÓu môc tiÕp theo.
Mçi mét trung t©m trong sè kho¶ng 20 trung t©m gi¶i tr×nh tù tham gia dù ¸n HÖ gen Ng−êi ngµy nµy qua ngµy kh¸c ®· t¹o ra mét l−îng khæng lå c¸c tr×nh tù ADN. Khi sè liÖu ngµy cµng ®−îc tÝch lòy, th× nhu cÇu n¶y sinh lµ ph¶i cã c¸ch qu¶n lý vµ theo dâi tÊt c¶ c¸c tr×nh tù ®· ®−îc ph¸t hiÖn. Nhê ®· chuÈn bÞ tõ tr−íc, c¸c nhµ khoa häc vµ c¸c c¬ quan qu¶n lý tham gia Dù ¸n HÖ gen Ng−êi ®· ®Æt ra mét môc tiªu ngay tõ ®Çu lµ thiÕt lËp c¸c ng©n hµng d÷ liÖu, hay cßn gäi lµ c¬ së d÷ liÖu, vµ ngµy cµng hoµn thiÖn c¸c phÇn mÒm ph©n tÝch d÷ liÖu. Nh÷ng c¬ së d÷ liÖu vµ nh÷ng phÇn mÒm nµy sau ®ã ®−îc tËp hîp l¹i vµ cã thÓ dÔ dµng truy cËp vµ sö dông trªn m«i tr−êng Internet. ViÖc hoµn thµnh môc tiªu nµy cña dù ¸n ®· gãp phÇn thóc ®Èy viÖc ph©n tÝch c¸c tr×nh tù ADN nhê t¹o ®iÒu kiÖn cho c¸c céng ®ång khoa häc toµn thÕ giíi cã thÓ tiÕp cËn c¸c tµi nguyªn tin sinh häc, còng nh− thóc ®Èy viÖc truyÒn b¸ vµ trao ®æi c¸c th«ng tin cã liªn quan.
TËp hîp d÷ liÖu ®Ó ph©n tÝch c¸c hÖ gen C¸c c¬ quan ®−îc chÝnh phñ tµi trî thùc hiÖn vai trß thiÕt lËp c¸c c¬ së d÷ liÖu vµ cung cÊp c¸c ph©n mÒm nhê ®ã c¸c nhµ khoa häc cã thÓ ph©n tÝch c¸c d÷ liÖu tr×nh tù hÖ gen. Ch¼ng h¹n, ë Mü, mét ch−¬ng tr×nh hîp t¸c gi÷a Th− viÖn Y häc Quèc gia vµ ViÖn Y häc Quèc gia (NIH) ®· thiÕt lËp nªn Trung t©m Quèc gia vÒ Th«ng tin C«ng nghÖ Sinh häc (NCBI) ®ång thêi duy tr× mét trang Web (www.ncbi.nlm.nih.gov) l−u gi÷ c¸c tµi nguyªn tin sinh häc hÕt søc phong phó. T¹i trang Web nµy, c¸c
®−êng “link” dÉn ®Õn c¸c c¬ së d÷ liÖu, c¸c phÇn mÒm vµ c¸c kho chøa c¸c th«ng tin vÒ c¸c hÖ gen vµ c¸c chñ ®Ò cã liªn quan kh¸c. C¸c trang Web t−¬ng tù còng ®· ®−îc thiÕt lËp bëi Phßng thÝ nghiÖm Sinh häc ph©n tö Ch©u ¢u vµ Ng©n hµng D÷ liÖu ADN NhËt B¶n; ®©y còng chÝnh lµ hai trung t©m nghiªn cøu hÖ gen cïng hîp t¸c víi NCBI. Nh÷ng trang Web lín vµ toµn diÖn nµy cßn ®−îc bæ sung thªm bëi nh÷ng trang Web kh¸c ®−îc duy tr× bëi c¸c phßng thÝ nghiÖm nhá h¬n hoÆc bëi c¸c c¸ nh©n. C¸c trang Web nhá h¬n th−êng cung cÊp c¸c c¬ së d÷ liÖu vµ c¸c phÇn mÒm ®−îc thiÕt kÕ cho c¸c môc ®Ých nghiªn cøu hÑp h¬n, ch¼ng h¹n nh− ®Ó t×m hiÓu vÒ nh÷ng thay ®æi di truyÒn hoÆc trong hÖ gen liªn quan ®Õn mét bÖnh ung th− nhÊt ®Þnh. C¸c c¬ së d÷ liÖu vÒ c¸c tr×nh tù cña NCBI ®−îc gäi chung
lµ Ng©n hµng gen (Genbank). TÝnh tíi th¸ng 8 n¨m 2007, Genbank ®· chøa tr×nh tù cña 76 triÖu ph©n ®o¹n ADN hÖ gen kh¸c nhau, gåm tæng céng 80 tû cÆp baz¬ ! C¸c tr×nh tù trong ng©n hµng gen liªn tôc ®−îc cËp nhËt, vµ −íc tÝnh l−îng d÷ liÖu cña nã cø sau kho¶ng 18 th¸ng l¹i t¨ng lªn gÊp ®«i. Mäi tr×nh tù trong Genbank cã thÓ ®−îc truy xuÊt vµ ph©n tÝch b»ng c¸c ph©n mÒm ë trang Web cña NCBI hoÆc tõ c¸c trang Web kh¸c. Mét ch−¬ng tr×nh phÇn mÒm s½n cã trªn trang Web cña
NCBI, gäi lµ BLAST, cho phÐp bÊt cø ai truy cËp cã thÓ so s¸nh ®−îc mét tr×nh tù ADN nhÊt ®Þnh víi bÊt cø tr×nh tù nµo s½n cã trong Genbank trªn c¬ së ®èi chiÕu tõng cÆp baz¬, qua ®ã t×m thÊy c¸c vïng tr×nh tù gièng nhau gi÷a chóng. Mét phÇn mÒm kh¸c cho phÐp so s¸nh c¸c tr×nh tù protein dù ®o¸n. Ngoµi ra, mét phÇn mÒm thø ba cho phÐp t×m kiÕm mét chuçi axit amin (miÒn) cã chøc n¨ng sinh häc ®· biÕt hoÆc ®ang ®−îc dù ®o¸n tõ mäi tr×nh tù protein s½n cã trong Genbank; ®ång thêi, nã cã thÓ biÓu diÔn m« h×nh kh«ng gian ba chiÒu cña miÒn chøc n¨ng ®ã cïng víi c¸c th«ng tin cã liªn quan phï hîp (xem H×nh 21.4 ë trang sau). ThËm chÝ cßn cã mét ch−¬ng tr×nh phÇn mÒm cã thÓ so s¸nh mét tËp hîp c¸c tr×nh tù, hoÆc lµ c¸c tr×nh tù axit nucleic hoÆc lµ c¸c tr×nh tù polypeptit, vµ biÓu diÔn chóng ë d¹ng c©y tiÕn hãa trªn c¬ së mèi quan hÖ gi÷a c¸c tr×nh tù. (Chóng ta sÏ ®Ò cËp kü h¬n vÒ nh÷ng s¬ ®å nµy ë Ch−¬ng 26). Trang Web cña NCBI còng cßn duy tr× mét c¬ së d÷ liÖu
bao gåm tÊt c¶ c¸c cÊu tróc ba chiÒu cña protein ®· ®−îc x¸c ®Þnh (®Ó tæng quan vÒ ph©n tÝch cÊu tróc protein, xem H×nh 5.25). B»ng phÇn mÒm m¸y tÝnh, ng−êi xem cã thÓ quay nh÷ng cÊu tróc nµy ®Ó cã thÓ quan s¸t protein tõ mäi phÝa. Gi¶ sö mét nhµ nghiªn cøu cã mét tr×nh tù axit amin lµ tr×nh tù ®Çy ®ñ hoÆc mét phÇn cña mét protein ch−a biÕt nµo ®ã, mµ nã l¹i cã tr×nh tù gièng víi mét tr×nh tù axit amin cã cÊu tróc kh«ng gian ®· biÕt. Trong tr−êng hîp nµy, nhµ nghiªn cøu cã thÓ dù ®o¸n cÊu tróc cña protein ch−a biÕt b»ng mét phÇn mÒm, vµ sö dông mét phÇn mÒm kh¸c ®Ó so s¸nh nã víi tÊt c¶ c¸c cÊu tróc protein ®· biÕt. Nh÷ng th«ng tin nµy cã thÓ gióp nhµ nghiªn cøu x¸c ®Þnh ®−îc chøc n¨ng cña protein ch−a biÕt. HiÖn nay, trªn toµn thÕ giíi cã rÊt nhiÒu nguån tµi nguyªn
s½n cã cho c¸c nhµ nghiªn cøu sö dông. B©y giê chóng ta sÏ nãi ®Õn c¸c chñ ®Ò mµ nh÷ng nguån tµi nguyªn nµy ®Ò cËp ®Õn.
X¸c ®Þnh c¸c gen m� hãa protein trong c¸c tr×nh tù ADN B»ng viÖc sö dông c¸c tr×nh tù ADN s½n cã, c¸c nhµ di truyÒn häc cã thÓ nghiªn cøu trùc tiÕp c¸c gen mµ kh«ng nhÊt thiÕt ph¶i pháng ®o¸n vÒ kiÓu gen trªn c¬ së ph©n tÝch kiÓu h×nh nh− trong c¸c nghiªn cøu di truyÒn häc kinh ®iÓn tr−íc ®©y. Tuy vËy, c¸ch tiÕp cËn nµy l¹i cã mét trë ng¹i kh¸c: ®ã lµ viÖc x¸c ®Þnh kiÓu h×nh trªn c¬ së kiÓu gen ®· biÕt. Trªn c¬ së mét tr×nh
21.2 Kh¸i niÖm
C¸c nhµ khoa häc øng dông tin sinh häc ®Ó ph©n tÝch c¸c hÖ gen vµ chøc n¨ng cña chóng
21.1
1. B¶n ®å liªn kÕt vµ b¶n ®å vËt lý cña mét nhiÔm s¾c thÓ kh¸c nhau c¬ b¶n ë ®Æc ®iÓm g× ?
2. XÐt tæng thÓ, ph−¬ng ph¸p lËp b¶n ®å hÖ gen ®−îc dïng trong Dù ¸n HÖ gen Ng−êi vµ ph−¬ng ph¸p gi¶i tr×nh tù ngÉu nhiªn toµn hÖ gen kh¸c nhau nh− thÕ nµo ?
3. Gi¶ sö b¹n quyÕt ®Þnh tiÕn hµnh gi¶i tr×nh tù hÖ gen cña mét loµi chuét ®ång, vèn lµ mét loµi cã quan hÖ gÇn gòi víi loµi chuét thÝ nghiÖm cã tr×nh tù hÖ gen ®· ®−îc x¸c ®Þnh hoµn toµn. T¹i sao tr×nh tù hÖ gen chuét thÝ nghiÖm ®· biÕt ®−a b¹n ®Õn quyÕt ®Þnh chän ph−¬ng ph¸p gi¶i tr×nh tù ngÉu nhiªn toµn hÖ gen thay cho ph−¬ng ph¸p ba giai ®o¹n ? Xem gîi ý tr¶ lêi ë Phô lôc A.
KiÓm tra kh¸i niÖm
®iÒu g× NÕu
430 khèi kiÕn thøc 3 Di truyÒn häc
tù ADN dµi cã trªn c¬ së d÷ liÖu nh− Genbank, b»ng c¸ch nµo chóng ta cã thÓ nhËn ra c¸c gen m· hãa protein vèn ch−a tõng ®−îc biÕt tíi vµ x¸c ®Þnh chøc n¨ng cña chóng? C¸ch th«ng th−êng lµ sö dông mét phÇn mÒm ®Ó t×m kiÕm
trong nh÷ng tr×nh tù nµy sù cã mÆt hay kh«ng cña c¸c tÝn hiÖu khëi ®Çu vµ kÕt thóc phiªn m· hoÆc dÞch m·, hoÆc lµ c¸c vÞ trÝ c¾t - nèi ARN hay c¸c tÝn hiÖu kh¸c th−êng cã ë c¸c gen m· hãa protein. PhÇn mÒm nµy ®ång thêi còng t×m kiÕm c¸c ®o¹n tr×nh tù ng¾n t−¬ng øng víi c¸c tr×nh tù th−êng cã trªn c¸c ph©n tö mARN ®· biÕt. Hµng ngh×n c¸c tr×nh tù nh− vËy, ®−îc gäi lµ c¸c ®o¹n ®¸nh dÊu tr×nh tù biÓu hiÖn hay EST ®−îc thu thËp tõ c¸c tr×nh tù cADN vµ ®−îc m¸y tÝnh tËp hîp l¹i thµnh c¸c c¬ së d÷ liÖu. KiÓu ph©n tÝch nµy cho phÐp x¸c ®Þnh ®−îc c¸c tr×nh tù t−¬ng øng víi c¸c gen m· hãa protein mµ tr−íc ®ã ch−a tõng ®−îc biÕt tíi. Kho¶ng mét nöa sè gen ë ng−êi ®· ®−îc biÕt tõ tr−íc khi dù
¸n hÖ gen ng−êi b¾t ®Çu. VËy ®èi víi nh÷ng gen cßn l¹i, viÖc ph©n tÝch c¸c tr×nh tù ADN b»ng c¸ch nµo cho biÕt chóng lµ c¸c gen ch−a ®−îc biÕt tr−íc ®ã? Manh mèi ®Ó x¸c ®Þnh nh÷ng gen nµy xuÊt ph¸t tõ viÖc so s¸nh tr×nh tù cña c¸c “gen øng cö viªn” (c¸c tr×nh tù ®−îc dù ®o¸n lµ gen) víi tr×nh tù cña c¸c gen ®· biÕt cã nguån gèc tõ c¸c sinh vËt kh¸c b»ng viÖc sö dông c¸c phÇn mÒm ®· ®−îc nh¾c ®Õn ë trªn. Do tÝnh tho¸i hãa cña m· di truyÒn, b¶n th©n tr×nh tù ADN cã thÓ cã møc ®é biÕn ®æi lín
h¬n so víi c¸c tr×nh tù protein t−¬ng øng. V× vËy, víi c¸c nhµ khoa häc quan t©m ®Õn protein, hä th−êng tiÕn hµnh so s¸nh gi÷a tr×nh tù axit amin cña protein pháng ®o¸n víi c¸c tr×nh tù cña c¸c protein ®· biÕt. §«i khi mét tr×nh tù võa míi ®−îc x¸c ®Þnh khíp hoµn toµn
hay mét phÇn víi tr×nh tù cña mét gen hoÆc mét protein mµ chøc n¨ng ®· biÕt râ. VÝ dô nh−, mét phÇn cña mét gen míi cã thÓ khíp víi mét gen ®· biÕt m· hãa cho mét protein kinase, mét protein quan träng tham gia vµo mét con ®−êng truyÒn tÝn hiÖu (xem Ch−¬ng 11), chØ ra nhiÒu kh¶ n¨ng gen míi nµy cã thÓ cã chøc n¨ng t−¬ng tù. Theo mét c¸ch kh¸c, tr×nh tù cña mét gen míi l¹i gièng víi mét tr×nh tù ®· tõng ®−îc biÕt tõ tr−íc nh−ng ch−a râ chøc n¨ng. Mét kh¶ n¨ng kh¸c lµ tr×nh tù míi ®−îc x¸c ®Þnh kh«ng gièng víi bÊt cø mét tr×nh tù nµo ®· tõng ®−îc biÕt ®Õn. §iÒu nµy lµ ®óng ®èi víi Ýt nhÊt mét phÇn ba c¸c gen cña E. coli khi hÖ gen cña vi khuÈn nµy ®−îc gi¶i tr×nh tù. Trong tr−êng hîp cuèi cïng, chøc n¨ng cña protein th−êng ®−îc suy diÔn b»ng viÖc kÕt hîp gi÷a c¸c nghiªn cøu vÒ chøc n¨ng ph©n tö vµ hãa sinh häc. C¸c nghiªn cøu vÒ hãa sinh nh»m x¸c ®Þnh cÊu tróc kh«ng gian ba chiÒu còng nh− c¸c thuéc tÝnh hãa lý cña protein, ch¼ng h¹n nh− c¸c vÞ trÝ liªn kÕt cña protein víi c¸c ph©n tö kh¸c. Trong khi ®ã, c¸c nghiªn cøu vÒ chøc n¨ng ph©n tö th−êng tiÕn hµnh lµm bÊt ho¹t hoÆc lµm gi¶m møc ®é biÓu hiÖn cña c¸c gen míi x¸c ®Þnh råi theo dâi
� H×nh 21.4 C¸c c«ng cô tin sinh häc s½n cã trªn internet. Mét trang web ®−îc Trung t©m Quèc gia Th«ng tin vÒ C«ng nghÖ Sinh häc (Mü) duy tr× cho phÐp c¸c nhµ khoa häc vµ céng ®ång tiÕp cËn c¸c tr×nh tù protein vµ ADN. Trang
web nµy gåm c¶ kÕt nèi tíi mét c¬ së d÷ liÖu cÊu tróc protein - CDD (Conserved Domain Database) gióp t×m vµ m« t¶ nh÷ng miÒn gièng nhau ë c¸c protein cã quan hÖ víi nhau, còng nh− c¸c phÇn mÒm quan s¸t ba chiÒu - Cn3D - cho phÐp
quan s¸t m« h×nh ba chiÒu cña c¸c miÒn cÊu tróc ®· ®−îc x¸c ®Þnh. H×nh ¶nh ®−îc minh häa ë trªn lµ kÕt qu¶ t×m kiÕm c¸c vïng protein gièng víi mét tr×nh tù axit amin t×m thÊy ë mét protein cña d−a hÊu.
Trong cöa sæ nµy, mét phÇn tr×nh tù axit amin tõ mét protein ch−a biÕt ("Query") ë d−a hÊu ®−îc xÕp th¼ng hµng víi c¸c tr×nh tù cña c¸c protein kh¸c mµ ch−¬ng tr×nh m¸y tÝnh t×m thÊy gièng víi nã. C¸c tr×nh tù ë ®©y biÓu diÔn mét miÒn ®−îc gäi lµ WD40. Bèn dÊu hiÖu ®iÓn h×nh cña miÒn nµy ®−îc nhÊn m¹nh b»ng nÒn mµu vµng. (Sù gièng nhau gi÷a c¸c tr×nh tù ®−îc nhËn biÕt chñ yÕu dùa trªn c¸c ®Æc ®iÓm hãa häc cña c¸c axit amin, v× vËy c¸c axit amin ë c¸c vïng ®−îc nhÊn m¹nh kh«ng nhÊt thiÕt gièng nhau hoµn toµn.)
Ch−¬ng tr×nh Cn3D hiÓn thÞ mét m« h×nh ruy b¨ng ba chiÒu cña protein transductin cña bß (protein ®−îc t« b»ng nÒn mµu tÝm nh¹t trong cöa sæ Sequence Aligment Viewer). Protein nµy lµ lo¹i duy nhÊt trong c¸c protein tr×nh diÖn ë ®©y cã cÊu tróc ®· ®−îc x¸c ®Þnh. Sù gièng víi transductin bß cña c¸c protein kh¸c cho thÊy cÊu tróc cña chóng cã thÓ gièng víi m« h×nh ®−îc hiÓn thÞ ë ®©y.
Transductin bß chøa b¶y miÒn WD40; mét trong nh÷ng miÒn nµy ®−îc nhÊn m¹nh b»ng mµu ghi.
C¸c vïng ®−îc t« mµu vµng nµy t−¬ng øng víi c¸c axit amin dÊu hiÖu ®iÓn h×nh ®−îc t« mµu vµng ë cöa sæ bªn trªn.
Cöa sæ nµy hiÓn thÞ th«ng tin vÒ miÒn
WD40 tõ C¬ së d÷ liÖu cÊu tróc protein – CDD.
Ch−¬ng 21 C¸c hÖ gen vµ sù tiÕn hãa cña chóng 431
sù thay ®æi cña kiÓu h×nh, qua ®ã x¸c ®Þnh chøc n¨ng cña gen. ARNi, ®−îc m« t¶ ë Ch−¬ng 20, lµ mét vÝ dô vÒ kü thuËt phßng thÝ nghiÖm ®−îc dïng ®Ó bÊt ho¹t chøc n¨ng cña gen.
T×m hiÓu c¸c gen vµ c¸c s¶n phÈm cña gen ë cÊp ®é sinh häc hÖ thèng Søc m¹nh ®Çy Ên t−îng cña c¸c c«ng cô sinh tin häc vµ m¸y tÝnh cho phÐp c¸c nhµ khoa häc giê ®©y cã thÓ nghiªn cøu toµn bé c¸c gen thuéc c¸c bé nhiÔm s¾c thÓ vµ sù t−¬ng t¸c cña chóng víi nhau, còng nh− cã thÓ so s¸nh hÖ gen tõ c¸c loµi kh¸c nhau. HÖ gen häc lµ mét tµi nguyªn th«ng tin phong phó vµ chuyªn s©u cã thÓ tr¶ lêi c¸c c©u hái c¬ b¶n vÒ c¸ch tæ chøc cña c¸c hÖ gen, vÒ sù ®iÒu hßa sù biÓu hiÖn c¸c gen, vÒ c¸c qu¸ tr×nh sinh tr−ëng vµ ph¸t triÓn, kÓ c¶ tiÕn hãa. Nh÷ng thµnh c«ng trong lÜnh vùc gi¶i tr×nh tù c¸c hÖ gen vµ
kh¶ n¨ng nghiªn cøu toµn bé c¸c gen thuéc c¸c bé nhiÔm s¾c thÓ kh¸c nhau ®· thóc ®Èy c¸c nhµ khoa häc nç lùc nghiªn cøu mét hÖ thèng t−¬ng tù c¸c bé protein ®Çy ®ñ (proteom) ®−îc m· hãa t−¬ng øng bëi c¸c hÖ gen, tõ ®ã h×nh thµnh nªn mét lÜnh vùc nghiªn cøu míi gäi lµ hÖ protein häc (proteomics). C¸c protein, chø kh«ng ph¶i c¸c gen m· hãa chóng, trong thùc tÕ thùc hiÖn phÇn lín c¸c ho¹t ®éng sèng cña tÕ bµo. V× vËy, ®Ó t×m hiÓu sù biÓu hiÖn chøc n¨ng sinh häc cña c¸c tÕ bµo vµ c¬ thÓ, chóng ta ph¶i t×m hiÓu c¸c protein ®−îc t¹o ra khi nµo vµ ë ®©u trong mçi c¬ thÓ, còng nh− viÖc chóng t−¬ng t¸c víi nhau thÕ nµo trong c¸c m¹ng l−íi t−¬ng t¸c ph©n tö.
C¸c hÖ thèng ®−îc t×m hiÓu thÕ nµo: mét vÝ dô C¸c lÜnh vùc hÖ gen häc vµ hÖ protein häc cho phÐp c¸c nhµ sinh häc tiÕn hµnh c¸c nghiªn cøu vÒ sù sèng ë qui m« ngµy cµng réng lín vµ theo xu h−íng toµn cÇu. B»ng viÖc sö dông c¸c c«ng cô mµ chóng ta ®· m« t¶, c¸c nhµ sinh häc ®· b¾t ®Çu tËp hîp c¸c d÷ liÖu vÒ c¸c gen vµ c¸c protein, tøc lµ liÖt kª tÊt c¶ c¸c “cÊu phÇn” tham gia vµo viÖc ®iÒu hµnh c¸c ho¹t ®éng cña tÕ bµo, m« vµ c¬ thÓ. Víi tËp hîp c¸c d÷ liÖu nh− vËy, c¸c nhµ nghiªn cøu cã thÓ chuyÓn mèi quan t©m cña hä tõ mçi cÊu phÇn ®¬n lÎ sang sù biÓu hiÖn chøc n¨ng ë d¹ng tæ hîp gåm nhiÒu cÊu phÇn ë c¸c cÊp ®é cña hÖ thèng sinh häc. Nhí l¹i ë Ch−¬ng 1, chóng ta ®· ®Ò cËp ®Õn “sinh häc hÖ thèng” lµ lÜnh vùc m« h×nh hãa c¸c biÓu hiÖn ho¹t ®éng n¨ng ®éng cña c¸c hÖ thèng sinh häc toµn bé. Mét øng dông c¬ b¶n cña h−íng nghiªn cøu sinh häc hÖ
thèng lµ x¸c ®Þnh ®−îc c¸c m¹ch nèi tiÕp gi÷a c¸c gen vµ c¸c m¹ng l−íi t−¬ng t¸c cña c¸c protein. Ch¼ng h¹n nh−, ®Ó x©y dùng ®−îc s¬ ®å m¹ng l−íi t−¬ng t¸c gi÷a c¸c protein ë ruåi Drosophila nh− ®−îc nªu ë Ch−¬ng 1, c¸c nhµ nghiªn cøu ®· b¾t ®Çu tõ trªn 10.000 b¶n phiªn m· ARN dù ®o¸n. Sau ®ã, b»ng c¸c ph−¬ng ph¸p ph©n tö, hä ®· kiÓm tra sù t−¬ng t¸c gi÷a toµn bé hoÆc mét phÇn c¸c s¶n phÈm protein thu ®−îc c¸c b¶n phiªn m· nµy. B»ng viÖc sö dông c¸c phÐp ph©n tÝch thèng kª ®Ó chän ra c¸c mèi t−¬ng t¸c cã sè liÖu thuyÕt phôc nhÊt, hä ®· t×m ra kho¶ng 4700 lo¹i protein biÓu hiÖn tham gia vµo 4000 mèi t−¬ng t¸c kh¸c nhau. Mét phÇn trong nh÷ng mèi t−¬ng t¸c nµy ®−îc minh häa ë d¹ng s¬ ®å trªn H×nh 21.5; chi tiÕt cã thÓ ®−îc nh×n dÔ h¬n ë hai h×nh phãng to bªn d−íi. §Ó cã thÓ xö lý mét sè lín c¸c d÷ liÖu thu ®−îc vÒ c¸c mèi t−¬ng t¸c protein - protein phøc t¹p thu ®−îc tõ c¸c thÝ nghiÖm nµy, ®ång thêi cã thÓ tæ hîp chóng víi nhau d−íi d¹ng c¸c s¬ ®å m« h×nh, chóng ta cÇn ®Õn c¸c hÖ thèng m¸y tÝnh hiÖu n¨ng cao, c¸c c«ng cô to¸n häc vµ c¸c phÇn mÒm ®−îc ph¸t triÓn míi. Nh− vËy, cã thÓ nãi sinh häc hÖ thèng trong thùc tÕ ®· trë thµnh hiÖn thùc nhê c¸c tiÕn bé cña tin sinh häc.
øng dông sinh häc hÖ thèng trong y häc Dù ¸n Atl¸t HÖ gen Ung th− lµ mét vÝ dô kh¸c vÒ sinh häc hÖ thèng mµ ë ®ã ng−êi ta ®ång thêi tiÕn hµnh ph©n tÝch mét sè lín c¸c gen vµ s¶n phÈm cña gen t−¬ng t¸c víi nhau. Dù ¸n nµy ®Æt d−íi sù chØ ®¹o phèi hîp cña ViÖn Ung th− Quèc gia (Mü)vµ NIH nh»m t×m hiÓu nh÷ng thay ®æi trong c¸c hÖ thèng sinh häc dÉn ®Õn sù ph¸t sinh ung th−. Trong giai ®o¹n 3 n¨m thö nghiÖm dù ¸n (tõ 2007 ®Õn 2010), c¸c nhµ nghiªn cøu tËp trung ph©n tÝch ba lo¹i ung th− lµ ung th− phæi, ung th− buång trøng vµ u nguyªn bµo ®Öm (glioblastoma) th«ng qua viÖc t×m hiÓu sù kh¸c nhau trong tr×nh tù cña c¸c gen vµ sù biÓu hiÖn cña chóng ë c¸c tÕ bµo ung th− so víi c¸c tÕ bµo b×nh th−êng. Mét tËp hîp gåm kho¶ng 2000 gen ë c¸c tÕ bµo ung th− sÏ ®−îc gi¶i tr×nh tù vµo c¸c thêi ®iÓm kh¸c nhau trong qu¸ tr×nh tiÕn triÓn cña bÖnh nh»m t×m ra nh÷ng thay ®æi hoÆc g©y ra do ®ét biÕn hoÆc g©y ra bëi c¸c c¬ chÕ s¾p xÕp l¹i nhiÔm s¾c thÓ kh¸c. NÕu nh÷ng nghiªn cøu nµy thµnh c«ng, chóng sÏ ®−îc më réng ¸p dông ®Ó nghiªn cøu c¸c lo¹i bÖnh ung th− kh¸c.
� H×nh 21.5 Sinh häc hÖ thèng tiÕp cËn c¸c t−¬ng t¸c protein. B¶n ®å t−¬ng t¸c protein tæng thÓ nµy hiÓn thÞ mét tËp hîp con cña c¸c t−¬ng t¸c nhiÒu kh¶ n¨ng nhÊt (®−êng kÎ nèi) tõ 2300 protein (vßng trßn nhá) ë ruåi Drosophila. Ba mµu nÒn kh¸c nhau trªn b¶n ®å t−¬ng øng víi vÞ trÝ chung cña mçi protein: mµu xanh lôc lµ nh©n, xanh lam lµ tÕ bµo chÊt vµ vµng lµ mµng sinh chÊt. C¸c protein ®−îc “m· hãa” b»ng mµu t−¬ng øng víi vÞ trÝ ®Þnh vÞ trong tÕ bµo ®Æc thï cña chóng; vÝ dô, c¸c vßng trßn mµu xanh lôc lµ c¸c protein trong nh©n.
C¸c protein
432 khèi kiÕn thøc 3 Di truyÒn häc
Sinh häc hÖ thèng cã tiÒm n¨ng øng dông to lín trong y häc, mÆc dï hiÖn nay nã míi b¾t ®Çu ®−îc triÓn khai. §Õn nay, ng−êi ta ®· t¹o ra ®−îc c¸c lo¹i chip vi d·y (microarray) lµm b»ng thñy tinh hoÆc silicon chøa phÇn lín c¸c gen ®· biÕt cña ng−êi (H×nh 21.6). Nh÷ng chip nh− vËy ®ang ®−îc sö dông ®Ó ph©n tÝch sù biÓu hiÖn cña c¸c gen ë nh÷ng bÖnh nh©n m¾c c¸c chøng bÖnh ung th− kh¸c nhau vµ mét sè bÖnh lý kh¸c n÷a. Môc ®Ých cuèi cïng cña nh÷ng nghiªn cøu nµy lµ ®Ò ra c¸c ph¸c ®å ®iÒu trÞ phï hîp ®Æc thï víi b¶n chÊt di truyÒn cña mçi bÖnh nh©n vµ ®Æc tr−ng ®èi víi mçi lo¹i bÖnh ung th− mµ hä m¾c ph¶i. C¸ch tiÕp cËn nµy ®· ®¹t ®−îc mét sè thµnh c«ng nhÊt ®Þnh trong viÖc x¸c ®Þnh ®−îc ®Æc tÝnh ë mét sè nhãm bÖnh ung th−. Cuèi cïng, mçi ng−êi chóng ta cã thÓ cã mét “hå s¬ y häc”
cïng víi c¸c tr×nh tù ADN cña m×nh; ®ã lµ mét tËp hîp nhá th«ng tin di truyÒn víi c¸c vïng hÖ gen ®−îc “®¸nh dÊu” cho biÕt xu h−íng mÉn c¶m víi nh÷ng bÖnh nhÊt ®Þnh. Lóc nµy, tiÒm n¨ng øng dông trong phßng tr¸nh vµ ®iÒu trÞ bÖnh ®èi víi mçi ng−êi sÏ thµnh hiÖn thùc. Sinh häc hÖ thèng lµ mét c¸ch tiÕp cËn nghiªn cøu hiÖu qu¶
vÒ c¸c thuéc tÝnh ë cÊp ®é ph©n tö. Tõ Ch−¬ng 1 chóng ta nhí l¹i r»ng, c¸c thuéc tÝnh míi ®−îc t×m thÊy ë cÊp ®é tæ chøc phøc t¹p h¬n th−êng b¾t nguån tõ sù s¾p xÕp c¸c “khèi cÊu tróc” cña cÊp ®é tæ chøc thÊp h¬n. Khi chóng ta hiÓu biÕt ngµy cµng ®Çy ®ñ h¬n vÒ c¸ch s¾p xÕp vµ tæ hîp cña c¸c cÊu phÇn thuéc c¸c hÖ thèng di truyÒn, chóng ta cµng hiÓu biÕt s©u h¬n vÒ ho¹t ®éng cña c¸c c¬ thÓ sèng. PhÇn cßn l¹i cña ch−¬ng nµy sÏ ®Ò cËp ®Õn nh÷ng kiÕn thøc mµ chóng ta ®· häc ®−îc ®Õn nµy nhê c¸c nghiªn cøu thuéc lÜnh vùc hÖ gen häc.
TÝnh ®Õn ®Çu n¨m 2008, viÖc gi¶i tr×nh tù cña trªn 700 hÖ gen ®· hoµn thµnh vµ kho¶ng trªn 2700 hÖ gen kh¸c ®ang tiÕp tôc ®−îc gi¶i tr×nh tù. Trong nhãm c¸c hÖ gen ®· ®−îc gi¶i tr×nh tù hoµn toµn, cã kho¶ng 600 hÖ gen vi khuÈn vµ 50 hÖ gen vi khuÈn cæ. Trong sè 65 loµi sinh vËt nh©n thËt thuéc nhãm nµy cã c¸c loµi ®éng vËt cã x−¬ng sèng, c¸c loµi ®éng vËt kh«ng x−¬ng sèng, c¸c nguyªn sinh ®éng vËt, nÊm vµ thùc vËt. C¸c tr×nh tù hÖ gen ®· ®−îc tÝch lòy chøa ®ùng mét tµi nguyªn th«ng tin phong phó mµ hiÖn nay chóng ta míi b¾t ®Çu khai th¸c. Cho ®Õn nay chóng ta ®· häc ®−îc g× tõ viÖc so s¸nh c¸c hÖ gen ®· ®−îc gi¶i tr×nh tù? Trong môc nµy, chóng ta sÏ xem xÐt c¸c ®Æc tÝnh vÒ kÝch cì hÖ gen, sè gen vµ mËt ®é gen cña chóng. Do xÐt vÒ chi tiÕt, c¸c ®Æc tÝnh nµy rÊt ®a d¹ng, nªn chóng ta chØ nhÊn m¹nh vµo c¸c xu h−íng chung; tuy vËy, bªn c¹nh c¸c xu h−íng chung th× th−êng xuÊt hiÖn c¸c ngo¹i lÖ.
KÝch cì hÖ gen Khi so s¸nh hÖ gen gi÷a ba liªn giíi (vi khuÈn, vi khuÈn cæ vµ sinh vËt nh©n thËt), chóng ta nhËn thÊy mét xu h−íng kh¸c biÖt chung vÒ kÝch cì hÖ gen gi÷a c¸c sinh vËt nh©n s¬ (vi khuÈn vµ vi khuÈn cæ) víi sinh vËt nh©n thËt (B¶ng 21.1). Ngoµi mét sè ngo¹i lÖ, phÇn lín hÖ gen vi khuÈn cã kÝch cì tõ 1 ®Õn 6 triÖu cÆp baz¬ (bp); ch¼ng h¹n nh− hÖ gen cña E. coli lµ 4,6 triÖu bp. HÖ gen cña c¸c vi khuÈn cæ trong phÇn lín tr−êng hîp cã kÝch cì gièng víi hÖ gen vi khuÈn. (Tuy vËy, cÇn ph¶i nhí r»ng míi chØ cã mét sè Ýt hÖ gen vi khuÈn cæ ®· ®−îc gi¶i tr×nh tù hoµn toµn, v× vËy “bøc tranh toµn c¶nh” nµy còng cã thÓ sÏ thay ®æi.) C¸c hÖ gen sinh vËt nh©n thËt cã xu h−íng lín h¬n. HÖ gen cña nÊm men ®¬n bµo Saccharomyces cerevisiae lµ kho¶ng 13 Mb (triÖu cÆp baz¬); trong khi ®ã, phÇn lín c¸c loµi ®éng vËt vµ thùc vËt, tøc lµ c¸c sinh vËt ®a bµo, cã kÝch cì hÖ gen Ýt nhÊt lµ 100 Mb. HÖ gen ruåi giÊm cã kÝch cì lµ 180 Mb, cßn hÖ gen ng−êi lµ 3.200 Mb, nghÜa lµ lín h¬n tõ 500 ®Õn 3000 lÇn so víi mét hÖ gen vi khuÈn ®iÓn h×nh. Bªn c¹nh sù kh¸c biÖt chung gi÷a hÖ gen cña c¸c sinh vËt
nh©n s¬ vµ sinh vËt nh©n thËt, th× viÖc so s¸nh kÝch cì hÖ gen trong ph¹m vi c¸c loµi sinh vËt nh©n thËt l¹i kh«ng ph¶n ¸nh mèi t−¬ng quan cã hÖ thèng gi÷a kÝch cì hÖ gen víi kiÓu h×nh cña c¸c loµi sinh vËt. Ch¼ng h¹n nh−, hÖ gen cña loµi Fritillaria assyriaca, mét loµi hoa thuéc hä lily, cã kÝch cì lµ 120 tØ cÆp baz¬ (120.000 Mb), tøc lµ lín h¬n kho¶ng 40 lÇn so víi hÖ gen ng−êi. Nh−ng cßn kinh ng¹c h¬n lµ hÖ gen mét loµi amip ®¬n bµo, Amoeba dubia, cã kÝch cì kho¶ng 670.000 Mb. (HÖ gen loµi nµy ch−a ®−îc gi¶i tr×nh tù.) Trong ph¹m vi hÑp h¬n, viÖc so s¸nh hÖ gen gi÷a hai loµi c«n trïng cho thÊy hÖ gen cña dÕ (Anabrus simplex) lín h¬n 11 lÇn so víi hÖ gen cña ruåi giÊm (Drosophila melanogaster). KÝch cì hÖ gen còng biÕn ®éng réng trong ph¹m vi mçi nhãm loµi nguyªn sinh ®éng vËt, c«n trïng, l−ìng c− vµ thùc vËt; nh−ng Ýt biÕn ®éng h¬n trong ph¹m vi c¸c loµi thó vµ bß s¸t.
Sè gen Mét xu h−íng kh¸c biÖt t−¬ng tù còng ®óng khi xÐt vÒ sè gen: nghÜa lµ, nh×n chung c¸c vi khuÈn vµ vi khuÈn cæ cã Ýt gen h¬n so víi sinh vËt nh©n thËt. C¸c vi khuÈn vµ vi khuÈn cæ sèng tù
21.3 Kh¸i niÖm
C¸c hÖ gen kh¸c nhau vÒ kÝch cì, sè gen vµ mËt ®é gen
� H×nh 21.6 Mét chip ph©n tÝch gen ng−êi. C¸c ®iÓm nhá chøa ADN ®−îc xÕp thµnh c¸c ®−êng kÎ « trªn b¶n silicon nµy ®¹i diÖn cho hÇu hÕt c¸c gen trong hÖ gen ng−êi. Nhê sö dông chip nµy, c¸c nhµ nghiªn cøu cã thÓ ph©n tÝch cïng lóc møc biÓu hiÖn cña tÊt c¶ c¸c gen, qua ®ã gióp gi¶m l−îng hãa chÊt cÇn dïng tèi ®a ®ång thêi ®¶m b¶o ®iÒu kiÖn ®ång ®Òu cho tÊt c¶ c¸c gen.
21.2
1. Internet cã vai trß nh− thÕ nµo trong c¸c nghiªn cøu hiÖn nay vÒ c¸c hÖ gen häc vµ protein häc ?
2. H·y gi¶i thÝch −u thÕ cña c¸c nghiªn cøu theo h−íng sinh häc hÖ thèng khi t×m hiÓu vÒ ung th− so víi ph−¬ng ph¸p nghiªn cøu ®éc lËp tõng gen vµo mçi thêi ®iÓm.
3. Gi¶ sö b¹n ®ang dïng mét ph−¬ng ph¸p nghiªn cøu di truyÒn kinh ®iÓn ®Ó t×m hiÓu mét tÝnh tr¹ng di truyÒn ë ruåi Drosophila. Cô thÓ, b¹n ®· g©y ®ét biÕn ë ruåi vµ chän läc ra ®−îc c¸c c¸ thÓ cã kiÓu h×nh mµ b¹n quan t©m. Gi¶ thiÕt b¹n còng cã thÓ sö dông c¸c c«ng cô sinh häc ph©n tö ®Ó thu ®−îc vïng ADN mang ®ét biÕn. B¹n sÏ tiÕp tôc ph©n tÝch ®ét biÕn ®ã nh− thÕ nµo ®Ó cã thÓ x¸c ®Þnh ®−îc c¸ch mµ nã liªn quan ®Õn kiÓu h×nh ®−îc quan t©m ?
Xem gîi ý tr¶ lêi ë Phô lôc A.
KiÓm tra kh¸i niÖm
®iÒu g× NÕu
Ch−¬ng 21 C¸c hÖ gen vµ sù tiÕn hãa cña chóng 433
do cã tõ 1500 ®Õn 7500 gen, trong khi sè gen ë c¸c sinh vËt nh©n thËt dao ®éng tõ kho¶ng 5000 gen ë c¸c nÊm ®¬n bµo cho ®Õn Ýt nhÊt 40.000 gen ë mét sè loµi sinh vËt nh©n thËt ®a bµo (xem B¶ng 21.1). Trong ph¹m vi c¸c loµi sinh vËt nh©n thËt, sè gen ë mçi loµi
th−êng thÊp h¬n sè gen ®−îc dù ®o¸n ®¬n thuÇn trªn c¬ së kÝch cì hÖ gen cña chóng. Nh×n vµo B¶ng 21.1, b¹n cã thÓ thÊy hÖ gen giun trßn C. elegans cã kÝch cì lµ 100 Mb vµ chøa kho¶ng 20.000 gen. Trong khi ®ã, hÖ gen Drosophila cã kÝch c¬ gÇn gÊp ®«i (180 Mb), song chØ cã sè gen b»ng kho¶ng hai phÇn ba - tøc lµ, chØ cã 13.700 gen. H·y xem mét vÝ dô kh¸c gÇn gòi h¬n, chóng ta ®Ó ý thÊy hÖ
gen ng−êi chøa 3200 Mb, tøc lµ lín h¬n kho¶ng trªn 10 lÇn so víi c¸c hÖ gen Drosophila vµ C. elegans. Khi Dù ¸n HÖ gen Ng−êi khëi ®éng, trªn c¬ së sè protein ®· biÕt, c¸c nhµ sinh häc mong ®îi sÏ cã kho¶ng tõ 50.000 ®Õn 100.000 gen sÏ ®−îc x¸c ®Þnh sau khi hoµn thµnh viÖc gi¶i tr×nh tù hÖ gen. Däc theo tiÕn tr×nh triÓn khai dù ¸n, sè gen −íc l−îng cã trong hÖ gen ng−êi ®−îc söa ®æi nhiÒu lÇn theo xu h−íng gi¶m dÇn; vµ ®Õn n¨m 2007, sè gen −íc l−îng ®−îc tin cËy h¬n c¶ dõng ë con sè 20.488 gen. Sè l−îng gen t−¬ng ®èi thÊp nµy, chØ gÇn gièng sè gen cã ë loµi giun trßn C. elegans, ®· g©y söng sèt nhiÒu nhµ sinh häc vèn ®· lu«n mong ®îi hÖ gen ng−êi cã nhiÒu gen h¬n. Thuéc tÝnh di truyÒn nµo ®· cho phÐp loµi ng−êi (vµ nhiÒu
loµi ®éng vËt cã x−¬ng sèng kh¸c) tiÕn hãa mµ kh«ng cÇn nhiÒu gen h¬n so víi giun trßn? Mét yÕu tè quan träng ®ã lµ c¸c tr×nh tù m· hãa trong c¸c hÖ gen ®éng vËt cã x−¬ng sèng cã ®Æc ®iÓm “mét vèn bèn lêi” do chóng cã nhiÒu c¸ch c¾t - nèi c¸c b¶n phiªn m· kh¸c nhau. Chóng ta nhí l¹i r»ng qu¸ tr×nh nµy cã thÓ t¹o ra nhiÒu h¬n mét lo¹i protein biÓu hiÖn chøc
n¨ng xuÊt ph¸t tõ mét gen duy nhÊt (xem H×nh 18.11). VÝ dô nh−, hÇu hÕt c¸c gen ë ng−êi ®Òu chøa nhiÒu exon, vµ −íc l−îng cã kho¶ng 75% sè gen gåm nhiÒu exon nµy ®−îc c¾t - nèi Ýt nhÊt b»ng hai c¸ch kh¸c nhau. NÕu chóng ta gi¶ thiÕt mçi gen khi ®−îc c¾t nèi theo c¸c c¸ch kh¸c nhau trung b×nh x¸c ®Þnh 3 chuçi polypeptit kh¸c nhau, th× tæng sè chuçi polypeptit kh¸c nhau ë ng−êi sÏ ®¹t con sè kho¶ng 75.000. Sù ®a d¹ng cña c¸c chuçi polypeptit thùc tÕ cßn bæ sung thªm bëi c¸c biÕn ®æi sau dÞch m·, ch¼ng h¹n bëi sù c¾t tØa c¸c axit amin hay g¾n thªm c¸c gèc cacbohydrat diÔn ra kh¸c nhau ë c¸c tÕ bµo kh¸c nhau hoÆc ë c¸c giai ®o¹n kh¸c nhau cña qu¸ tr×nh ph¸t triÓn.
MËt ®é gen vµ c¸c tr×nh tù ADN kh«ng m· hãa Bªn c¹nh kÝch cì hÖ gen vµ sè gen, chóng ta còng cã thÓ so s¸nh mËt ®é gen ë nh÷ng loµi kh¸c nhau, nghÜa lµ cã bao nhiªu gen trªn mét ®¬n vÞ chiÒu dµi cña ADN. Khi chóng ta so s¸nh hÖ gen gi÷a c¸c loµi vi khuÈn, vi khuÈn cæ vµ sinh vËt nh©n thËt, chóng ta thÊy sinh vËt nh©n thËt th−êng cã hÖ gen lín h¬n nh−ng l¹i cã sè gen Ýt h¬n trªn cïng mét sè nhÊt ®Þnh c¸c cÆp baz¬. Ng−êi cã kÝch cì hÖ gen lín h¬n hµng tr¨m thËm chÝ hµng ngh×n lÇn so víi hÖ gen cña phÇn lín c¸c loµi vi khuÈn, nh−ng nh− chóng ta ®· nãi, ng−êi chØ cã sè gen gÊp tõ 5 ®Õn 15 lÇn so víi nh÷ng loµi nµy; nh− vËy, mËt ®é gen ë ng−êi lµ thÊp h¬n (xem B¶ng 21.1). Ngay c¶ c¸c loµi sinh vËt nh©n thËt ®¬n bµo, nh− nÊm men, còng cã Ýt gen h¬n trong mçi mét triÖu cÆp baz¬ so víi c¸c loµi vi khuÈn vµ vi khuÈn cæ. Trong sè c¸c hÖ gen ®· ®−îc gi¶i tr×nh tù hoµn toµn ®Õn nay, ng−êi vµ c¸c loµi thó cã mËt ®é gen thÊp nhÊt.
Trong tÊt c¶ c¸c hÖ gen vi khuÈn ®· ®−îc nghiªn cøu ®Õn nay, phÇn lín ADN chøa c¸c gen m· hãa cho protein, tARN hoÆc rARN; mét l−îng nhá cña c¸c tr×nh tù ADN cßn l¹i gåm chñ yÕu lµ c¸c tr×nh tù ®iÒu hßa kh«ng ®−îc phiªn m·, ch¼ng h¹n nh− c¸c tr×nh tù khëi ®Çu phiªn m· (promoter). Tr×nh tù c¸c nucleotit däc theo mét gen m· hãa protein ë vi khuÈn th−êng kh«ng bÞ ng¾t qu·ng tõ vÞ trÝ b¾t ®Çu cho ®Õn vÞ trÝ kÕt thóc bëi c¸c tr×nh tù kh«ng m· hãa (intron). Ng−îc l¹i, ë c¸c hÖ gen sinh vËt nh©n thËt, phÇn lín ADN hoÆc kh«ng ®−îc dïng ®Ó m· hãa cho protein hoÆc kh«ng ®−îc phiªn m· thµnh c¸c ph©n tö ARN biÓu hiÖn chøc n¨ng (nh− tARN ch¼ng h¹n), ®ång thêi ADN chøa nhiÒu tr×nh tù ®iÒu hßa phøc t¹p. Trong thùc tÕ, hÖ gen ng−êi chøa ADN kh«ng m· hãa nhiÒu h¬n kho¶ng 10.000 lÇn so víi hÖ gen vi khuÈn. Mét sè tr×nh tù ADN kh«ng m· hãa nµy ë sinh vËt nh©n thËt ®a bµo xuÊt hiÖn trong c¸c intron cña c¸c gen. Thùc tiÔn cho thÊy c¸c intron lµ nh©n tè chÝnh dÉn ®Õn phÇn lín c¸c kh¸c biÖt vÒ chiÒu dµi trung b×nh gi÷a c¸c gen cña ng−êi (27.000 bp) so víi c¸c gen cña vi khuÈn (1000 bp).
B¶ng 21.1 KÝch cì hÖ gen vµ sè gen −íc tÝnh*
Loµi KÝch cì hÖ gen ®¬n béi (Mb)
Sè gen
Sè gen / Mb
Vi khuÈn
Haemophilus influenzae 1,8 1700 940
Escherichia coli 4,6 4400 950
Vi khuÈn cæ
Archaeoglobus fulgidus 2,2 2500 1130
Methanosarcina barkeri 4,8 3600 750
Sinh vËt nh©n thËt
Saccharomyces cerevisiae (nÊm men) 13 6200 480
Caenorhabditis elegans (giun trßn) 100 20.000 200
Arabidopsis thaliana (c©y thuéc hä mï t¹t) 118 25.500 215
Drosophila melanogaster (ruåi giÊm) 180 13.700 76
Oryza sativa (lóa g¹o) 390 40.000 140
Danio rerio (c¸ ngùa) 1700 23.000 13
Mus musculus (chuét nhµ) 2600 22.000 11
Homo sapiens (ng−êi) 3200 20.500 7
Fritillaria assyriaca (c©y thuéc hä lily) 120.000 ND ND
* Mét sè sè liÖu trªn ®©y cã thÓ sÏ ®−îc chØnh lý sau nµy do c¸c ph©n tÝch hÖ gen vÉn ®ang tiÕp tôc tiÕn hµnh. Mb = 1 triÖu cÆp baz¬ (bp). ND = ch−a x¸c ®Þnh.
434 khèi kiÕn thøc 3 Di truyÒn häc
Bªn c¹nh c¸c intron, c¸c sinh vËt nh©n thËt ®a bµo chøa mét l−îng lín ADN kh«ng m· hãa ë gi÷a c¸c gen. Trong môc tiÕp theo, chóng ta sÏ m« t¶ thµnh phÇn vµ c¸ch s¾p xÕp c¸c chuçi tr×nh tù lín cña ADN nh− vËy trong hÖ gen ng−êi.
§Õn ®©y, cã thÓ nãi chóng ta ®· dïng phÇn lín dung l−îng cña ch−¬ng nµy, mµ thùc tÕ lµ cña c¶ khèi kiÕn thøc nµy, ®Ó tËp trung nãi vÒ c¸c gen m· hãa protein. Nh−ng trong thùc tÕ, c¸c vïng m· hãa cña nh÷ng gen nµy vµ c¸c gen m· hãa cho c¸c s¶n phÈm ARN nh− rARN, tARN vµ tiÓu-ARN (miARN hay microARN) chØ chiÕm mét tØ lÖ nhá trong hÖ gen cña phÇn lín c¸c sinh vËt nh©n thËt ®a bµo. Mét phÇn lín hÖ gen cña hÇu hÕt sinh vËt nh©n thËt lµ c¸c tr×nh tù ADN hoÆc kh«ng m· hãa cho protein hoÆc kh«ng ®−îc phiªn m· ®Ó t¹o nªn c¸c lo¹i ARN cã chøc n¨ng ®· biÕt; nh÷ng tr×nh tù ADN kh«ng m· hãa nµy tr−íc kia th−êng ®−îc m« t¶ nh− c¸c “ADN d− thõa”. Tuy vËy, ngµy cµng cã nhiÒu b»ng chøng cho thÊy nh÷ng tr×nh tù ADN nµy gi÷ vai trß quan träng trong ho¹t ®éng sèng cña tÕ bµo; ý t−ëng nµy ®ång thêi ®−îc cñng cè bëi sù tån t¹i mét c¸ch “bÒn v÷ng” qua hµng tr¨m thÕ hÖ cña nh÷ng tr×nh tù nµy ë nhiÒu hÖ gen kh¸c nhau. Ch¼ng h¹n, khi so s¸nh hÖ gen gi÷a ng−êi víi chuét ®ång vµ chuét nhµ, c¸c nhµ nghiªn cøu t×m thÊy cã ®Õn 500 vïng ADN kh«ng m· hãa trong hÖ gen gièng hÖt nhau ë c¶ ba loµi. ë nh÷ng loµi nµy, møc ®é b¶o thñ cña nh÷ng tr×nh tù nµy thËm chÝ cßn cao h¬n so víi c¸c vïng m· hãa protein; ®iÒu nµy ñng hé m¹nh mÏ cho gi¶ thiÕt c¸c vïng kh«ng m· hãa cã nh÷ng chøc n¨ng quan träng. Trong môc nµy chóng ta sÏ t×m hiÓu c¸c gen vµ c¸c tr×nh tù ADN kh«ng m· hãa ®−îc tæ chøc nh− thÕ nµo trong hÖ gen cña c¸c sinh vËt nh©n thËt, víi vÝ dô chñ yÕu chÝnh lµ hÖ gen ng−êi cña chóng ta. C¸ch tæ chøc cña
hÖ gen cho chóng ta biÕt con ®−êng mµ c¸c hÖ gen ®· vµ ®ang tiÕp tôc tiÕn hãa; ®©y còng lµ néi dung ®−îc ®Ò cËp tiÕp theo. Khi hÖ gen ng−êi ®· ®−îc gi¶i tr×nh tù hoµn toµn, mét sù
thËt ®−îc béc lé râ rµng lµ chØ cã 1,5% tr×nh tù nucleotit trong hÖ gen ®−îc dïng hoÆc ®Ó m· hãa cho c¸c protein hoÆc ®−îc phiªn m· thµnh c¸c ph©n tö rARN vµ tARN. H×nh 21.7 cho thÊy thµnh phÇn cÊu tróc nªn 98,5% tr×nh tù cßn l¹i cña hÖ gen ng−êi. C¸c tr×nh tù ®iÒu hßa liªn quan ®Õn c¸c gen vµ c¸c tr×nh tù intron chiÕm 24% hÖ gen ng−êi; phÇn cßn l¹i, n»m gi÷a c¸c gen biÓu hiÖn chøc n¨ng (c¸c tr×nh tù liªn gen), gåm c¸c tr×nh tù kh«ng m· hãa ®¬n nhÊt, ch¼ng h¹n nh− c¸c ph©n ®o¹n cña gen vµ c¸c gen gi¶, tøc lµ c¸c gen cò vèn tõng tån t¹i nh−ng sau ®ã do tÝch lòy c¸c ®ét biÕn ®· trë nªn mÊt chøc n¨ng. Tuy vËy, phÇn lín c¸c tr×nh tù ADN liªn gen lµ nh÷ng tr×nh tù ADN lÆp l¹i, tøc lµ c¸c tr×nh tù cã mÆt víi nhiÒu b¶n sao trong hÖ gen. §iÒu ®¸ng ng¹c nhiªn lµ ba phÇn t− cña c¸c tr×nh tù ADN lÆp l¹i nµy (t−¬ng øng víi 44% cña toµn bé hÖ gen ng−êi) t¹o nªn c¸c ®¬n vÞ ®−îc gäi lµ c¸c yÕu tè di truyÒn vËn ®éng hoÆc c¸c tr×nh tù cã liªn quan ®Õn chóng.
21.4 Kh¸i niÖm
Sinh vËt nh©n thËt ®a bµo cã nhiÒu ADN kh«ng m� hãa vµ nhiÒu hä ®a gen
21.3
1. Theo c¸c sè liÖu −íc tÝnh hiÖn nay, hÖ gen ng−êi chøa kho¶ng 20.500 gen. Tuy vËy, cã b»ng chøng cho thÊy c¸c tÕ bµo ng−êi cã thÓ s¶n sinh nhiÒu h¬n 20.500 lo¹i chuçi polypeptide kh¸c nhau. Nh÷ng qu¸ tr×nh nµo cã thÓ gióp gi¶i thÝch cho sù “kh«ng nhÊt qu¸n” nµy?
2. Sè hÖ gen ®−îc gi¶i tr×nh tù ®ang tiÕp tôc t¨ng lªn ®Òu ®Æn. H·y sö dông trang web www.genomesonline.org ®Ó t×m sè hÖ gen hiÖn t¹i thuéc c¸c liªn giíi kh¸c nhau ®· ®−îc gi¶i tr×nh tù hoµn toµn, còng nh− sè hÖ gen ®ang tiÕp tôc ®−îc gi¶i tr×nh tù (gîi ý: H·y dïng chuét nh¸y kÐp vµo khÈu lÖnh “GOLD tables” råi sau ®ã nh¸y kÐp vµo “Published Complete Genomes” ®Ó cã thªm th«ng tin.)
3. C¸c qu¸ tr×nh tiÕn hãa nµo cã thÓ gi¶i thÝch cho viÖc c¸c sinh vËt nh©n s¬ cã hÖ gen nhá h¬n so víi c¸c sinh vËt nh©n thËt ?
Xem gîi ý tr¶ lêi ë Phô lôc A.
KiÓm tra kh¸i niÖm
®iÒu g× NÕu
� H×nh 21.7 C¸c lo¹i tr×nh tù ADN trong hÖ gen ng−êi.C¸c tr×nh tù gen m· hãa cho protein hoÆc ®−îc phiªn m· thµnh c¸c ph©n tö rARN hay tARN chØ chiÕm kho¶ng 1,5% hÖ gen ng−êi (mµu tÝa sÉm trªn biÓu ®å táa trßn), trong khi c¸c tr×nh tù ®iÒu hßa vµ c¸c intron liªn quan ®Õn c¸c gen (mµu tÝa nh¹t) chiÕm kho¶ng 1/4 hÖ gen. PhÇn lín h¬n c¶ cña hÖ gen ng−êi lµ nh÷ng tr×nh tù kh«ng m· hãa cho protein vµ còng kh«ng ®−îc dïng ®Ó t¹o ra c¸c lo¹i ARN ®· biÕt, mµ phÇn nhiÒu trong nh÷ng tr×nh tù nµy lµ c¸c ADN lÆp l¹i (mµu xanh lôc sÉm vµ nh¹t). Do ADN lÆp l¹i lµ nh÷ng tr×nh tù khã ph©n tÝch vµ khã gi¶i tr×nh tù h¬n c¶, nªn sù ph©n lo¹i cña mét phÇn nh÷ng tr×nh tù nµy ë trªn chØ cã tÝnh −íc ®o¸n, vµ c¸c tØ lÖ phÇn tr¨m ®−îc nªu cã thÓ sÏ thay ®æi ®«i chót khi c¸c nghiªn cøu ph©n tÝch hÖ gen vÉn ®ang tiÕp diÔn. Nh÷ng gen m· hãa c¸c miARN míi ®−îc t×m thÊy gÇn ®©y thuéc c¸c vïng ADN kh«ng m· hãa ®¬n nhÊt (tøc lµ kh«ng lÆp l¹i) vµ trong c¸c intron; nghÜa lµ, chóng thuéc hai vïng cña ®å thÞ táa trßn trªn ®©y.
C¸c exon (c¸c vïng gen m· hãa cho protein hoÆc ®−îc phiªn m· thµnh rARN vµ tARN) (1,5%)
Intron vµ c¸c tr×nh tù ®iÒu hßa liªn quan ®Õn c¸c gen (24%)
C¸c tr×nh tù ADN kh«ng m· hãa ®¬n nhÊt (15%)
ADN lÆp l¹i kh«ng liªn quan ®Õn c¸c yÕu tè vËn ®éng (15%)
ADN lÆp l¹i bao gåm c¸c yÕu tè vËn ®éng vµ c¸c tr×nh tù liªn quan ®Õn chóng (44%)
C¸c ®o¹n lÆp kÝch th−íc lín (5 - 6%) ADN tr×nh tù ®¬n gi¶n (3%)
C¸c yÕu tè Alu (3%)
C¸c tr×nh tù L1 (17%)
Ch−¬ng 21 C¸c hÖ gen vµ sù tiÕn hãa cña chóng 435
C¸c yÕu tè di truyÒn vËn ®éng vµ c¸c tr×nh tù cã liªn quan ®Õn chóng C¶ sinh vËt nh©n s¬ còng nh− sinh vËt nh©n thËt ®Òu cã trong hÖ gen nh÷ng ®o¹n tr×nh tù ADN cã thÓ di chuyÓn tõ vÞ trÝ nµy sang vÞ trÝ kh¸c trong hÖ gen. Nh÷ng ®o¹n tr×nh tù ADN nh− vËy ®−îc gäi lµ c¸c yÕu tè di truyÒn vËn ®éng, hay ®−îc gäi t¾t lµ c¸c yÕu tè vËn ®éng. Trong qu¸ tr×nh ®−îc gäi lµ vËn ®éng, mét yÕu tè vËn ®éng sÏ di chuyÓn tõ mét vÞ trÝ trªn ADN trong tÕ bµo tíi mét vÞ trÝ ®Ých kh¸c nhê mét qu¸ tr×nh t¸i tæ hîp. §«i khi c¸c yÕu tè vËn ®éng ®−îc gäi lµ c¸c “gen nh¶y”, nh−ng thuËt ng÷ nµy thùc tÕ dÔ g©y hiÓu nhÇm bëi trong thùc tÕ nh÷ng ®o¹n tr×nh tù ADN vËn ®éng kh«ng bao giê rêi khái ADN cña tÕ bµo. (C¸c vÞ trÝ gèc vµ vÞ trÝ ®Ých míi cña c¸c yÕu tè vËn ®éng ®−îc ®−a ®Õn gÇn nhau bëi c¬ chÕ “bÎ cong” ADN.) B»ng chøng ®Çu tiªn vÒ c¸c ph©n ®o¹n ADN cã thÓ di
chuyÓn ®−îc ph¸t hiÖn tõ c¸c thÝ nghiÖm lai gièng ë c©y ng« ®−îc nhµ n÷ di truyÒn häc ng−êi Mü lµ Barbara McClintock tiÕn hµnh vµo nh÷ng n¨m 1940 vµ 1950 (H×nh 21.8). Khi theo dâi c¸c c©y ng« qua nhiÒu thÕ hÖ, McClintock x¸c ®Þnh ®−îc sù thay ®æi mµu néi nhò cña c¸c h¹t ng« chØ cã thÓ gi¶i thÝch ®−îc nÕu nh− cã sù tån t¹i cña c¸c yÕu tè di truyÒn cã thÓ vËn ®éng tõ nh÷ng vÞ trÝ kh¸c trong hÖ gen vµo trong c¸c gen qui ®Þnh tÝnh tr¹ng mµu néi nhò, lµm “ph¸ vì” nh÷ng gen nµy vµ dÉn ®Õn hiÖn t−îng mµu néi nhò thay ®æi. Ph¸t hiÖn cña McClintock ban ®Çu ®−îc ®ãn nhËn b»ng nhiÒu “hoµi nghi” vµ thËm chÝ bÞ ph¶n ®èi. Ph¶i mÊt nhiÒu n¨m sau ®ã, c«ng tr×nh nghiªn cøu kú c«ng cïng nh÷ng ý t−ëng s©u s¾c cña McClintock vÒ c¸c yÕu tè vËn ®éng míi ®−îc x¸c nhËn bëi c¸c nhµ di truyÒn häc vi khuÈn vµ vi sinh vËt khi hä t×m ra c¬ së ph©n tö cña qu¸ tr×nh vËn ®éng cña nh÷ng yÕu tè nµy.
Sù vËn ®éng cña c¸c transposon vµ retrotransposon C¸c sinh vËt nh©n thËt cã hai lo¹i yÕu tè vËn ®éng. Lo¹i thø nhÊt ®−îc gäi lµ c¸c transposon; lo¹i yÕu tè nµy vËn ®éng
trong hÖ gen th«ng qua mét ADN trung gian. C¸c transposon cã thÓ vËn ®éng hoÆc bëi c¬ chÕ “c¾t - d¸n” vµ chóng ®−îc chuyÓn dêi khái vÞ trÝ gèc, hoÆc bëi c¬ chÕ “sao chÐp - d¸n” vµ chóng ®Ó l¹i mét b¶n sao t¹i vÞ trÝ gèc (H×nh 21.9a). PhÇn lín c¸c yÕu tè vËn ®éng trong hÖ gen sinh vËt nh©n
thËt thuéc lo¹i thø hai, ®−îc gäi lµ c¸c retrotransposon; lo¹i yÕu tè nµy vËn ®éng trong hÖ gen th«ng qua mét ARN trung gian; ®©y lµ b¶n phiªn m· cña chÝnh ADN retrostransposon. C¸c retrotransposon lu«n ®Ó l¹i mét b¶n sao t¹i vÞ trÝ ®Ých trong qu¸ tr×nh vËn ®éng, do chóng ®−îc phiªn m· thµnh ARN trung gian (H×nh 21.9b). Tr−íc khi cµi vµo vÞ trÝ ®Ých, ph©n tö ARN trung gian ®−îc phiªn m· ng−îc trë l¹i thµnh ADN bëi enzym phiªn m· ng−îc - reverse transcriptase - do chÝnh retrotransposon m· hãa. §iÒu nµy cã nghÜa lµ enzym phiªn m· ng−îc cã thÓ cã mÆt trong c¸c tÕ bµo mµ chóng kh«ng nhÊt thiÕt ph¶i bÞ l©y nhiÔm bëi retrovirut. (Trong thùc tÕ, c¸c retrovirut, nh− ®· ®−îc ®Ò cËp ë Ch−¬ng 19, cã thÓ ®· tiÕn hãa b¾t nguån tõ chÝnh c¸c retrotransposon.) Ho¹t ®éng cµi tr×nh tù ADN ®−îc phiªn m· ng−îc vµo vÞ trÝ míi ®−îc xóc t¸c bëi enzym trong tÕ bµo.
� H×nh 21.8 ¶nh h−ëng cña c¸c yÕu tè vËn ®éng ®Õn mµu h¹t ng«. Barbara McClintock lµ ng−êi ®Çu tiªn ®−a ra ý t−ëng vÒ nh÷ng yÕu tè di truyÒn cã kh¶ n¨ng vËn ®éng khi quan s¸t hiÖn t−îng cã nhiÒu ®èm mµu kh¸c nhau trong nh©n cña c¸c h¹t ng«. Tuy ban ®Çu ý t−ëng cña bµ vµo nh÷ng n¨m 1940 ®−îc ®ãn nhËn bëi nh÷ng mèi hoµi nghi, nh−ng sau nµy ®· ®−îc kiÓm chøng lµ hoµn toµn x¸c thùc. Bµ ®−îc nhËn gi¶i Nobel n¨m 1983 khi ë tuæi 81 nhê c«ng tr×nh mang tÝnh tiªn phong cña m×nh.
� H×nh 21.9 Sù di chuyÓn cña c¸c yÕu tè vËn ®éng ë sinh vËt nh©n thËt. (a) Sù di chuyÓn cña c¸c transposon hoÆc theo c¬ chÕ “c¾t - d¸n” hoÆc theo c¬ chÕ “sao chÐp - d¸n” (®−îc minh häa ë ®©y) liªn quan ®Õn mét ph©n tö ADN sîi kÐp trung gian sau ®ã ®−îc cµi vµo hÖ gen. (b) Sù di chuyÓn cña c¸c retrotransposon b¾t ®Çu b»ng sù h×nh thµnh mét ph©n tö ARN m¹ch ®¬n trung gian. C¸c b−íc cßn l¹i vÒ b¶n chÊt gièng víi mét phÇn chu kú sinh s¶n cña retrovirut (xem H×nh 19.8). Trong kiÓu di chuyÓn cña c¸c transposon theo kiÓu “sao chÐp - d¸n” vµ kiÓu di chuyÓn cña retrotransposon, tr×nh tù ADN võa ®−îc duy tr× ë vÞ trÝ gèc võa xuÊt hiÖn ë vÞ trÝ míi.
PhÇn (a) ë trªn sÏ kh¸c nh− thÕ nµo nÕu c¬ chÕ ®−îc minh häa ë ®©y lµ c¬ chÕ di chuyÓn kiÓu “c¾t - d¸n” ?
Transposon
ADN hÖ gen
Transposon ®−îc sao chÐp
Transposon vËn ®éng
Cµi vµo hÖ gen
B¶n sao míi cña transposon
(a) Sù di chuyÓn cña transposon (c¬ chÕ kiÓu “sao chÐp - d¸n”)
Retrotransposon
ARN
Reverse transcriptase
Cµi vµo hÖ gen
B¶n sao míi cña retrotransposon
(b) Sù di chuyÓn cña retrotransposon
436 khèi kiÕn thøc 3 Di truyÒn häc
C¸c tr×nh tù liªn quan ®Õn c¸c yÕu tè vËn ®éng ë sinh vËt nh©n thËt, nhiÒu b¶n sao cña c¸c yÕu tè vËn ®éng vµ c¸c tr×nh tù liªn quan ®Õn chóng n»m r¶i r¸c kh¾p hÖ gen. Mçi ®¬n vÞ riªng lÎ cña yÕu tè vËn ®éng th−êng dµi tõ vµi tr¨m ®Õn vµi ngh×n cÆp baz¬, vµ c¸c "b¶n sao" n»m ph©n t¸n th−êng gièng nhau, nh−ng kh«ng gièng hÖt nhau. Mét sè yÕu tè vËn ®éng nh− vËy cã kh¶ n¨ng vËn ®éng; c¸c enzym cÇn thiÕt cho sù vËn ®éng cña nã cã thÓ ®−îc m· hãa bëi mét yÕu tè vËn ®éng bÊt kú, bao gåm c¶ chÝnh yÕu tè vËn ®éng ®ang ho¹t ®éng. Nh÷ng tr×nh tù kh¸c lµ nh÷ng tr×nh tù cã liªn quan nh−ng ®· mÊt hoµn toµn kh¶ n¨ng vËn ®éng. C¸c yÕu tè vËn ®éng vµ c¸c tr×nh tù cã liªn quan chiÕm kho¶ng 25% - 50% hÖ gen ë phÇn lín ®éng vËt cã vó (xem H×nh 21.7); tØ lÖ nµy thËm chÝ cßn cao h¬n ë c¸c loµi l−ìng c− vµ nhiÒu loµi thùc vËt.
ë ng−êi vµ nhiÒu loµi linh tr−ëng kh¸c, mét tØ lÖ lín c¸c tr×nh tù ADN liªn quan ®Õn c¸c yÕu tè vËn ®éng bao gåm mét hä c¸c tr×nh tù gièng nhau ®−îc gäi lµ c¸c yÕu tè Alu. Riªng nh÷ng tr×nh tù nµy ®· chiÕm kho¶ng 10% hÖ gen ng−êi. C¸c yÕu tè Alu cã chiÒu dµi kho¶ng 300 nucleotit, tøc lµ ng¾n h¬n nhiÒu so víi phÇn lín c¸c yÕu tè vËn ®éng cßn ho¹t ®éng kh¸c, vµ chóng kh«ng m· hãa cho bÊt cø protein nµo. Tuy vËy, nhiÒu yÕu tè Alu ®−îc phiªn m· thµnh ARN; chøc n¨ng trong tÕ bµo cña chóng (nÕu cã) ®Õn nay ch−a râ. Mét tØ lÖ lín h¬n (17%) cña hÖ gen ng−êi lµ mét lo¹i
retrotransposon kh¸c, ®−îc gäi lµ c¸c yÕu tè LINE-1 hay L1. Nh÷ng yÕu tè nµy dµi h¬n nhiÒu so víi c¸c yÕu tè Alu (kho¶ng 6500 bp) vµ cã tØ lÖ vËn ®éng thÊp. T¹i sao tØ lÖ vËn ®éng cña c¸c yÕu tè lo¹i nµy l¹i thÊp? C¸c nghiªn cøu gÇn ®©y ph¸t hiÖn ra r»ng trong c¸c yÕu tè L1 cã c¸c tr×nh tù ng¨n c¶n ho¹t ®éng cña ARN polymerase vèn cÇn thiÕt cho sù vËn ®éng. Mét nghiªn cøu bæ sung t×m thÊy c¸c tr×nh tù L1 cã trong intron cña kho¶ng 80% sè gen ng−êi ®−îc ®em ph©n tÝch, ®iÒu nµy cho thÊy cã kh¶ n¨ng L1 gióp ®iÒu hßa biÓu hiÖn gen. Mét sè nhµ nghiªn cøu kh¸c cho r»ng: c¸c retrotransposon L1 cã thÓ cã hiÖu qu¶ biÖt hãa qua ®iÒu hßa biÓu hiÖn gen dÉn ®Õn sù ph¸t triÓn c¸c lo¹i n¬ron, gãp phÇn t¹o nªn sù ®a d¹ng cña c¸c lo¹i tÕ bµo n¬ron (xem Ch−¬ng 48). MÆc dï cã nhiÒu yÕu tè vËn ®éng m· hãa cho c¸c protein,
nh−ng nh÷ng protein nµy kh«ng thùc hiÖn nh÷ng chøc n¨ng tÕ bµo b×nh th−êng. Do vËy, c¸c yÕu tè vËn ®éng th−êng ®−îc qui vµo nhãm ADN “kh«ng m· hãa”, cïng víi c¸c tr×nh tù lÆp l¹i dµi kh¸c cã trong hÖ gen.
C¸c tr×nh tù ADN lÆp l¹i kh¸c, bao gåm c¶ c¸c ADN tr×nh tù ®¬n gi¶n C¸c tr×nh tù ADN lÆp l¹i vèn kh«ng liªn quan ®Õn c¸c yÕu tè vËn ®éng cã vÎ xuÊt hiÖn do c¸c sai sãt trong c¸c qu¸ tr×nh sao chÐp hoÆc t¸i tæ hîp cña ADN. Nh÷ng tr×nh tù ADN nh− vËy chiÕm kho¶ng 15% hÖ gen ng−êi (xem H×nh 21.7). Kho¶ng mét phÇn ba trong sè nµy (tøc lµ kho¶ng 5 - 6% hÖ gen ng−êi) lµ nh÷ng ®o¹n ADN dµi lÆp l¹i hai lÇn víi mçi ®¬n vÞ lÆp l¹i dµi tõ 10.000 ®Õn 30.000 cÆp baz¬. C¸c ®o¹n ADN dµi nh− vËy d−êng nh− ®· ®−îc sao chÐp tõ vÞ trÝ nµy sang vÞ trÝ kh¸c thuéc cïng mét nhiÔm s¾c thÓ hoÆc thuéc hai nhiÔm s¾c thÓ kh¸c nhau.
Kh«ng gièng nh− c¸c b¶n sao cña c¸c tr×nh tù ADN dµi ph©n t¸n kh¾p hÖ gen, c¸c ADN tr×nh tù ®¬n gi¶n th−êng gåm nhiÒu b¶n sao cña c¸c ®o¹n tr×nh tù ng¾n lÆp l¹i liªn tiÕp nh− vÝ dô ®−îc minh häa d−íi ®©y (ë ®©y, chØ minh häa mét m¹ch):
…GTTACGTTACGTTACGTTACGTTACGTTAC… Trong tr−êng hîp nµy, ®¬n vÞ lÆp l¹i (GTTAC) gåm 5 nucleotit. Trong thùc tÕ, c¸c ®¬n vÞ lÆp l¹i nh− vËy cã thÓ dµi ®Õn 500 nucleotit, nh−ng th−êng th× ng¾n h¬n 15 nucleotit nh− vÝ dô trªn ®©y. Khi ®¬n vÞ lÆp l¹i chØ chøa tõ 2 ®Õn 5 nucleotit, th× ®o¹n tr×nh tù lÆp l¹i liªn tiÕp nh− vËy ®−îc gäi lµ tr×nh tù ng¾n lÆp l¹i liªn tiÕp, hay cßn gäi lµ STR (short tandem repeats). Chóng ta ®· nãi vÒ viÖc sö dông chØ thÞ STR trong x©y dùng tµng th− di truyÒn ë Ch−¬ng 20. Sè b¶n sao cña cïng mét ®¬n vÞ lÆp l¹i cã thÓ kh¸c nhau ë nh÷ng vÞ trÝ kh¸c nhau trong hÖ gen. Ch¼ng h¹n nh−, ®¬n vÞ lÆp l¹i GTTAC cã thÓ xuÊt hiÖn liªn tiÕp hµng tr¨m ngh×n lÇn t¹i mét vÞ trÝ trong hÖ gen; nh−ng ë mét vÞ trÝ kh¸c, sè lÇn lÆp l¹i cña ®¬n vÞ nµy chØ b»ng mét nöa. Sè lÇn lÆp l¹i còng rÊt kh¸c nhau gi÷a ng−êi nµy víi ng−êi kh¸c, t¹o nªn sù kh¸c biÖt trong tµng th− di truyÒn cña mçi c¸ nh©n trªn c¬ së ph©n tÝch c¸c tr×nh tù STR. TÝnh tæng céng, c¸c ADN tr×nh tù ®¬n gi¶n chiÕm kho¶ng 3% hÖ gen ng−êi. Thµnh phÇn nucleotit cña c¸c ®o¹n ADN tr×nh tù ®¬n gi¶n
kh¸c biÖt víi thµnh phÇn cña c¸c ®o¹n tr×nh tù ADN kh¸c trong hÖ gen ®Õn møc chóng t¹o nªn sù kh¸c biÖt vÒ tØ träng. NÕu ADN hÖ gen ®−îc c¾t thµnh c¸c ph©n ®o¹n nhá, råi ®−îc ly t©m ë tèc ®é cao, th× c¸c ph©n ®o¹n ADN cã tØ träng kh¸c nhau sÏ “®Þnh vÞ” ë nh÷ng vÞ trÝ kh¸c nhau trong èng ly t©m. C¸c ®o¹n ADN lÆp l¹i vèn ban ®Çu ®−îc ph©n lËp theo c¸ch nµy ®−îc gäi lµ c¸c tr×nh tù ADN vÖ tinh bëi v× c¸c b¨ng ly t©m cña chóng t¸ch biÖt khái phÇn b¨ng ly t©m chung gåm c¸c tr×nh tù ADN cßn l¹i cña hÖ gen gièng nh− mét “vÖ tinh”. ThuËt ng÷ “ADN vÖ tinh” vµ ADN tr×nh tù ®¬n gi¶n hiÖn nay th−êng ®−îc dïng thay thÕ cho nhau. Mét l−îng lín ADN tr×nh tù ®¬n gi¶n cña hÖ gen tËp trung
ë c¸c ®Çu mót vµ t©m ®éng cña nhiÔm s¾c thÓ, cho thÊy nh÷ng tr×nh tù ADN nµy gi÷ vai trß cÊu tróc nhiÔm s¾c thÓ. C¸c tr×nh tù ADN t¹i t©m ®éng lµ thiÕt yÕu cho ho¹t ®éng ph©n ly cña c¸c nhiÔm s¾c tö trong qu¸ tr×nh ph©n bµo (xem Ch−¬ng 12). Tr×nh tù ADN t©m ®éng, cïng víi c¸c ADN tr×nh tù ®¬n gi¶n kh¸c, cã thÓ ®ãng vai trß tæ chøc chÊt nhiÔm s¾c trong nh©n t¹i kú trung gian cña chu tr×nh tÕ bµo. C¸c ADN tr×nh tù ®¬n gi¶n t¹i c¸c ®Çu mót nhiÔm s¾c thÓ gióp b¶o vÖ c¸c gen kh«ng bÞ mÊt do ADN ng¾n l¹i sau mçi lÇn sao chÐp (xem Ch−¬ng 16). ADN ®Çu mót ®ång thêi liªn kÕt víi c¸c protein gióp b¶o vÖ ®Çu mót nhiÔm s¾c thÓ khái bÞ biÕn tÝnh, ®ång thêi kh«ng bÞ dÝnh chËp víi c¸c nhiÔm s¾c thÓ kh¸c.
C¸c gen vµ c¸c hä ®a gen Chóng ta kÕt thóc bµn luËn vÒ c¸c lo¹i tr×nh tù ADN kh¸c nhau trong c¸c hÖ gen sinh vËt nh©n thËt b»ng viÖc nh×n gÇn c¸c gen h¬n. Chóng ta nhí l¹i r»ng tæng céng c¸c tr×nh tù ADN m· hãa hoÆc cho c¸c protein hoÆc cho c¸c lo¹i tARN vµ rARN chØ chiÕm cã 1,5% hÖ gen ng−êi (xem H×nh 21.7). NÕu chóng ta tÝnh c¶ c¸c tr×nh tù intron vµ c¸c tr×nh tù ®iÒu hßa liªn quan ®Õn gen, th× tæng céng tÊt c¶ c¸c tr×nh tù ADN cã liªn quan ®Õn gen (bao gåm c¶ nh÷ng ®o¹n m· hãa vµ kh«ng m· hãa) chiÕm
Ch−¬ng 21 C¸c hÖ gen vµ sù tiÕn hãa cña chóng 437
kho¶ng 25% hÖ gen ng−êi. Nãi c¸ch kh¸c, trung b×nh chØ cã kho¶ng 6% (tøc lµ 1,5% cña 25%) tr×nh tù ®Çy ®ñ cña mét gen cã mÆt trong s¶n phÈm cuèi cïng cña gen. Gièng víi c¸c gen cña vi khuÈn, nhiÒu gen ë sinh vËt nh©n
thËt lµ nh÷ng tr×nh tù ®¬n nhÊt vµ chØ cã mét b¶n sao duy nhÊt trong mçi bé nhiÔm s¾c thÓ ®¬n béi. Tuy vËy, trong hÖ gen ng−êi vµ hÖ gen cña nhiÒu ®éng vËt vµ thùc vËt kh¸c, nh÷ng gen “®¬n ®éc” nh− vËy chiÕm Ýt h¬n mét nöa tæng sè tr×nh tù ADN ®−îc phiªn m·. C¸c gen cßn l¹i xuÊt hiÖn thµnh c¸c hä ®a gen, tøc lµ tËp hîp cña hai hay nhiÒu gen gièng hÖt hoÆc rÊt gièng nhau. Trong c¸c hä ®a gen gåm c¸c tr×nh tù ADN gièng hÖt nhau,
c¸c tr×nh tù ADN lÆp l¹i liÒn kÒ nhau, vµ ngo¹i trõ c¸c gen m· hãa protein histone, chóng m· hãa cho s¶n phÈm cuèi cïng lµ ARN. Mét vÝ dô vÒ hä c¸c tr×nh tù ADN gièng hÖt nhau lµ côm c¸c gen m· hãa cho ba lo¹i ph©n tö rARN lín nhÊt (H×nh 21.10a). Nh÷ng ph©n tö rARN nµy ®−îc phiªn m· thµnh c¸c b¶n phiªn m· duy nhÊt gåm hµng tr¨m thËm chÝ hµng ngh×n lÇn lÆp l¹i kÕ tiÕp nhau vµ tËp hîp thµnh mét hoÆc mét sè côm trong hÖ gen sinh vËt nh©n thËt. Víi nhiÒu b¶n sao cïng cã mÆt trong mét ®¬n vÞ phiªn m· nh− vËy, tÕ bµo cã thÓ nhanh chãng
t¹o ra hµng triÖu ribosome cÇn cho qu¸ tr×nh tæng hîp protein. B¶n phiªn m· s¬ cÊp cña c¸c gen rARN sau ®ã ®−îc c¾t xÐn ®Ó h×nh thµnh nªn ba lo¹i ph©n tö rARN. Nh÷ng ph©n tö rARN nµy sau ®ã ®−îc kÕt hîp víi c¸c protein vµ mét lo¹i rARN kh¸c (rARN 5S) ®Ó t¹o nªn c¸c tiÓu phÇn ribosome. C¸c vÝ dô kinh ®iÓn vÒ c¸c hä ®a gen cã tr×nh tù kh«ng
gièng hÖt nhau gåm hai hä gen cã quan hÖ víi nhau m· hãa cho globin; ®©y lµ mét nhãm c¸c protein gåm c¸c tiÓu phÇn (chuçi polypeptit) α vµ β cña hemoglobin. Cã mét hä gen n»m trªn NST sè 16 ë ng−êi m· hãa cho c¸c d¹ng kh¸c nhau cña α-globin; mét hä gen cßn l¹i n»m trªn NST sè 11 m· hãa cho c¸c d¹ng kh¸c nhau cña β-globin (H×nh 21.10b). C¸c d¹ng kh¸c nhau cña mçi tiÓu phÇn globin ®−îc biÓu hiÖn vµo c¸c thêi ®iÓm kh¸c nhau cña qu¸ tr×nh ph¸t triÓn, qua ®ã gióp hemoglobin biÓu hiÖn chøc n¨ng hiÖu qu¶ trong c¸c ®iÒu kiÖn m«i tr−êng thay ®æi trong qu¸ tr×nh ph¸t triÓn ë ®éng vËt. Ch¼ng h¹n nh−, ë ng−êi, c¸c d¹ng hemoglobin cã trong ph«i vµ thai cã ¸i lùc víi oxy cao h¬n so víi d¹ng hemoglobin ë ng−êi tr−ëng thµnh; ®iÒu nµy gióp ®¶m b¶o hiÖu qu¶ vËn chuyÓn oxy tõ mÑ sang thai nhi. Trong c¸c côm hä gen m· hãa globin, ng−êi ta cßn t×m thÊy mét sè gen gi¶.
� H×nh 21.10 C¸c hä gen.
Trong phÇn (a) cña trªn h×nh, b»ng c¸ch nµo b¹n cã thÓ x¸c ®Þnh ®−îc chiÒu phiªn m·, nÕu nh− kh«ng cã mòi tªn mµu ®á?
Nh©n hem
Hä gen α-globin
ADN
Hä gen β-globin
NhiÔm s¾c thÓ sè 16 NhiÔm s¾c thÓ sè 11
Ph«i Thai vµ ng−êi tr−ëng thµnh Ph«i Thai Ng−êi tr−ëng
thµnh
§o¹n ®Öm kh«ng ®−îc phiªn m· §¬n vÞ phiªn m·
C¸c b¶n phiªn m· ARN
ADN
rARN
(a) Mét phÇn hä gen m� hãa ARN ribosom. Ba trong sè hµng tr¨m b¶n sao cña c¸c ®¬n vÞ phiªn m· rARN trong hÖ gen cña loµi kú gi«ng ®−îc minh häa ë phÇn trªn (¶nh TEM). Mçi mét “chiÕc l«ng” t−¬ng øng víi mét ®¬n vÞ phiªn m· víi kho¶ng 100 ph©n tö ®ang ®−îc tæng hîp bëi ARN polymerase (®iÓm mµu sÉm däc theo sîi ADN) dÞch chuyÓn tõ tr¸i qua ph¶i. C¸c b¶n phiªn m· ARN ®ang ®−îc “më réng” tõ ADN. S¬ ®å bªn d−íi ¶nh TEM m« t¶ mét ®¬n vÞ phiªn m·. Nã bao gåm c¸c gen (mµu xanh lam) m· hãa ba lo¹i rARN xen gi÷a c¸c vïng ®−îc phiªn m· nh−ng sau ®ã ®−îc c¾t bá (mµu vµng). Ban ®Çu chØ mét b¶n phiªn m· ARN duy nhÊt ®−îc t¹o ra, nh−ng sau ®ã nã ®−îc c¾t xÐn ®Ó t¹o nªn ba ph©n tö rARN kh¸c nhau (mçi lo¹i mét ph©n tö); chóng lµ c¸c thµnh phÇn thiÕt yÕu cña ribosom. Mét lo¹i rARN thø t− (5S rARN) còng lµ thµnh phÇn cña ribosom, nh−ng gen m· hãa nã kh«ng thuéc cïng ®¬n vÞ phiªn m· nµy.
(b) C¸c hä gen αααα-globin vµ ββββ-globin ë ng−êi. Hemoglobin ®−îc cÊu t¹o tõ hai tiÓu phÇn (chuçi) polypeptide lo¹i α-globin vµ hai tiÓu phÇn lo¹i β-globin. C¸c gen (mµu xanh lam) m· hãa cho α-globin vµ β-globin ®−îc t×m thÊy trong hai hä gen cã cÊu tróc tæ chøc nh− minh häa trªn h×nh. C¸c tr×nh tù ADN kh«ng m· hãa xen gi÷a c¸c gen chøc n¨ng trong mçi hä gen gåm c¸c gen gi¶ (mµu xanh lôc) vµ c¸c d¹ng biÕn ®æi kh«ng biÓu hiÖn chøc n¨ng cña c¸c gen chøc n¨ng b×nh th−êng. Tªn gäi c¸c gen vµ c¸c gen gi¶ ®−îc kÝ hiÖu vµ ®äc theo tiÕng Hy l¹p.
438 khèi kiÕn thøc 3 Di truyÒn häc
Sù s¾p xÕp c¸c gen thµnh c¸c hä gen ®· gióp c¸c nhµ sinh häc cã nh÷ng hiÓu biÕt s©u h¬n vÒ qu¸ tr×nh tiÕn hãa cña c¸c hÖ gen. Trong môc tiÕp theo, chóng ta sÏ ®Ò cËp ®Õn mét sè qu¸ tr×nh dÉn ®Õn sù ®Þnh h×nh c¸c hÖ gen cña c¸c loµi kh¸c nhau qua qu¸ tr×nh tiÕn hãa.
C¬ së thay ®æi ë cÊp ®é hÖ gen lµ ®ét biÕn vµ ®ã còng lµ nÒn t¶ng cña tiÕn hãa häc hÖ gen. D−êng nh− nh÷ng d¹ng sèng ®Çu tiªn chØ chøa mét sè tèi thiÓu c¸c gen, nghÜa lµ chØ cã c¸c gen thiÕt yÕu cho sù tån t¹i vµ sinh s¶n. NÕu ®iÒu nµy lµ ®óng, th× mét chiÒu h−íng tiÕn hãa h¼n lµ ®· diÔn ra cïng víi sù t¨ng lªn vÒ kÝch th−íc hÖ gen, vµ vËt chÊt di truyÒn bæ sung ®· cung cÊp nguyªn liÖu s¬ cÊp cho tÝnh ®a d¹ng t¨ng lªn cña c¸c gen. Trong môc nµy, ®Çu tiªn chóng ta sÏ m« t¶ b»ng c¸ch nµo nh÷ng b¶n sao bæ sung cña toµn bé hay mét phÇn cña hÖ gen cã thÓ xuÊt hiÖn, råi sau ®ã ®Ò cËp ®Õn nh÷ng qu¸ tr×nh x¶y ra tiÕp theo dÉn ®Õn sù tiÕn hãa cña c¸c protein (hoÆc c¸c s¶n phÈm ARN) cã chøc n¨ng hoµn toµn míi hoÆc thay ®æi chót Ýt.
Sù nh©n ®«i c¸c bé nhiÔm s¾c thÓ C¸c sù kiÖn ngÉu nhiªn trong gi¶m ph©n cã thÓ dÉn ®Õn tÕ bµo cã thÓ cã mét hoÆc nhiÒu bé nhiÔm s¾c thÓ bæ sung thªm; hiÖn t−îng nµy ®−îc gäi lµ ®a béi thÓ. MÆc dï, trong phÇn lín tr−êng hîp nh÷ng sù kiÖn ngÉu nhiªn ®ã th−êng g©y chÕt, nh−ng trong mét sè hiÕm tr−êng hîp, chóng l¹i thóc ®Èy sù tiÕn
hãa cña c¸c gen. ë mét c¬ thÓ ®a béi, mét bé c¸c gen cã thÓ cung cÊp ®ñ c¸c chøc n¨ng thiÕt yÕu cho c¬ thÓ ®ã. Nh÷ng gen ë nh÷ng bé nhiÔm s¾c thÓ bæ sung cã thÓ ph©n ly bëi qu¸ tr×nh tÝch lòy c¸c ®ét biÕn; nh÷ng biÕn dÞ nµy cã thÓ ®−îc duy tr× nÕu nh− c¬ thÓ mang c¸c ®ét biÕn sèng sãt vµ sinh s¶n ®−îc. B»ng c¸ch ®ã, c¸c gen cã thÓ tiÕn hãa víi nh÷ng chøc n¨ng míi.
Cïng víi viÖc mét b¶n sao cña gen thiÕt yÕu ®−îc biÓu hiÖn, sù ph©n ly cña mét b¶n sao kh¸c cã thÓ dÉn ®Õn mét lo¹i protein vÉn do gen ®ã m· hãa song ho¹t ®éng theo mét c¸ch míi, qua ®ã lµm thay ®æi kiÓu h×nh cña sinh vËt. KÕt qu¶ cña sù tÝch lòy c¸c ®ét biÕn nµy cã thÓ dÉn ®Õn sù ph©n nh¸nh tiÕn hãa cña mét loµi míi, gièng nh− biÓu hiÖn th−êng thÊy ë thùc vËt (xem Ch−¬ng 24). C¸c ®éng vËt ®a béi còng tån t¹i, song rÊt hiÕm.
Sù thay ®æi cÊu tróc nhiÔm s¾c thÓ Tõ l©u c¸c nhµ khoa häc ®· biÕt r»ng vµo mét thêi ®iÓm nµo ®ã trong vßng 6 triÖu n¨m tr−íc khi c¸c d¹ng tæ tiªn cña ng−êi hiÖn ®¹i vµ tinh tinh ph©n ly khái nhau vµ h×nh thµnh nªn c¸c loµi riªng biÖt, mét sù dung hîp hai nhiÔm s¾c thÓ kh¸c nhau vèn cã ë d¹ng tæ tiªn ®· dÉn ®Õn loµi ng−êi cã sè nhiÔm s¾c thÓ ®¬n béi (n = 23) kh¸c víi cña tinh tinh (n = 24). Víi sù bïng næ th«ng tin vÒ tr×nh tù c¸c hÖ gen, giê ®©y chóng ta cã thÓ so s¸nh cÊu tróc vµ tæ chøc nhiÔm s¾c thÓ gi÷a nhiÒu loµi ë cÊp ®é ph©n tÝch chi tiÕt h¬n. Nh÷ng th«ng tin nµy gióp chóng ta cã thÓ t×m hiÓu s©u h¬n vÒ c¸c qu¸ tr×nh tiÕn hãa ®· dÉn ®Õn sù h×nh thµnh c¸c nhiÔm s¾c thÓ còng nh− sù ph¸t sinh c¸c loµi. VÝ dô nh−, trong mét nghiªn cøu, c¸c nhµ khoa häc ®· tiÕn
hµnh so s¸nh tr×nh tù ADN gi÷a mçi nhiÔm s¾c thÓ cña ng−êi víi tr×nh tù toµn bé hÖ gen cña chuét. H×nh 21.11 cho thÊy kÕt qu¶ so s¸nh víi nhiÔm s¾c thÓ sè 16 cña ng−êi lµ: nh÷ng “khèi” gen lín trªn nhiÔm s¾c thÓ nµy ®−îc t×m thÊy trªn 4 nhiÔm s¾c thÓ kh¸c nhau cña chuét; ®iÒu nµy cho thÊy c¸c gen trong mçi “khèi” ®· tån t¹i cïng víi nhau trong qu¸ tr×nh tiÕn hãa cña
21.5 Kh¸i niÖm
LÆp ®o¹n, t¸i s¾p xÕp vµ ®ét biÕn trong tr×nh tù ADN ®ãng gãp vµo qu¸ tr×nh tiÕn hãa
21.4
1. H·y nªu c¸c ®Æc ®iÓm cña hÖ gen ®éng vËt cã vó lµm chóng trë nªn lín h¬n so víi c¸c hÖ gen sinh vËt nh©n s¬?
2. C¸c intron, c¸c yÕu tè vËn ®éng vµ c¸c tr×nh tù ADN lÆp l¹i ®¬n gi¶n ph©n bè trong hÖ gen kh¸c nhau nh− thÕ nµo?
3. Nªu sù kh¸c nhau trong cÊu tróc cña c¸c hä gen m· hãa rARN vµ m· hãa c¸c protein globin ë ng−êi. Víi mçi hä gen, h·y gi¶i thÝch lîi thÕ cña sù tån t¹i cÊu tróc kiÓu hä gen ®èi víi sinh vËt.
4. Gi¶ sö b¹n t×m thÊy mét tr×nh tù ADN gièng víi tr×nh tù cña mét gen ®· biÕt, nh−ng chóng l¹i kh¸c nhau râ rÖt ë mét vµi nucleotide nhÊt ®Þnh. B»ng c¸ch nµo b¹n cã thÓ x¸c ®Þnh tr×nh tù míi t×m thÊy cã ph¶i lµ mét “gen” biÓu hiÖn chøc n¨ng hay kh«ng?? Xem gîi ý tr¶ lêi ë Phô lôc A.
KiÓm tra kh¸i niÖm
®iÒu g× NÕu
� H×nh 21.11 C¸c khèi tr×nh tù gièng nhau trªn c¸c nhiÔm s¾c thÓ cña ng−êi vµ chuét. C¸c tr×nh tù ADN rÊt gièng nhau ®−îc t×m thÊy trong mét khèi tr×nh tù lín thuéc nhiÔm s¾c thÓ sè 16 cña ng−êi ®−îc t×m thÊy trªn c¸c nhiÔm s¾c thÓ sè 7, 8, 16 vµ 17 cña chuét. §iÒu nµy cho thÊy c¸c tr×nh tù ADN trong mçi khèi ®· lu«n tån t¹i cïng nhau ë c¸c dßng tiÕn hãa dÉn ®Õn sù h×nh thµnh ng−êi vµ chuét kÓ tõ thêi ®iÓm chóng ph©n ly khái nhau tõ tæ tiªn chung.
NhiÔm s¾c thÓ sè 16 cña ng−êi
C¸c khèi tr×nh tù ADN
C¸c khèi tr×nh tù t−¬ng øng ®−îc t×m thÊy trªn 4 nhiÔm s¾c thÓ cña chuét
Ch−¬ng 21 C¸c hÖ gen vµ sù tiÕn hãa cña chóng 439
chuét còng nh− ë c¸c nh¸nh tiÕn hãa cña ng−êi. Thùc hiÖn phÐp so s¸nh t−¬ng tù gi÷a nhiÔm s¾c thÓ cña ng−êi víi s¸u loµi ®éng vËt cã vó kh¸c còng ®· gióp c¸c nhµ nghiªn cøu t¸i thiÕt ®−îc lÞch sö tiÕn hãa tæ chøc nhiÔm s¾c thÓ ë t¸m loµi ®éng vËt cã vó nµy. Qua ®ã, c¸c nhµ nghiªn cøu ®· t×m ra nhiÒu lÆp ®o¹n vµ ®¶o ®o¹n trªn c¸c ph©n ®o¹n lín cña NST lµ kÕt qu¶ cña c¸c lçi t¸i tæ hîp x¶y ra trong gi¶m ph©n dÉn ®Õn sù ®øt g·y vµ nèi l¹i kh«ng chÝnh x¸c cña ADN. TÇn sè suÊt hiÖn nh÷ng sù kiÖn nµy d−êng nh− ®· t¨ng nhanh trong kho¶ng 100 triÖu n¨m tr−íc, tøc lµ kho¶ng thêi gian nh÷ng loµi khñng long kÝch th−íc lín trë nªn tuyÖt chñng vµ sè loµi ®éng vËt cã vó t¨ng lªn nhanh chãng. Sù trïng lÆp ngÉu nhiªn nµy râ rµng lµ rÊt thó vÞ bëi v× sù t¸i s¾p xÕp nhiÔm s¾c thÓ ®−îc cho lµ ®· ®ãng gãp vµo sù h×nh thµnh c¸c loµi míi. MÆc dï hai c¸ thÓ mang c¸c nhiÔm s¾c thÓ ®−îc s¾p xÕp kh¸c nhau vÉn cã thÓ giao phèi víi nhau vµ sinh s¶n, nh−ng c¸c c¸ thÓ con sinh ra sÏ cã hai bé nhiÔm s¾c thÓ kh«ng t−¬ng ®ång. V× vËy, sù s¾p xÕp l¹i c¸c nhiÔm s¾c thÓ cã thÓ dÉn ®Õn sù h×nh thµnh hai quÇn thÓ kh«ng cßn cã kh¶ n¨ng giao phèi víi nhau n÷a, vµ nã trë thµnh mét b−íc trong con ®−êng dÉn ®Õn sù h×nh thµnh hai loµi t¸ch biÖt (chóng ta sÏ ®Ò cËp kü h¬n vÒ vÊn ®Ò nµy ë Ch−¬ng 24). §iÒu g©y ng¹c nhiªn mét chót lµ nh÷ng nghiªn cøu t−¬ng tù
®· ph¸t hiÖn ra nh÷ng mèi liªn quan ®Õn y häc. ViÖc ph©n tÝch c¸c ®iÓm ®øt g·y nhiÔm s¾c thÓ liªn quan ®Õn sù t¸i s¾p xÕp cña chóng cho thÊy nh÷ng ®iÓm nµy kh«ng hÒ ph©n bè ngÉu nhiªn, mµ chóng lµ nh÷ng ®iÓm ®Æc thï ®−îc dïng ®i dïng l¹i nhiÒu lÇn. NhiÒu “®iÓm nãng” t¸i tæ hîp nh− vËy t−¬ng øng víi vÞ trÝ s¾p xÕp l¹i nhiÔm s¾c thÓ trong hÖ gen ng−êi vèn cã liªn quan ®Õn c¸c bÖnh bÈm sinh. TÊt nhiªn, c¸c nhµ nghiªn cøu cßn quan t©m c¶ nh÷ng vÞ trÝ kh¸c cã thÓ liªn quan ®Õn nh÷ng bÖnh cho ®Õn nay ch−a ®−îc x¸c ®Þnh.
LÆp ®o¹n vµ sù ph©n ly cña c¸c vïng ADN cã kÝch th−íc t−¬ng øng víi gen C¸c lçi trong gi¶m ph©n còng cã thÓ dÉn ®Õn hiÖn t−îng lÆp c¸c vïng nhiÔm s¾c thÓ cã kÝch th−íc nhá h¬n nh÷ng vïng lÆp mµ chóng ta ®· ®Ò cËp trªn ®©y, trong ®ã bao gåm c¸c vïng t−¬ng øng víi chiÒu dµi cña c¸c gen ®¬n lÎ. Ch¼ng h¹n nh−, trao ®æi chÐo kh«ng c©n trong kú ®Çu gi¶m ph©n I cã thÓ dÉn ®Õn mét nhiÔm s¾c thÓ mÊt ®o¹n, trong khi mét nhiÔm s¾c thÓ kh¸c lÆp ®o¹n. Nh− minh häa trªn H×nh 21.12, c¸c yÕu tè vËn ®éng trong hÖ gen lµ nh÷ng vÞ trÝ mµ c¸c nhiÔm s¾c tö kh«ng chÞ em cã thÓ trao ®æi chÐo víi nhau, thËm chÝ ngay c¶ khi chóng kh«ng cã nh÷ng tr×nh t−¬ng ®ång xÕp th¼ng hµng chÝnh x¸c víi nhau. Ngoµi ra, hiÖn t−îng “tr−ît” cã thÓ x¶y ra trong sao chÐp
ADN, ch¼ng h¹n nh− m¹ch lµm khu«n xª dÞch so víi m¹ch t−¬ng ®ång míi ®−îc tæng hîp, hoÆc mét phÇn cña m¹ch lµm khu«n bÞ bé m¸y sao chÐp bá qua hay trong tr−êng hîp kh¸c nã ®−îc dïng lµm khu«n hai lÇn. KÕt qu¶ lµ mét ph©n ®o¹n ADN bÞ mÊt ®i hoÆc lÆp l¹i. Cã thÓ dÔ dµng t−ëng t−îng ra c¸ch mµ nh÷ng lçi nh− vËy cã thÓ xuÊt hiÖn trong c¸c vïng tr×nh tù lÆp l¹i gièng nh− c¸c tr×nh tù ADN lÆp l¹i ®¬n gi¶n ®· ®−îc m« t¶ ë trªn. C¸c tr×nh tù ADN lÆp l¹i ®¬n gi¶n víi sè l−îng biÕn ®éng t¹i mét vÞ trÝ nhÊt ®Þnh, vèn ®−îc dïng cho ph©n tÝch STR, cã thÓ lµ do nh÷ng lçi gièng nh− vËy. C¸c b»ng chøng vÒ trao ®æi chÐo kh«ng c©n vµ hiÖn t−îng “tr−ît” cña m¹ch khu«n trong sao chÐp ADN dÉn ®Õn lÆp gen ®−îc t×m thÊy ë nhiÒu hä ®a gen tån t¹i trong c¸c hÖ gen hiÖn nay.
Sù tiÕn hãa c¸c gen cã chøc n¨ng liªn quan víi nhau: C¸c gen globin ë ng−êi C¸c sù kiÖn lÆp ®o¹n nhiÔm s¾c thÓ hay lÆp gen cã thÓ dÉn ®Õn sù tiÕn hãa cña c¸c gen cã chøc n¨ng liªn quan ®Õn nhau, ch¼ng h¹n nh− c¸c hä gen m· hãa cho α-globin vµ β-globin (xem H×nh 21.10b). ViÖc so s¸nh c¸c tr×nh tù gen trong mét hä ®a gen cã thÓ chØ ra thø tù c¸c gen xuÊt hiÖn. C¸ch tiÕp cËn ®Ó “t¸i t¹o” l¹i lÞch sö tiÕn hãa cña c¸c gen m· hãa globin ®· chØ ra r»ng tÊt c¶ nh÷ng gen nµy ®Òu cã nguån gèc tõ mét gen globin tæ tiªn chung; gen tæ tiªn nµy ®· tr¶i qua hiÖn t−îng lÆp gen råi ph©n ly thµnh c¸c gen α-globin vµ β-globin tæ tiªn kho¶ng 450 - 500 triÖu n¨m tr−íc (H×nh 21.13, ë trang sau). Mçi gen tæ tiªn nµy sau ®ã tiÕp tôc ®−îc nh©n ®«i mét vµi lÇn, råi nh÷ng b¶n sao cña chóng ph©n ly khái nhau vÒ tr×nh tù, dÉn ®Õn h×nh thµnh c¸c gen thµnh viªn thuéc hä gen nh− hiÖn nay. Trong thùc tÕ, gen globin tæ tiªn chung còng cã thÓ lµ nguån gèc cña gen m· hãa protein c¬ liªn kÕt «xy cã tªn gäi lµ myoglobin vµ protein ë thùc vËt lµ leghemoglobin. Hai lo¹i protein nµy hoÆc ®éng ë d¹ng ®¬n ph©n, vµ c¸c gen cña chóng thuéc “siªu hä globin”. TiÕp theo sau c¸c sù kiÖn lÆp gen, sù kh¸c biÖt gi÷a c¸c gen
trong c¸c hä globin râ rµng xuÊt ph¸t tõ c¸c ®ét biÕn ®−îc tÝch lòy trong c¸c b¶n sao cña gen qua nhiÒu thÕ hÖ. VÝ dô, mét m« h×nh hiÖn nay cho r»ng chøc n¨ng thiÕt yÕu cña protein α-globin tr−íc ®©y cã thÓ ®−îc ®¸p øng chØ bëi mét gen duy nhÊt, do vËy c¸c b¶n sao kh¸c cña gen α-globin ®· cã thÓ tÝch lòy c¸c ®ét biÕn ngÉu nhiªn. RÊt nhiÒu ®ét biÕn cã thÓ ®· g©y h¹i cho
� H×nh 21.12 LÆp gen do trao ®æi chÐo kh«ng c©n. Mét c¬ chÕ mµ qua ®ã mét gen (hoÆc mét ®o¹n ADN kh¸c) cã thÓ bÞ lÆp l¹i (nh©n ®«i) lµ sù t¸i tæ hîp x¶y ra trong qu¸ tr×nh gi¶m ph©n gi÷a c¸c b¶n sao kh¸c nhau cña mét yÕu tè vËn ®éng n»m s¸t vïng biªn cña c¸c gen. Sù t¸i tæ hîp nh− vËy x¶y ra do sù “s¾p hµng lÖch” cña hai nhiÔm s¾c tö kh«ng chÞ em thuéc cÆp nhiÔm s¾c thÓ t−¬ng ®ång dÉn ®Õn sù h×nh thµnh mét nhiÔm s¾c tö mang hai b¶n sao cña gen, trong khi nhiÔm s¾c tö cßn l¹i th× kh«ng cã b¶n sao nµo cña gen ®ã.
YÕu tè vËn ®éng
Gen
C¸c nhiÔm s¾c tö kh«ng chÞ em
VÞ trÝ trao ®æi chÐo
Sù b¾t cÆp kh«ng chÝnh x¸c cña hai nhiÔm s¾c thÓ t−¬ng ®ång trong gi¶m ph©n
vµ
440 khèi kiÕn thøc 3 Di truyÒn häc
c¬ thÓ sinh vËt, trong khi mét sè ®ét biÕn kh¸c kh«ng g©y hËu qu¶ g×, nh−ng cã mét sè Ýt ®ét biÕn h¼n lµ ®· lµm thay ®æi chøc n¨ng cña s¶n phÈm protein theo c¸ch cã lîi cho c¬ thÓ sinh vËt vµo mét giai ®o¹n sèng nhÊt ®Þnh cña nã ®ång thêi kh«ng lµm thay ®æi chøc n¨ng vËn chuyÓn «xy cña protein. Cã thÓ gi¶ thiÕt r»ng: chän läc tù nhiªn ®· t¸c ®éng lªn nh÷ng gen nµy vµ duy tr× chóng trong quÇn thÓ. Sù gièng nhau vÒ c¸c tr×nh tù axit amin cña c¸c chuçi
polypeptit α-globin vµ β-globin ñng hé cho m« h×nh lÆp gen vµ tÝch lòy ®ét biÕn (B¶ng 21.2). Ch¼ng h¹n nh−, tr×nh tù axit amin cña c¸c β-globin gièng nhau h¬n rÊt nhiÒu so víi tr×nh tù cña α-globin. Sù tån t¹i cña mét sè gen gi¶ n»m gi÷a c¸c gen globin ho¹t ®éng lµ mét b»ng chøng bæ sung kh¸c ñng hé cho m« h×nh nµy (xem H×nh 21.10b). C¸c ®ét biÕn ngÉu nhiªn x¶y ra ë nh÷ng “gen” nµy qua thêi gian tiÕn hãa cã thÓ ®· lµm háng sù biÓu hiÖn chøc n¨ng b×nh th−êng cña chóng.
TiÕn hãa cña c¸c gen cã chøc n¨ng míi Trong qu¸ tr×nh tiÕn hãa cña c¸c hä gen globin, hiÖn t−îng lÆp gen vµ ph©n ly sau ®ã ®· t¹o nªn c¸c gen thµnh viªn mµ s¶n phÈm cña chóng ®Òu thùc hiÖn chøc n¨ng gièng nhau (vËn chuyÓn «xy). Theo mét c¸ch kh¸c, mét b¶n sao cña gen ®−îc nh©n ®«i cã thÓ tr¶i qua nh÷ng biÕn ®æi dÉn ®Õn sù xuÊt hiÖn mét chøc n¨ng hoµn toµn míi cña s¶n phÈm protein. C¸c gen m· hãa lysozyme vµ α-lactalbumin lµ mét vÝ dô nh− vËy. Lysozyme lµ mét enzym gióp b¶o vÖ c¬ thÓ ®éng vËt khái
sù l©y nhiÔm cña vi khuÈn b»ng viÖc xóc t¸c thñy ph©n thµnh tÕ bµo vi khuÈn; α-lactalbumin lµ mét protein kh«ng cã chøc n¨ng enzym, thay vµo ®ã nã gi÷ vai trß trong qu¸ tr×nh s¶n xuÊt s÷a ë ®éng vËt cã vó. Hai protein nµy rÊt gièng nhau vÒ tr×nh tù axit amin vµ cÊu tróc kh«ng gian ba chiÒu. C¶ hai gen ®−îc t×m thÊy ®ång thêi cã mÆt ë c¸c loµi ®éng vËt cã vó, nh−ng ë chim chØ t×m thÊy gen m· hãa lysozyme. §iÒu nµy chØ ra r»ng vµo mét thêi ®iÓm nhÊt ®Þnh nµo ®ã trong qu¸ khø, sau khi c¸c nh¸nh
dÉn ®Õn h×nh thµnh c¸c loµi ®éng vËt cã vó vµ chim ph©n ly khái nhau, gen lysozyme ®· tr¶i qua mét sù kiÖn lÆp gen trong nh¸nh tiÕn hãa h×nh thµnh c¸c ®éng vËt cã x−¬ng sèng, nh−ng kh«ng x¶y ra trong nh¸nh tiÕn hãa cña chim. Cuèi cïng, mét b¶n sao cña gen lysozym ®· ®−îc nh©n ®«i dÉn ®Õn sù tiÕn hãa h×nh thµnh gen m· hãa α-lactanbomin vèn lµ mét protein cã chøc n¨ng kh¸c biÖt ho¹t toµn.
Sù s¾p xÕp l¹i c¸c phÇn cña gen: nh©n ®«i vµ tr¸o exon Sù s¾p xÕp l¹i c¸c tr×nh tù ADN s½n cã trong c¸c gen còng ®· gãp phÇn vµo sù tiÕn hãa hÖ gen. Sù cã mÆt cña intron trong phÇn lín c¸c gen ë sinh vËt nh©n thËt ®a bµo cã thÓ ®· thóc ®Èy sù tiÕn hãa cña c¸c protein cã tiÒm n¨ng h÷u dông míi b»ng viÖc gia t¨ng hiÖn t−îng lÆp ®o¹n hay s¾p xÕp l¹i vÞ trÝ cña c¸c exon trong hÖ gen. Chóng ta nhí l¹i tõ Ch−¬ng 17 r»ng mçi exon th−êng m· hãa cho mét miÒn cã cÊu tróc vµ chøc n¨ng ®Æc thï cña protein. Chóng ta còng ®· biÕt trao ®æi chÐo
kh«ng c©n trong qu¸ tr×nh gi¶m ph©n cã thÓ dÉn ®Õn hiÖn t−îng lÆp gen trªn mét nhiÔm s¾c thÓ ®ång thêi lµm mÊt gen trªn nhiÔm s¾c thÓ t−¬ng ®ång víi nã (xem H×nh 21.12). B»ng mét qu¸ tr×nh t−¬ng tù, mét exon nhÊt ®Þnh trong gen cã thÓ bÞ nh©n ®«i trªn mét nhiÔm s¾c thÓ, song l¹i bÞ mÊt ®i trªn nhiÔm s¾c thÓ kia. C¸c gen mang c¸c exon lÆp l¹i cã thÓ m· hãa cho mét lo¹i protein chøa hai b¶n sao cña mét miÒn protein. Sù thay ®æi nµy trong cÊu tróc cã thÓ lµm t¨ng c−êng sù biÓu hiÖn chøc n¨ng cña protein nÕu protein ®ã lóc nµy trë nªn æn ®Þnh h¬n, vµ t¨ng kh¶ n¨ng liªn kÕt víi mét chÊt g¾n nhÊt ®Þnh hoÆc lµm thay ®æi mét sè thuéc tÝnh kh¸c. Kh¸ nhiÒu gen m·
� H×nh 21.13 Mét m« h×nh tiÕn hãa cña c¸c hä gen α-globin vµ β-globin tõ gen globin “tæ tiªn” duy nhÊt.
C¸c yÕu tè tr×nh tù mµu xanh lôc lµ c¸c gen gi¶. H·y gi¶i thÝch b»ng c¸ch nµo chóng cã thÓ xuÊt hiÖn sau khi ®· x¶y ra c¸c sù kiÖn lÆp gen.
B¶ng 21.2 TØ lÖ gièng nhau trong tr×nh tù axit amin gi÷a c¸c protein globin ë ng−êi
Gen globin “tæ tiªn”
Gen “tæ tiªn” ®−îc nh©n ®«i (lÆp gen)
§ét biÕn tÝch lòy ë c¶ hai b¶n sao
VËn ®éng tíi c¸c nhiÔm s¾c thÓ kh¸c
TiÕp tôc lÆp gen vµ tÝch lòy ®ét biÕn
Hä gen α-globin trªn nhiÔm s¾c thÓ sè 16
Hä gen α-globin trªn nhiÔm s¾c thÓ sè 11
Thêi gian tiÕn hãa
C¸c lo¹i αααα-globin C¸c lo¹i ββββ-globin
C¸c lo¹i αααα-globin
C¸c lo¹i ββββ-globin
Ch−¬ng 21 C¸c hÖ gen vµ sù tiÕn hãa cña chóng 441
hãa protein cã nhiÒu b¶n sao cña c¸c exon cã quan hÖ víi nhau mµ cã thÓ gi¶ thiÕt chóng h×nh thµnh sau mét qu¸ tr×nh lÆp ®o¹n vµ ph©n ly. Mét vÝ dô ®iÓn h×nh vÒ ®iÒu nµy lµ gen m· hãa protein m¹ng ngo¹i bµo collagen. Collagen lµ mét protein cÊu tróc cã tr×nh tù axit amin víi møc ®é lÆp l¹i cao ph¶n ¸nh sù lÆp l¹i cña c¸c exon trong gen collagen. Theo mét c¸ch kh¸c, chóng ta còng cã thÓ t−ëng t−îng sù
kÕt cÆp vµ ®«i khi phèi trén gi÷a c¸c exon kh¸c nhau cña cïng mét gen hoÆc gi÷a hai gen kh«ng alen víi nhau do c¸c lçi t¸i tæ hîp x¶y ra trong qu¸ tr×nh gi¶m ph©n. Qu¸ tr×nh nµy, ®−îc gäi lµ sù tr¸o exon, cã thÓ dÉn ®Õn sù h×nh thµnh nh÷ng protein míi víi nh÷ng tæ hîp chøc n¨ng míi. H·y xem vÝ dô vÒ gen m· hãa yÕu tè ho¹t hãa plasminogen m« (TPA, tissue plasminogen activator). Protein TPA lµ mét lo¹i protein ngo¹i bµo gióp ®iÒu khiÓn sù h×nh thµnh huyÕt khèi (trong qu¸ tr×nh ®«ng m¸u). Protein nµy gåm cã 4 miÒn chøc n¨ng thuéc 3 lo¹i kh¸c nhau; mçi miÒn ®−îc m· hãa bëi mét exon, trong ®ã cã mét exon xuÊt hiÖn víi hai b¶n sao. Do mçi lo¹i exon nµy còng ®−îc t×m thÊy ë nh÷ng protein kh¸c n÷a, nªn ng−êi ta cho r»ng gen m· hãa TPA ®· h×nh thµnh sau mét sè sù kiÖn lÆp ®o¹n vµ tr¸o exon (H×nh 21.14).
C¸c yÕu tè vËn ®éng gãp phÇn vµo sù tiÕn hãa cña hÖ gen nh− thÕ nµo ? Sù cã mÆt æn ®Þnh cña c¸c yÕu tè vËn ®éng vèn chiÕm mét phÇn lín hÖ gen ë mét sè sinh vËt nh©n thËt phï hîp víi ý t−ëng cho r»ng chóng gi÷ mét vai trß quan träng trong qu¸ tr×nh tiÕn hãa hÖ gen cña nh÷ng sinh vËt nµy. Nh÷ng yÕu tè nµy cã thÓ gãp phÇn vµo sù tiÕn hãa cña hÖ gen theo mét sè c¸ch. Chóng cã thÓ
thóc ®Èy c¸c hiÖn t−îng t¸i tæ hîp, lµm ®øt g·y c¸c gen hoÆc c¸c tr×nh tù ®iÒu hßa biÓu hiÖn gen, hoÆc vËn chuyÓn toµn bé mét gen nµo ®ã hoÆc c¸c vïng exon riªng lÎ tíi c¸c vÞ trÝ míi. C¸c yÕu tè vËn ®éng cã tr×nh tù gièng nhau n»m ph©n t¸n
kh¾p hÖ gen lµ ®iÒu kiÖn thóc ®Èy hiÖn t−îng t¸i tæ hîp gi÷a c¸c nhiÔm s¾c thÓ kh¸c nhau bëi nã cung cÊp nh÷ng vïng t−¬ng ®ång cho ho¹t ®éng trao ®æi chÐo. PhÇn lín nh÷ng thay ®æi nh− vËy cã lÏ lµ g©y h¹i, dÉn ®Õn hiÖn t−îng chuyÓn ®o¹n nhiÔm s¾c thÓ hoÆc nh÷ng thay ®æi kh¸c trong hÖ gen vèn cã thÓ g©y chÕt sinh vËt. Nh−ng qua thêi gian tiÕn hãa l©u dµi, mét sù kiÖn t¸i tæ hîp ngÉu nhiªn còng cã thÓ cã lîi cho c¬ thÓ sinh vËt. Sù di chuyÓn cña c¸c yÕu tè vËn ®éng còng cã thÓ g©y nªn
nh÷ng hËu qu¶ trùc tiÕp. VÝ dô, nÕu mét yÕu tè vËn ®éng “nh¶y” vµo gi÷a tr×nh tù m· hãa protein, th× nã sÏ ng¨n c¶n tÕ bµo s¶n xuÊt b¶n phiªn m· b×nh th−êng cña gen. NÕu mét yÕu tè vËn ®éng cµi vµo gi÷a mét tr×nh tù ®iÒu hßa, th× sù di chuyÓn ®ã cã thÓ dÉn ®Õn viÖc sinh tæng hîp mét hoÆc mét sè protein t¨ng lªn hoÆc gi¶m ®i. Sù di chuyÓn cña c¸c yÕu tè vËn ®éng cã thÓ g©y nªn c¶ hai kiÓu hiÖu øng trªn ®èi víi c¸c gen m· hãa cho c¸c enzym tæng hîp s¾c tè ë h¹t ng« trong thÝ nghiÖm cña McClintock. Mét lÇn n÷a, phÇn lín nh÷ng thay ®æi nh− vËy th−êng cã h¹i, song trong mét thêi gian tiÕn hãa dµi th× mét sè thay ®æi ®ã l¹i t¹o nªn −u thÕ vÒ kh¶ n¨ng sèng sãt. Trong qu¸ tr×nh di chuyÓn, c¸c yÕu tè vËn ®éng cã thÓ mang
theo mét gen hoÆc mét nhãm gen tíi mét vÞ trÝ míi trong hÖ gen. C¬ chÕ nµy cã thÓ gi¶i thÝch cho viÖc c¸c hä gen α-globin vµ β-globin ë ng−êi n»m trªn c¸c nhiÔm s¾c thÓ kh¸c nhau, còng nh− hiÖn t−îng c¸c gen thµnh viªn cña mét sè hä gen kh¸c n»m ph©n t¸n kh¾p hÖ gen. Bëi mét qu¸ tr×nh t−¬ng tù diÔn ra l©u dµi, mét exon tõ mét gen cã thÓ ®−îc cµi vµo mét gen kh¸c bëi c¬ chÕ gièng víi hiÖn t−îng tr¸o exon trong t¸i tæ hîp. VÝ dô nh−, mét exon cã thÓ ®−îc cµi vµo trong mét intron cña mét gen m· hãa protein bëi ho¹t ®éng cña mét yÕu tè vËn ®éng. NÕu exon ®−îc cµi vµo ®ã ®−îc duy tr× trong b¶n phiªn m· ARN trong qu¸ tr×nh hoµn thiÖn ARN, th× protein ®−îc tæng hîp ra sÏ cã thªm mét miÒn (domain) míi; ®iÒu nµy cã thÓ dÉn ®Õn mét chøc n¨ng míi cña protein. Mét nghiªn cøu gÇn ®©y cßn chØ ra mét c¸ch kh¸c mµ c¸c
yÕu tè vËn ®éng cã thÓ t¹o nªn c¸c tr×nh tù m· hãa míi. Nghiªn cøu nµy cho thÊy mét yÕu tè Alu cã thÓ “nh¶y” vµo trong mét intron theo c¸ch t¹o nªn mét vÞ trÝ c¾t intron míi ho¹t ®éng yÕu trªn b¶n phiªn m· ARN. Trong qu¸ tr×nh hoµn thiÖn b¶n phiªn m·, c¸c vÞ trÝ c¾t intron b×nh th−êng ®−îc dïng th−êng xuyªn h¬n, nh−ng ®«i khi intron l¹i ®−îc c¾t ë vÞ trÝ míi, dÉn ®Õn h×nh thµnh mét sè b¶n phiªn m· mARN hoµn thiÖn chøa c¶ yÕu tè Alu; kÕt qu¶ lµ yÕu tè nµy m· hãa cho mét phÇn míi cña protein. B»ng c¸ch nµy, mét kiÓu tæ hîp di truyÒn míi cã thÓ ®−îc “thö nghiÖm” trong khi chøc n¨ng cña s¶n phÈm gen gèc vÉn tiÕp tôc ®−îc duy tr×. Râ rµng, tÊt c¶ c¸c qu¸ tr×nh ®−îc th¶o luËn trong môc nµy
phæ biÕn h¬n c¶ lµ g©y h¹i, thËm chÝ cã thÓ g©y chÕt, hoÆc ®¬n gi¶n lµ kh«ng g©y nªn bÊt cø hËu qu¶ g×. Tuy vËy, trong mét sè Ýt tr−êng hîp, nh÷ng thay ®æi cã lîi cã thÓ xuÊt hiÖn. Qua nhiÒu thÕ hÖ, sù ®a d¹ng di truyÒn thu ®−îc sÏ lµ nguån nguyªn liÖu cã gi¸ trÞ cho chän läc tù nhiªn. Sù ®a d¹ng hãa c¸c gen vµ s¶n phÈm cña chóng lµ mét nh©n tè quan träng trong qu¸ tr×nh tiÕn hãa cña mét loµi míi. V× vËy, sù tÝch lòy nh÷ng thay ®æi trong hÖ gen cña mçi loµi còng chÝnh lµ b¶n ghi chÐp vÒ lÞch sö tiÕn hãa cña nã. §Ó ®äc ®−îc b¶n ghi chÐp nµy, chóng ta ph¶i x¸c
� H×nh 21.14 Sù tiÕn hãa cña mét gen míi b»ng c¬ chÕ trao ®æi exon. Sù trao ®æi exon cã thÓ gåm sù di chuyÓn exon tõ c¸c d¹ng tiÒn th©n cña gen m· hãa yÕu tè sinh tr−ëng biÓu b×, cña fibronectin vµ cña plaminogen (bªn tr¸i) vµo gen m· hãa yÕu tè ho¹t hãa plasminogen m« - TPA (bªn ph¶i). Thø tù x¶y ra c¸c sù kiÖn lµ ch−a râ. Sù nh©n ®«i cña exon "kringle" tõ gen plasminogen khi nã di chuyÓn gi¶i thÝch cho sù xuÊt hiÖn hai b¶n sao cña exon nµy trong gen TPA. Mçi lo¹i exon m· hãa cho mét miÒn ®Æc thï cña protein TPA.
B»ng c¸ch nµo sù cã mÆt cña c¸c yÕu tè vËn ®éng cã trong c¸c intron l¹i cã thÓ thóc ®Èy sù trao ®æi exon diÔn ra nh− ®−îc m« t¶ trªn ®©y ?
Gen yÕu tè sinh tr−ëng biÓu b× cã nhiÒu exon EGF (mµu xanh lôc)
Gen fibronectin cã nhiÒu exon “finger” (mµu vµng)
Gen plasminogen cã mét exon “kringle” (mµu xanh lam)
Tr¸o exon
Tr¸o exon
LÆp ®o¹n (nh©n ®«i) exon
442 khèi kiÕn thøc 3 Di truyÒn häc
®Þnh ®−îc nh÷ng thay ®æi diÔn ra trong hÖ gen. So s¸nh hÖ gen cña c¸c loµi kh¸c nhau gióp chóng ta thùc hiÖn ®−îc ®iÒu ®ã, ®ång thêi gióp chóng ta hiÓu râ h¬n c¸c hÖ gen tiÕn hãa nh− thÕ nµo. Chóng ta sÏ ®Ò cËp ®Õn nh÷ng chñ ®Ò nµy trong môc cuèi cïng d−íi ®©y thuéc ch−¬ng nµy.
Mét nhµ nghiªn cøu ®· vÝ giai ®o¹n ph¸t triÓn hiÖn nay cña sinh häc nh− Kû nguyªn Kh¸m ph¸ vµo thÕ kû thø XV sau khi lÜnh vùc hµng h¶i vµ ®ãng tµu vËn t¶i nhanh cã ®−îc hµng lo¹t c¸c tiÕn bé kü thuËt. Trong vßng 20 n¨m qua, chóng ta ®· chøng kiÕn nhiÒu tiÕn bé nhanh chãng trong gi¶i tr×nh tù c¸c hÖ gen vµ tËp hîp c¸c d÷ liÖu, còng nh− sù ph¸t triÓn cña nh÷ng kü thuËt míi cho phÐp ®¸nh gi¸ ho¹t ®éng cña c¸c gen trong kh¾p hÖ gen, vµ c¸c ph−¬ng ph¸p tinh vi cho phÐp t×m hiÓu b»ng c¸ch nµo c¸c gen vµ s¶n phÈm cña chóng cïng phèi hîp ho¹t ®éng trong c¸c hÖ thèng phøc t¹p. Chóng ta míi ë ®Çu ng−ìng cöa cña mét thÕ giíi míi. ViÖc so s¸nh tr×nh tù hÖ gen tõ c¸c loµi kh¸c nhau ®· cung
cÊp nhiÒu th«ng tin vÒ lÞch sö tiÕn hãa cña sù sèng tõ giai ®o¹n cæ ®¹i cho ®Õn gÇn ®©y. T−¬ng tù nh− vËy, c¸c nghiªn cøu so s¸nh vÒ ch−¬ng tr×nh di truyÒn ®· ®iÒu khiÓn qu¸ tr×nh ph¸t triÓn ph«i ë c¸c loµi kh¸c nhau ®ang b¾t ®Çu lµm s¸ng tá c¸c c¬ chÕ t¹o nªn sù phong phó vµ ®a d¹ng cña c¸c d¹ng sèng hiÖn nay. Trong môc nµy, chóng ta sÏ bµn luËn vÒ viÖc chóng ta ®· häc ®−îc g× tõ nh÷ng h−íng nghiªn cøu nµy.
So s¸nh hÖ gen Khi c¸c gen vµ hÖ gen cña hai loµi cµng gièng nhau vÒ tr×nh tù, th× chóng cµng cã quan hÖ gÇn gòi trong lÞch sö tiÕn hãa. ViÖc
so s¸nh hÖ gen cña c¸c loµi cã quan hÖ gÇn gòi gióp lµm s¸ng tá nhiÒu sù kiÖn tiÕn hãa trong thêi gian gÇn ®©y; trong khi ®ã, viÖc so s¸nh hÖ gen cña c¸c loµi cã kho¶ng c¸ch xa h¬n gióp chóng ta hiÓu vÒ lÞch sö tiÕn hãa cæ ®¹i. Trong c¶ hai tr−êng hîp, nh÷ng hiÓu biÕt vÒ nh÷ng ®Æc ®iÓm ®−îc chia sÎ chung vµ ph©n ly riªng gi÷a c¸c nhãm gióp chóng ta cã ®−îc bøc tranh ngµy cµng râ h¬n vÒ sù tiÕn hãa cña c¸c qu¸ tr×nh sinh häc vµ c¸c d¹ng sèng. Nh− ®· ®Ò cËp ë Ch−¬ng 1, mèi liªn hÖ tiÕn hãa gi÷a c¸c loµi cã thÓ biÓu diÔn b»ng s¬ ®å d¹ng c©y (th−êng cã chiÒu quay ngang), mµ trªn ®ã mçi ®iÓm ph©n cµnh chØ sù ph©n ly cña c¸c nh¸nh tiÕn hãa. H×nh 21.15 biÓu diÔn mèi quan hÖ tiÕn hãa cña mét sè loµi vµ nhãm loµi mµ chóng ta sÏ ®Ò cËp d−íi ®©y. Chóng ta sÏ c©n nh¾c so s¸nh gi÷a c¸c loµi cã quan hÖ xa nhau tr−íc.
So s¸nh gi÷a c¸c loµi cã quan hÖ xa nhau
ViÖc ph©n tÝch c¸c gen gièng nhau, th−êng quen gäi lµ cã tÝnh b¶o thñ cao, gi÷a nh÷ng loµi cã quan hÖ xa nhau gióp lµm s¸ng tá mèi quan hÖ tiÕn hãa gi÷a c¸c loµi vèn ph©n ly khái nhau tõ mét thêi ®iÓm rÊt l©u trong qu¸ khø. Trong thùc tÕ, viÖc so s¸nh tr×nh tù hÖ gen ®Çy ®ñ cña vi khuÈn, vi khuÈn cæ vµ sinh vËt nh©n thËt ®· chØ ra r»ng ba nhãm loµi nµy ®· ph©n ly khái nhau kho¶ng tõ 2 tØ ®Õn 4 tØ n¨m tr−íc, ®ång thêi ñng hé m¹nh mÏ gi¶ thuyÕt chóng lµ nh÷ng liªn giíi (l·nh giíi) sinh vËt sèng c¬ b¶n (xem H×nh 21.15). Ngoµi gi¸ trÞ sö dông trong nghiªn cøu tiÕn hãa, c¸c nghiªn
cøu hÖ gen häc so s¸nh cßn gióp kh¼ng ®Þnh sù phï hîp trong viÖc lùa chän nghiªn cøu ë c¸c sinh vËt m« h×nh tõ ®ã gióp chóng ta hiÓu biÕt ngµy cµng ®Çy ®ñ h¬n vÒ sinh häc nãi chung vµ vÒ sinh häc ng−êi nãi riªng. NhiÒu gen ®· tiÕn hãa qua mét thêi gian dµi, song cã thÓ vÉn gièng nhau mét c¸ch ng¹c nhiªn ë c¸c loµi kh¸c h¼n nhau. Mét vÝ dô vÒ ®iÒu nµy lµ mét sè gen ë nÊm men gièng víi mét sè gen g©y bÖnh nhÊt ®Þnh ë ng−êi ®Õn møc nh÷ng nhµ nghiªn cøu cã thÓ suy luËn ra chøc n¨ng cña nh÷ng gen g©y bÖnh nµy th«ng qua nghiªn cøu c¸c gen t−¬ng øng ë nÊm men. Sù gièng nhau ®¸ng ng¹c nhiªn nµy cho thÊy nguån gèc chung cña hai loµi cã quan hÖ xa nhau nµy.
So s¸nh gi÷a c¸c loµi cã quan hÖ gÇn gòi HÖ gen cña hai loµi cã quan hÖ gÇn gòi nhiÒu kh¶ n¨ng cã tæ chøc gièng nhau bëi v× chóng míi chØ ph©n ly khái nhau trong thêi gian gÇn ®©y. Nh− chóng ta ®· ®Ò cËp ë trªn, ®iÒu nµy cho phÐp hÖ gen cña mét loµi ®· ®−îc gi¶i tr×nh tù hoµn toµn cã thÓ ®−îc dïng lµm khung l¾p r¸p c¸c tr×nh tù hÖ gen cña mét loµi cã quan hÖ gÇn gòi víi nã, qu¸ ®ã lµm t¨ng tèc ®é lËp b¶n ®å hÖ gen cña loµi thø hai. VÝ dô nh−, b»ng viÖc sö dông hÖ gen ng−êi lµm b¶n h−íng dÉn, c¸c nhµ nghiªn cøu cã thÓ nhanh chãng gi¶i tr×nh tù hÖ gen cña chuét. Sù ph©n ly gÇn ®©y cña hai loµi cã quan hÖ gÇn còng lµ c¬
së cña hiÖn t−îng chØ cã mét sè Ýt sù kh¸c biÖt vÒ gen ®−îc t×m thÊy khi so s¸nh hÖ gen cña chóng víi nhau. Nh÷ng kh¸c biÖt di truyÒn nhÊt ®Þnh nhê vËy cã thÓ dÔ dµng ®èi chiÕu víi nh÷ng kh¸c biÖt h×nh th¸i gi÷a hai loµi. Mét øng dông lý thó cña kiÓu ph©n tÝch nµy ®−îc ph¸t hiÖn khi c¸c nhµ nghiªn cøu so s¸nh hÖ gen ng−êi víi c¸c hÖ gen cña tinh tinh, chuét nh¾t, chuét ®ång vµ c¸c ®éng vËt cã vó kh¸c. ViÖc x¸c ®Þnh ®−îc c¸c gen ®ång thêi cã mÆt trong hÖ gen cña tÊt c¶ nh÷ng loµi nµy nh−ng kh«ng cã trong hÖ gen cña c¸c loµi kh¸c vèn kh«ng ph¶i ®éng vËt cã vó sÏ cung cÊp “manh mèi” vÒ con qu¸ tr×nh tiÕn hãa vµ ph¸t
21.6 Kh¸i niÖm
So s¸nh c¸c tr×nh tù hÖ gen cung cÊp b»ng chøng vÒ c¸c qu¸ tr×nh tiÕn hãa vµ ph¸t triÓn
21.5
1. H·y nªu ba vÝ dô vÒ c¸c lçi x¶y ra trong c¸c qu¸ tr×nh cña tÕ bµo cã thÓ dÉn ®Õn hiÖn t−îng lÆp ®o¹n ADN?
2. Gi¶i thÝch b»ng c¸ch nµo nhiÒu exon cã thÓ xuÊt hiÖn trong c¸c gen EGF tiÒn th©n vµ fibronectin ®−îc vÏ trªn H×nh 21.14 (phÇn bªn tr¸i)?
3. Ba c¸ch mµ c¸c yÕu tè vËn ®éng ®−îc cho lµ ®· gãp phÇn vµo sù tiÕn hãa cña c¸c hÖ gen lµ g×?
4. N¨m 2005, c¸c nhµ khoa häc Ailen c«ng bè t×m thÊy mét ®¶o ®o¹n lín trªn nhiÔm s¾c thÓ ë 20% sè ng−êi B¾c ¢u, vµ hä nhÊn m¹nh r»ng nh÷ng phô n÷ Ailen mang ®¶o ®o¹n nµy cã nhiÒu con h¬n ®¸ng kÓ so víi nh÷ng ng−êi phô n÷ kh«ng mang ®¶o ®o¹n nµy. TÇn sè cña ®¶o ®o¹n nµy trong quÇn thÓ ng−êi Ailen ë c¸c thÕ hÖ t−¬ng lai ®−îc mong ®îi sÏ nh− thÕ nµo?
Xem gîi ý tr¶ lêi ë Phô lôc A.
KiÓm tra kh¸i niÖm
®iÒu g× NÕu
Ch−¬ng 21 C¸c hÖ gen vµ sù tiÕn hãa cña chóng 443
sinh cña líp ®éng vËt nµy; cïng lóc ®ã, nh÷ng gen ®−îc “chia sΔ chung gi÷a ng−êi vµ tinh tinh nh−ng kh«ng cã ë chuét ®ång cã thÓ cung cÊp b»ng chøng vÒ qu¸ tr×nh tiÕn hãa cña c¸c loµi linh tr−ëng. Vµ, tÊt nhiªn, viÖc so s¸nh gi÷a hÖ gen ng−êi víi hÖ gen tinh tinh cã thÓ gióp chóng ta tr¶ lêi c©u hái ®Çy th¸ch thøc ®· ®−îc nªu ngay ë ®Çu ch−¬ng nµy, ®ã lµ: th«ng tin nµo trong hÖ gen ®· t¹o nªn con ng−êi vµ tinh tinh? Mét ph©n tÝch tæng thÓ c¸c thµnh phÇn cña hÖ gen ng−êi vµ
tinh tinh vèn ®−îc cho lµ ph©n ly khái nhau chØ kho¶ng 6 triÖu n¨m tr−íc (xem H×nh 21.15) cho thÊy mét sè kh¸c biÖt c¬ b¶n. Khi c©n nh¾c c¸c thay thÕ ®¬n nucleotit, hai hÖ gen ng−êi vµ tinh tinh chØ kh¸c nhau kho¶ng 1,2%. Tuy vËy, khi c¸c nhµ nghiªn cøu ph©n tÝch c¸c ®o¹n ADN dµi h¬n, hä ®· rÊt ng¹c nhiªn khi t×m thÊy thªm 2,7% kh¸c biÖt do viÖc cµi thªm hay mÊt ®i cña nh÷ng vïng lín h¬n trong hÖ gen hoÆc ë loµi nµy hoÆc ë loµi kia; nhiÒu tr×nh tù cµi thªm lµ nh÷ng tr×nh tù ®−îc nh©n ®«i hoÆc lµ nh÷ng ®o¹n tr×nh tù ADN lÆp l¹i kh¸c. Trong thùc tÕ, mét phÇn ba c¸c ®o¹n tr×nh tù nh©n ®«i ë ng−êi kh«ng cã mÆt trong hÖ gen cña tinh tinh, vµ mét sè trong nh÷ng tr×nh tù nh©n ®«i nay chøa c¸c vïng cã liªn quan ®Õn c¸c bÖnh ë ng−êi. YÕu tè Alu cã mÆt nhiÒu h¬n trong hÖ gen ng−êi so víi hÖ gen tinh tinh, trong khi ®ã hÖ gen tinh tinh chøa nhiÒu b¶n sao tr×nh tù tiÒn virut cña c¸c retrovirut vèn kh«ng cã trong hÖ gen ng−êi. TÊt c¶ nh÷ng ph¸t hiÖn nµy ®· cung cÊp “manh mèi” vÒ c¸c ¸p lùc ®· lµm ph©n t¸ch hai hÖ gen theo hai con ®−êng kh¸c nhau; nãi vËy, nh−ng chóng ta vÉn ch−a cã bøc tranh ®Çy ®ñ vÒ nã. Ngoµi ra, chóng ta cßn ch−a râ b»ng c¸ch nµo nh÷ng kh¸c biÖt nµy dÉn ®Õn nh÷ng ®Æc ®iÓm ®Æc tr−ng ë mçi loµi. §Ó ph¸t hiÖn ra c¬ së dÉn ®Õn sù kh¸c biÖt h×nh th¸i gi÷a
hai loµi, c¸c nhµ sinh häc ®· nghiªn cøu c¸c gen ®Æc thï vµ c¸c lo¹i gen kh¸c nhau gi÷a ng−êi vµ tinh tinh vµ so s¸nh chóng víi
nh÷ng gen t−¬ng øng ë c¸c loµi ®éng vËt cã vó kh¸c. H−íng nghiªn cøu nµy ®· chØ ra mét sè gen râ rµng ®· biÕn ®æi (tiÕn hãa) nhanh h¬n ë ng−êi so víi tinh tinh còng nh− so víi chuét. Trong sè nh÷ng gen nµy cã c¸c gen liªn quan ®Õn c¸c c¬ chÕ b¶o vÖ c¬ thÓ chèng l¹i c¸c bÖnh sèt rÐt vµ lao vµ Ýt nhÊt liªn quan ®Õn mét gen ®iÒu hßa kÝch th−íc n·o. Khi xÐt vÒ chøc n¨ng, th× c¸c gen d−êng nh− tiÕn hãa nhanh nhÊt lµ c¸c gen m· hãa cho c¸c yÕu tè phiªn m·. §©y lµ mét th«ng tin hÊp dÉn bëi v× c¸c yÕu tè phiªn m· ®iÒu hßa sù biÓu hiÖn cña gen vµ do ®ã gi÷ vai trß chÝnh trong ®iÒu phèi c¸c ch−¬ng tr×nh di truyÒn chung. Mét yÕu tè phiªn m· mµ gen m· hãa
nã biÓu hiÖn biÕn ®æi nhanh trong nh¸nh tiÕn hãa ë ng−êi ®−îc gäi lµ FOXP2. Mét sè b»ng chøng chØ ra r»ng gen FOXP2 cã chøc n¨ng ph¸t triÓn kh¶ n¨ng ph¸t ©m ë ®éng vËt cã x−¬ng sèng. Tr−íc hÕt, c¸c ®ét biÕn x¶y ra ë gen nµy g©y nªn nh÷ng sai háng nghiªm träng vÒ kh¶ n¨ng ph¸t triÓn ng«n ng÷ vµ lêi nãi ë ng−êi. Ngoµi ra, gen FOXP2 còng ®−îc biÓu hiÖn trong n·o cña c¸c loµi chim sÎ vµ c¸c hoµng yÕn trong giai ®o¹n c¸c loµi chim nµy ®Õn ®é tuæi tËp
hãt. Nh−ng cã lÏ nh÷ng b»ng chøng thuyÕt phôc nhÊt b¾t nguån tõ nh÷ng thÝ nghiÖm “knock-out (bÊt ho¹t) gen” mµ Joseph Buxhaum vµ céng sù ®· tiÕn hµnh nh»m lµm háng gen FOXP2 ë chuét råi tiÕn hµnh ph©n tÝch kiÓu h×nh thu ®−îc (H×nh 21.16, xem trang bªn). C¸c chuét ®ét biÕn ®ång hîp tö cã n·o ph¸t triÓn bÊt th−êng vµ mÊt kh¶ n¨ng ph¸t ra ©m thanh siªu ©m b×nh th−êng, ®ång thêi c¸c c¸ thÓ chuét mang mét b¶n sao gen nµy bÞ háng còng gÆp vÊn ®Ò râ rÖt trong ph¸t triÓn ©m thanh. Nh÷ng kÕt qu¶ nµy ñng hé cho ý t−ëng cho r»ng gen FOXP2 ®· tiÕn hµnh bËt c¸c gen liªn quan ®Õn kh¶ n¨ng ph¸t ©m. Më réng tõ kh¸i niÖm nµy, c¸c nhµ nghiªn cøu ®ang kh¸m
ph¸ liÖu sù kh¸c nhau gi÷a protein FOXP2 ë ng−êi vµ tinh tinh cã ph¶i lµ nguyªn nh©n dÉn ®Õn kh¶ n¨ng ph¸t triÓn ng«n ng÷ giao tiÕp ë ng−êi vèn kh«ng cã ®−îc ë tinh tinh hay kh«ng. Protein FOXP2 ë ng−êi vµ tinh tinh chØ kh¸c nhau 2 axit amin duy nhÊt, vµ ¶nh h−ëng cña sù kh¸c biÖt nµy ®Õn chøc n¨ng cña protein ë ng−êi nh− thÕ nµo ®Õn nay vÉn lµ mét c©u hái bÝ Ên ch−a cã c©u tr¶ lêi.
C©u chuyÖn vÒ gen FOXP2 lµ mét vÝ dô ®iÓn h×nh vÒ viÖc b»ng c¸ch nµo c¸c c¸ch tiÕp cËn kh¸c nhau cã thÓ bæ sung cho nhau trong viÖc gióp kh¸m ph¸ c¸c hiÖn t−îng sinh häc cã ý nghÜa quan träng. Trong thÝ nghiÖm ®−îc minh häa trªn H×nh 21.16, chuét ®−îc dïng lµm m« h×nh thay thÕ cho con ng−êi, bëi v× trong nh÷ng thÝ nghiÖm nh− vËy, viÖc thùc hiÖn c¸c nghiªn cøu trªn ng−êi lµ kh«ng phï hîp vÒ ®¹o ®øc (còng nh− lµ kh«ng thùc tÕ). Chuét vµ ng−êi ph©n ly khái nhau c¸ch ®©y kho¶ng 65,5 triÖu n¨m (xem H×nh 21.15) vµ 85% c¸c gen gi÷a hai loµi lµ gièng nhau. Sù gièng nhau vÒ vËt chÊt di truyÒn nh− vËy cã thÓ ®−îc khai th¸c trong c¸c nghiªn cøu vÒ c¸c rèi lo¹n di truyÒn kh¸c ë ng−êi. NÕu c¸c nhµ
� H×nh 21.15 Mèi quan hÖ tiÕn hãa cña ba liªn giíi (l·nh giíi) sinh vËt. S¬ ®å h×nh c©y nµy cho thÊy sù ph©n ly tõ cæ x−a cña ba l·nh giíi vi khuÈn, vi khuÈn cæ vµ sinh vËt nh©n thËt. Mét phÇn cña nh¸nh tiÕn hãa cña sinh vËt nh©n thËt ®−îc t¸ch riªng cho thÊy sù ph©n ly cña ba loµi sinh vËt nh©n thËt ®−îc ®Ò cËp ®Õn ë ch−¬ng nµy.
Vi khuÈn
Tæ tiªn chung gÇn nhÊt cña tÊt c¶ c¸c d¹ng sèng hiÖn nay
Sinh vËt nh©n thËt
Vi khuÈn cæ
Tû n¨m tr−íc
Tinh tinh
Ng−êi
Chuét
TriÖu n¨m tr−íc
444 khèi kiÕn thøc 3 Di truyÒn häc
nghiªn cøu ®· biÕt c¸c m« vµ c¬ quan bÞ ¶nh h−ëng bëi mét rèi lo¹n di truyÒn nhÊt ®Þnh, hä cã thÓ t×m ra c¸c gen ®−îc biÓu hiÖn ë nh÷ng vÞ trÝ ®ã trong c¸c thÝ nghiÖm ®−îc tiÕn hµnh trªn chuét. H−íng nghiªn cøu nµy ®· gióp lµm s¸ng tá mét sè gen ®¸ng quan t©m ë ng−êi, bao gåm c¶ gen gãp phÇn g©y nªn héi chøng §ao.
C¸c nç lùc kh¸c ®ang tiÕp tôc ®−îc triÓn khai nh»m më réng c¸c nghiªn cøu hÖ gen ë c¸c loµi vi sinh vËt, c¸c loµi linh tr−ëng kh¸c, kÓ c¶ c¸c loµi ®· tõng bÞ l·ng quªn thuéc c¸c nh¸nh kh¸c nhau cña c©y sù sèng. Nh÷ng nghiªn cøu nµy gióp n©ng cao hiÓu biÕt cña chóng ta vÒ tÊt c¶ c¸c khÝa c¹nh sinh häc kh¸c nhau, bao gåm søc kháe vµ sinh th¸i còng nh− tiÕn hãa.
� H×nh 21.16 T×m hiÓu
ThÝ nghiÖm
KÕt qu¶
KÕt luËn
Nguån
§iÒu g× nÕu ?
Mét sè b»ng chøng ®· ñng hé cho gi¶ thiÕt vÒ vai trß cña gen FOXP2 trong qu¸ tr×nh ph¸t triÓn lêi nãi vµ ng«n ng÷ ë ng−êi vµ kh¶ n¨ng ph¸t ©m (ph¸t tiÕng) ë mét sè ®éng vËt cã x−¬ng sèng kh¸c. N¨m 2005, Joseph Buxham vµ c¸c céng sù t¹i Tr−êng §¹i häc Y khoa Mount Sinai vµ mét sè viÖt nghiªn cøu kh¸c ®· tiÕn hµnh t×m hiÓu chøc n¨ng cña gen FOXP2. Hä ®· sö dông chuét, lµ sinh vËt m« h×nh dÔ bÊt ho¹t gen, nh− mét ®éng vËt cã x−¬ng sèng cã kh¶ n¨ng ph¸t ©m ®¹i diÖn. Chuét ph¸t ra ©m thanh siªu ©m cã ©m vùc cao, gièng nh− tiÕng “rÝt”, mçi khi diÔn ®¹t tr¹ng th i̧ “stress”. C¸c nhµ nghiªn cøu ®· ¸p dông kü thuËt di truyÒn ®Ó t¹o ra c¸c con chuét cã mét hoÆc hai b¶n sao cña gen FOXP2 bÞ ph¸ háng.
KiÓu d¹i : cã hai b¶n sao gen FOXP2 b×nh th−êng
Chøc n¨ng cña gen FOXP2 lµ g× mµ nã l¹i tiÕn hãa nhanh trong qu ̧tr×nh h×nh thµnh loµi ng−êi?
Gen FOXP2 gi÷ vai trß quan träng trong sù ph¸t triÓn hÖ thèng liªn l¹c b»ng ©m thanh ë chuét. KÕt qu¶ nghiªn cøu nµy cñng cè thªm b»ng chøng cho c¸c nghiªn cøu ë chim vµ ng−êi cho thÊy gen FOX2P cã thÓ ho¹t ®éng chøc n¨ng gièng nhau ë nhiÒu loµi ®éng vËt kh¸c nhau.
Do kÕt qu¶ nghiªn cøu nµy ñng hé gi¶ thiÕt vÒ vai trß cña gen FOXP2 trong kh¶ n¨ng ph¸t ©m ë chuét, b¹n cã thÓ b¨n kho¨n liÖu protein FOXP2 cã ph¶i lµ protein cã vai trß ®iÒu hßa chÝnh trong kh¶ n¨ng ph¸t triÓn lêi nãi ë ng−êi hay kh«ng. NÕu biÕt tr×nh tù axit amin cña c¸c protein FOXP2 b×nh th−êng vµ ®ét biÕn ë ng−êi, còng nh− cña protein FOXP2 ë tinh tinh. B»ng c¸ch nµo b¹n kiÓm chøng ®−îc c©u hái trªn? Nh÷ng th«ng tin bæ sung nµo kh¸c cã thÓ t×m thÊy khi so s¸nh nh÷ng tr×nh tù nµy víi tr×nh tù axit amin cña protein FOXP2 ë chuét ?
KiÓu d¹i
(Kh«ng cã tiÕng "rÝt")
DÞ hîp tö: mét b¶n sao gen FOXP2 bÞ ph¸ háng
§ång hîp tö: c¶ hai b¶n sao gen FOXP2 bÞ ph¸ háng
DÞ hîp tö
§ång hîp tö
Sè tiÕng "rÝt"
KiÓu d¹i DÞ hîp tö §ång hîp tö
Hä sau ®ã so s¸nh kiÓu h×nh cña c¸c con chuét nµy. Hai ®Æc ®iÓm mµ hä ®· theo dâi ®−îc m« t¶ ë ®©y, ®ã lµ: gi¶i phÉu n·o vµ kh¶ n¨ng ph¸t tiÕng.
ThÝ nghiÖm 1: C¸c nhµ nghiªn cøu c¾t n·o chuét thµnh c¸c l¸t c¾t máng råi nhuém chóng víi c¸c hãa chÊt phï hîp ®Ó cã thÓ quan s¸t ®−îc cÊu tróc gi¶i phÉu cña n·o d−íi kÝnh hiÓn vi huúnh quang nguån s¸ng UV.
ThÝ nghiÖm 2: C¸c nhµ nghiªn cøu t¸ch c¸c con chuét con míi sinh ra khái mÑ cña chóng vµ ghi ©m sè tiÕng “rÝt” siªu ©m do chuét con ph¸t ra.
ThÝ nghiÖm 1: Sù ph¸ háng c¶ hai b¶n sao gen FOXP2 dÉn ®Õn sù bÊt th−êng trong cÊu tróc n·o, biÓu hiÖn ë sù hçn ®én cña c¸c tÕ bµo. ¶nh h−ëng kiÓu h×nh ®èi víi c¸ thÓ dÞ hîp tö ë møc ®é Ýt nghiªm träng h¬n.
ThÝ nghiÖm 2: Sù ph¸ háng c¶ hai b¶n sao gen FOXP2 dÉn ®Õn viÖc mÊt kh¶n¨ng ph¸t tiÕng khi ®¸p øng l¹i víi “stress”. ¶nh h−ëng ®èi víi kh¶ n¨ng ph¸t tiÕng cña dÞ hîp tö lµ ®¸ng kÓ.
Ch−¬ng 21 C¸c hÖ gen vµ sù tiÕn hãa cña chóng 445
So s¸nh hÖ gen trong ph¹m vi mét loµi Mét triÓn väng s¸ng sña kh¸c b¾t nguån tõ kh¶ n¨ng chóng ta cã thÓ ph©n tÝch c¸c hÖ gen lµ chóng ta sÏ ngµy cµng hiÓu biÕt h¬n vÒ phæ biÕn dÞ di truyÒn ë ng−êi. Do lÞch sö cña loµi ng−êi t−¬ng ®èi ng¾n - cã lÏ chØ kho¶ng 200.000 n¨m - nªn møc ®é biÕn dÞ di truyÒn ë ng−êi lµ nhá khi so s¸nh víi nhiÒu loµi kh¸c. PhÇn nhiÒu sù ®a d¹ng cña chóng ta d−êng nh− lµ do c¸c ®a h×nh ®¬n nucleotit (SNP, ®· ®−îc m« t¶ ë Ch−¬ng 20), th−êng ®−îc ph¸t hiÖn b»ng gi¶i tr×nh tù ADN. Trong hÖ gen ng−êi, c¸c SNP xuÊt hiÖn trung b×nh víi tÇn sè mét trong mçi ®o¹n tõ 100 ®Õn 300 cÆp baz¬. C¸c nhµ khoa häc ®· x¸c ®Þnh ®−îc vÞ trÝ cña vµi triÖu SNP
trong hÖ gen ng−êi vµ sÏ tiÕp tôc t×m thªm c¸c vÞ trÝ míi. Trong qu¸ tr×nh triÓn khai h−íng nghiªn cøu nµy, hä còng ®· t×m ra nhiÒu d¹ng biÕn dÞ kh¸c - gåm ®¶o ®o¹n, mÊt ®o¹n vµ lÆp ®o¹n - nh−ng kh«ng cã biÓu hiÖn g©y h¹i râ rÖt ®èi víi c¸c c¬ thÓ mang chóng. Nh÷ng d¹ng biÕn dÞ nµy, còng nh− c¸c SNP, sÏ lµ nh÷ng dÊu chuÈn di truyÒn hiÖu qu¶ trong nghiªn cøu tiÕn hãa ë ng−êi, trong viÖc ph¸t hiÖn c¸c kh¸c biÖt gi÷a c¸c quÇn thÓ ng−êi, vµ t×m ra con ®−êng di c− cña c¸c quÇn thÓ ng−êi qua lÞch sö. Sù ®a d¹ng di truyÒn nh− vËy trong ADN cña ng−êi còng sÏ lµ nh÷ng dÊu chuÈn cã gi¸ trÞ ®Ó x¸c ®Þnh ®−îc c¸c gen g©y bÖnh còng nh− c¸c gen cã nh÷ng ¶nh h−ëng ®Õn søc kháe cña chóng ta mét c¸ch Ýt râ rµng h¬n. Ngoµi viÖc cung cÊp cho chóng ta nh÷ng th«ng tin vÒ qu¸ tr×nh tiÕn hãa, viÖc ph©n tÝch nh÷ng ®Æc ®iÓm kh¸c biÖt trong hÖ gen cña c¸c c¸ thÓ cã thÓ sÏ lµm thay ®æi c¸c liÖu ph¸p y häc sau nµy trong thÕ kû 21.
So s¸nh qu¸ tr×nh ph¸t triÓn C¸c nhµ sinh häc thuéc lÜnh vùc sinh häc tiÕn hãa - ph¸t triÓn hay cßn th−êng ®−îc gäi t¾t lµ evo-devo th−êng tiÕn hµnh so s¸nh c¸c qu¸ tr×nh ph¸t triÓn cña c¸c c¬ thÓ ®a bµo kh¸c nhau. Môc tiªu cña hä lµ t×m hiÓu nh÷ng qu¸ tr×nh nµy ®· tiÕn hãa nh− thÕ nµo vµ b»ng c¸ch nµo nh÷ng thay ®æi trong qu¸ tr×nh ph¸t triÓn cã thÓ lµm biÕn ®æi nh÷ng ®Æc ®iÓm cña c¬ thÓ hoÆc thËm chÝ dÉn ®Õn sù h×nh thµnh c¸c ®Æc ®iÓm míi. Nhê c¸c tiÕn bé trong kü thuËt ph©n tö vµ lµn sãng th«ng tin vÒ c¸c hÖ gen gÇn ®©y, chóng ta b¾t ®Çu nhËn ra r»ng ë c¸c loµi cã quan hÖ hä hµng, dï cho chóng cã h×nh d¹ng kh¸c nhau râ rÖt, song sù kh¸c biÖt trong tr×nh tù cña c¸c gen còng nh− sù ®iÒu hßa biÓu hiÖn cña chóng th−êng rÊt nhá. ViÖc ph¸t hiÖn ra c¬ së ph©n tö dÉn ®Õn nh÷ng kh¸c biÖt nµy ®ång thêi gióp chóng ta cã ®−îc nh÷ng hiÓu biÕt vÒ nguån gèc cña v« sè c¸c d¹ng sèng ®a d¹ng ®ang cïng chung sèng trªn hµnh tinh nµy, qua ®ã cung cÊp th«ng tin cho c¸c nghiªn cøu tiÕn hãa cña chóng ta.
TÝnh b¶o tån phæ biÕn cña c¸c gen ®iÒu khiÓn ph¸t triÓn ë c¸c loµi ®éng vËt ë Ch−¬ng 18, chóng ta ®· ®Ò cËp ®Õn c¸c gen ®iÒu khiÓn ph¸t triÓn (homeotic genes) ë ruåi Drosophila cã vai trß cña chóng trong viÖc x¸c ®Þnh sù ph©n ®èt c¬ thÓ (xem H×nh 18.18). ViÖc ph©n tÝch ph©n tö c¸c gen ®iÒu khiÓn ph¸t triÓn ë Drosophila cho thÊy tÊt c¶ c¸c c¸ thÓ ®Òu cã mét tr×nh tù dµi 180 nucleotit ®−îc gäi lµ hép ®iÒu khiÓn (homeobox) m· hãa cho mét miÒn ®iÒu khiÓn (homeodomain) gåm 60 axit amin trong ph©n tö protein. Mét tr×nh tù gièng hÖt hoÆc rÊt gièng víi homeobox cña ruåi giÊm ®Õn nay ®· ®−îc t×m thÊy trong c¸c gen ®iÒu khiÓn ë nhiÒu loµi ®éng vËt cã x−¬ng sèng vµ kh«ng x−¬ng sèng. Nh÷ng tr×nh tù nµy gi÷a ng−êi vµ ruåi giÊm gièng nhau
®Õn nçi, trong thùc tÕ, mét nhµ nghiªn cøu ®· vÝ von “ruåi lµ nh÷ng con ng−êi nhá mang c¸nh”. Sù gièng nhau cña nh÷ng gen nµy cßn biÓu hiÖn ë c¸ch tæ chøc cña chóng: C¸c gen ë ®éng vËt cã x−¬ng sèng t−¬ng ®ång víi c¸c gen ®iÒu khiÓn ph¸t triÓn ë ruåi giÊm gièng hÖt nhau vÒ c¸ch s¾p xÕp trªn nhiÔm s¾c thÓ (H×nh 21.17). C¸c tr×nh tù chøa homeobox còng ®−îc t×m thÊy ë c¸c gen ®iÒu hßa ë nhiÒu sinh vËt nh©n thËt cã quan hÖ hä hµng rÊt xa nhau, ch¼ng h¹n nh− gi÷a thùc vËt vµ nÊm men. Tõ nh÷ng ®Æc ®iÓm gièng nhau nµy, chóng ta cã thÓ suy ra r»ng tr×nh tù ADN cña homeobox ®· h×nh thµnh tõ rÊt sím trong lÞch sö tiÕn hãa cña sù sèng vµ vai trß cña chóng ®èi víi c¸c c¬ thÓ
� H×nh 21.17 Sù b¶o thñ cña gen ®iÒu khiÓn ph¸t triÓn (homeotic genes) ë ruåi giÊm vµ chuét. C¸c gen ®iÒu khiÓn ph¸t triÓn cã vai trß ®iÒu phèi sù h×nh thµnh c¸c cÊu tróc ®Çu - ®u«i cña c¬ thÓ xuÊt hiÖn trªn nhiÔm s¾c thÓ theo c¸c trËt tù rÊt gièng nhau gi÷a ruåi Drosophila vµ chuét. Mçi b¨ng ®−îc t« mµu trªn nhiÔm s¾c thÓ ë ®©y biÓu diÔn cho mét gen “homeotic”. ë ruåi giÊm, tÊt c¶ c¸c gen ®iÒu khiÓn ph¸t triÓn ®−îc t×m thÊy trªn cïng mét nhiÔm s¾c thÓ. Chuét vµ c¸c loµi ®éng vËt cã vó kh¸c cã c¸c bé gen gièng nhau hoÆc gièng hÖt nhau ph©n bè trªn bèn nhiÔm s¾c thÓ kh¸c nhau. C¸c khèi mµu ®−îc vÏ trªn h×nh biÓu diÔn c¸c phÇn cña ph«i mµ ë ®ã nh÷ng gen cã mµu nµy ®−îc biÓu hiÖn mµ cuèi cïng dÉn ®Õn sù h×nh thµnh c¸c phÇn t−¬ng øng ë c¬ thÓ tr−ëng thµnh. Nh÷ng gen nµy gièng hÖt nhau khi so s¸nh gi÷a ruåi giÊm vµ chuét, ngo¹i trõ c¸c gen ®−îc t« mµu ®en, chóng gièng nhau Ýt h¬n so víi nh÷ng gen kia.
Ruåi giÊm tr−ëng thµnh
Ph«i ruåi giÊm (10 giê)
NhiÔm s¾c thÓ cña ruåi giÊm
Chuét tr−ëng thµnh
Ph«i chuét (12 ngµy)
C¸c nhiÔm s¾c thÓ cña chuét
446 khèi kiÕn thøc 3 Di truyÒn häc
quan träng ®Õn møc d−êng nh− chóng kh«ng biÕn ®æi qua hµng tr¨m triÖu n¨m ë c¶ ®éng vËt vµ thùc vËt. C¸c gen ®iÒu khiÓn ph¸t triÓn ë ®éng vËt ®−îc gäi ®Æt tªn lµ
c¸c gen Hox (viÕt t¾t cña c¸c gen mang tr×nh tù homeobox), bëi v× nh÷ng gen ®iÒu khiÓn ph¸t triÓn ®Çu tiªn ®−îc t×m thÊy chøa tr×nh tù homeobox. Cã nh÷ng gen chøa homeobox sau nµy ®−îc t×m thÊy kh«ng ho¹t ®éng nh− c¸c gen ®iÒu khiÓn ph¸t triÓn; nghÜa lµ chóng kh«ng trùc tiÕp x¸c ®Þnh c¸c phÇn vµ vÞ trÝ c¸c phÇn cña c¬ thÓ. Tuy vËy, phÇn lín nh÷ng gen nµy, Ýt nhÊt ë ®éng vËt, ®Òu liªn quan ®Õn qu¸ tr×nh ph¸t triÓn, qua ®ã cho thÊy chóng cã vai trß quan träng c¬ b¶n trong qu¸ tr×nh ph¸t triÓn vµ ®· xuÊt hiÖn tõ l©u trong qu¸ tr×nh tiÕn hãa. VÝ dô, ë Drosophila, c¸c tr×nh tù homeobox kh«ng chØ t×m thÊy trong c¸c gen ®iÒu khiÓn ph¸t triÓn mµ c¶ ë gen x¸c ®Þnh tÝnh ph©n cùc cña trøng cã tªn lµ bicoid (xem Ch−¬ng 18), ngoµi ra, nã cßn ®−îc t×m thÊy ë mét sè gen x¸c ®Þnh tÝnh ph©n ®èt vµ mét gen ®iÒu hßa qu¸ tr×nh ph¸t triÓn cña m¾t. C¸c nhµ nghiªn cøu ®· ph¸t hiÖn ra r»ng c¸c miÒn ®iÒu
khiÓn ®−îc m· hãa bëi homeobox lµ phÇn protein liªn kÕt víi ADN khi protein cã vai trß lµ mét yÕu tè phiªn m·. Tuy nhiªn, cÊu h×nh cña miÒn ®iÒu khiÓn cho phÐp nã liªn kÕt ®−îc víi mäi ph©n ®o¹n ADN; nghÜa lµ, b¶n th©n chóng kh«ng tù x¸c ®Þnh ®−îc mét tr×nh tù ADN ®Æc thï. Thay vµo ®ã, nh÷ng miÒn kh¸c trong ph©n tö protein chøa miÒn ®iÒu khiÓn, vèn cã møc ®é biÕn dÞ lín h¬n, míi x¸c ®Þnh gen nµo sÏ ®−îc nh÷ng protein nµy ®iÒu khiÓn. Sù t−¬ng t¸c gi÷a nh÷ng miÒn võa ®−îc nh¾c ®Õn ë sau víi nh÷ng yÕu tè phiªn m· kh¸c n÷a gióp cho c¸c protein mang miÒn ®iÒu khiÓn cã thÓ nhËn ra c¸c tr×nh tù t¨ng c−êng (enhancer) ®Æc thï trªn ph©n tö ADN. C¸c protein cã homeodomain cã thÓ ®· ®iÒu hßa qu¸ tr×nh ph¸t triÓn b»ng viÖc
®iÒu phèi ho¹t ®éng phiªn m· cña nh÷ng bé (tËp hîp) gen sinh tr−ëng kh¸c nhau, lµm chóng “bËt” hay “t¾t”. ë ph«i cña Drosophila vµ nhiÒu loµi ®éng vËt kh¸c, nh÷ng tæ hîp kh¸c nhau cña c¸c gen homeobox ®−îc ho¹t hãa ë nh÷ng phÇn kh¸c nhau. Sù biÓu hiÖn chän läc cña nh÷ng gen ®iÒu hßa nh− vËy, vèn kh¸c nhau vÒ thêi gian vµ vÞ trÝ trong qu¸ tr×nh ph¸t triÓn cña ph«i, lµ trung t©m cña sù h×nh thµnh mÉu h×nh c¬ thÓ. Bªn c¹nh c¸c gen ®iÒu khiÓn ph¸t triÓn, c¸c nhµ sinh häc
ph¸t triÓn cßn t×m thÊy nhiÒu gen kh¸c liªn quan ®Õn qu¸ tr×nh ph¸t triÓn vµ cã tÝnh b¶o thñ rÊt cao khi so s¸nh gi÷a c¸c loµi. Nh÷ng gen nµy bao gåm nhiÒu gen m· hãa cho c¸c thµnh phÇn cña c¸c con ®−êng truyÒn tÝn hiÖu. Sù gièng nhau mét c¸ch ®Æc biÖt gi÷a c¸c gen sinh tr−ëng nhÊt ®Þnh ë c¸c loµi ®éng vËt kh¸c nhau lµm n¶y sinh mét c©u hái: B»ng c¸ch nµo nh÷ng gen gièng nhau cã thÓ cïng tham gia vµo qu¸ tr×nh ph¸t triÓn ë nh÷ng loµi ®éng vËt mµ h×nh d¹ng cña chóng rÊt kh¸c nhau ? Nh÷ng nghiªn cøu gÇn ®©y ®· gãp phÇn gîi ý c©u tr¶ lêi ®èi
víi c©u hái nµy. Trong mét sè tr−êng hîp, nh÷ng thay ®æi nhá trong tr×nh tù ®iÒu khiÓn cña nh÷ng gen nhÊt ®Þnh cã thÓ lµm thay ®æi kiÓu biÓu hiÖn cña gen dÉn ®Õn nh÷ng thay ®æi lín vÒ h×nh d¹ng c¬ thÓ. H·y xem vÝ dô sau: c¸c kiÓu biÓu hiÖn kh¸c nhau cña c¸c gen Hox däc theo trôc c¬ thÓ ë c«n trïng vµ gi¸p x¸c cã thÓ gi¶i thÝch cho c¸c d¹ng biÕn dÞ vÒ sè c¸c ®èt th©n cã ch©n ë c¸c loµi ®éng vËt ph©n ®èt (H×nh 21.18). T−¬ng tù nh− vËy, nh÷ng nghiªn cøu gÇn ®©y chØ ra r»ng cïng mét s¶n phÈm cña gen Hox cã thÓ g©y nªn nh÷ng hiÖu øng kh¸c nhau ®«i chót ë nh÷ng loµi kh¸c nhau, gióp “bËt” nh÷ng gen míi hoÆc “bËt” nh÷ng gen gièng nhau song ë møc ®é biÓu hiÖn t¨ng lªn hoÆc gi¶m ®i. Trong nh÷ng tr−êng hîp kh¸c, cã nh÷ng gen gièng nhau nh−ng ®iÒu khiÓn c¸c qu¸ tr×nh ph¸t triÓn kh¸c nhau khi
xÐt ë c¸c loµi kh¸c nhau, dÉn ®Õn sù ®a d¹ng vÒ h×nh d¹ng c¬ thÓ. Ch¼ng h¹n nh−, mét sè gen Hox ®−îc biÓu hiÖn trong giai ®o¹n ph«i vµ Êu trïng ë loµi nhÝm biÓn vèn lµ mét loµi ®éng vËt kh«ng thuéc nhãm ph©n ®èt vµ cã s¬ ®å c¬ thÓ kh¸c hoµn toµn so víi c«n trïng vµ chuét. C¸c con nhÝm biÓn tr−ëng thµnh cã h×nh d¹ng c¬ thÓ nh− nh÷ng “chiÕc gèi c¾m kim”. Chóng thuéc nhãm loµi tõ l©u ®−îc dïng cho nghiªn cøu ph«i häc kinh ®iÓn (xem Ch−¬ng 47).
So s¸nh qu¸ tr×nh ph¸t triÓn gi÷a ®éng vËt vµ thùc vËt Tæ tiªn chung gÇn nhÊt cña ®éng vËt vµ thùc vËt cã lÏ lµ mét sinh vËt nh©n thËt ®¬n bµo sèng c¸ch ®©y hµng tr¨m triÖu n¨m; do vËy, c¸c qu¸ tr×nh ph¸t triÓn h¼n lµ ®· tiÕn hãa ®éc lËp víi nhau t¹o nªn hai nh¸nh sinh vËt ®a bµo. Thùc vËt tiÕn hãa cïng víi sù xuÊt hiÖn thµnh tÕ bµo cøng, g©y ng¨n c¶n sù vËn ®éng cña c¸c m« vµ tÕ bµo vèn lµ ®Æc ®iÓm quan träng ë ®éng vËt. Thay vµo ®ã, sù ph¸t sinh h×nh th¸i ë thùc vËt chñ yÕu phô thuéc vµo sù h×nh thµnh c¸c mÆt ph¼ng ph©n bµo kh¸c nhau vµ tÝnh gi·n në chän läc cña tÕ bµo. (Chóng ta sÏ ®Ò cËp
� H×nh 21.18 ¶nh h−ëng cña sù ®iÒu hßa biÓu hiÖn gen Hox kh¸c nhau trong qu¸ tr×nh ph¸t triÓn ë gi¸p x¸c vµ c«n trïng. Nh÷ng thay ®æi vÒ kiÓu biÓu hiÖn cña bèn gen Hox ®· diÔn ra qua thêi gian tiÕn hãa. Nh÷ng thay ®æi nµy phÇn nµo gi¶i thÝch cho sù kh¸c biÖt vÒ s¬ ®å c¬ thÓ gi÷a loµi t«m biÓn Artemia (mét loµi gi¸p x¸c, h×nh trªn) víi loµi ch©u chÊu (mét loµi c«n trïng, h×nh d−íi). §−îc minh häa ë ®©y lµ c¸c phÇn c¬ thÓ ®−îc t« mµu nh»m ph¶n ¸nh sù biÓu hiÖn cña c¸c gen Hox kh¸c nhau cã vai trß x¸c ®Þnh c¸c phÇn c¬ thÓ trong qu¸ tr×nh ph¸t triÓn ph«i. Mçi mµu ®¹i diÖn cho mét gen Hox ®Æc thï.
Ngùc C¸c ®èt sinh dôc Bông
Ngùc Bông
Ch−¬ng 21 C¸c hÖ gen vµ sù tiÕn hãa cña chóng 447
vÒ nh÷ng qu¸ tr×nh nµy ë Ch−¬ng 35.) Tuy cã nhiÒu kh¸c biÖt gi÷a ®éng vËt vµ thùc vËt, nh−ng c¸c c¬ chÕ ph©n tö cña qu¸ tr×nh ph¸t triÓn ë ®éng vËt vµ thùc vËt cã nhiÒu ®iÓm gièng nhau; cã lÏ, ®ã lµ di s¶n chung mµ chóng thõa h−ëng tõ t« tiªn.
ë c¶ ®éng vËt vµ thùc vËt, qu¸ tr×nh ph¸t triÓn phô thuéc vµo mét chuçi (gåm nhiÒu m¾t xÝch cña) c¸c yÕu tè ®iÒu hßa phiªn m· cã vai trß “bËt” hoÆc “t¾t” c¸c gen kh¸c nhau theo c¸c thø tù ®−îc ®iÒu khiÓn tinh vi. VÝ dô nh−, mét sè nghiªn cøu ë mét loµi thùc vËt cã hoa nhá thuéc hä mï t¹t lµ Arabidopsis thaliana cho thÊy sù s¾p xÕp táa trßn cña c¸c phÇn thuéc hoa còng gièng nh− sù h×nh thµnh trôc ®Çu - ®u«i ë Drosophila ®Òu liªn quan ®Õn mét chuçi c¸c yÕu tè phiªn m·. Tuy vËy, nh÷ng gen ®iÒu khiÓn nh÷ng qu¸ tr×nh nµy l¹i kh¸c nhau ®¸ng kÓ gi÷a ®éng vËt vµ thùc vËt. NÕu nh− kh¸ nhiÒu c¸c “c«ng t¾c ®iÒu hßa” ë Drosophila lµ c¸c gen Hox mang c¸c homeobox, th× c¸c gen ë Arabidopsis thuéc mét hä gen hoµn toµn kh¸c, ®−îc gäi lµ c¸c gen Mads-box. MÆc dï c¸c gen chøa c¸c homebox còng ®−îc t×m thÊy ë thùc vËt, còng nh− c¸c gen Mads-box còng ®−îc t×m thÊy ë ®éng vËt, song trong c¶ hai tr−êng hîp chóng kh«ng thùc hiÖn nh÷ng vai trß chÝnh gièng nhau trong qu¸ tr×nh ph¸t triÓn gièng nh− ë nhãm kia. Nh− vËy, c¸c b»ng chøng ph©n tö ñng hé cho gi¶ thiÕt r»ng: “ch−¬ng tr×nh ph¸t triÓn” ®· tiÕn hãa ®éc lËp víi nhau ë ®éng vËt vµ thùc vËt. Qua ch−¬ng cuèi cïng nµy thuéc khèi kiÕn thøc di truyÒn
häc, chóng ta ®· biÕt b»ng c¸ch nµo c¸c nghiªn cøu vÒ thµnh phÇn c¸c hÖ gen vµ so s¸nh hÖ gen gi÷a c¸c loµi cã thÓ lµm s¸ng tá qu¸ tr×nh tiÕn hãa cña c¸c hÖ gen. Ngoµi ra, b»ng viÖc so
s¸nh “ch−¬ng tr×nh ph¸t triÓn”, chóng ta cã thÓ thÊy sù thèng nhÊt cña sinh giíi ®−îc biÓu hiÖn qua sù gièng nhau vÒ c¸c c¬ chÕ ph©n tö vµ tÕ bµo ®−îc dïng ®Ó thiÕt lËp nªn c¸c mÉu h×nh c¬ thÓ, mÆc dï c¸c gen ®iÒu khiÓn qu¸ tr×nh ph¸t triÓn cã thÓ kh¸c nhau gi÷a c¸c sinh vËt kh¸c nhau. Sù gièng nhau gi÷a c¸c hÖ gen ®ång thêi ph¶n ¸nh tæ tiªn chung cña tÊt c¶ c¸c d¹ng sèng trªn Tr¸i ®Êt. Nh−ng sù kh¸c nhau còng lµ ®¸ng kÓ, tõ ®ã chóng ®· t¹o nªn sù ®a d¹ng phong phó cña c¸c loµi qua tiÕn hãa. Trong phÇn cßn l¹i cña cuèn s¸ch nµy, chóng ta sÏ më réng tÇm quan s¸t ra khái c¸c cÊp ®é ph©n tö, tÕ bµo vµ gen ®Ó kh¸m ph¸ sù ®a d¹ng cña sinh vËt ë cÊp ®é c¬ thÓ.
Tæng kÕt Ch−¬ng
H·y tham kh¶o c¬ së häc liÖu gåm c¸c h×nh ¶nh ®éng ba chiÒu, c¸c bµi h−íng dÉn d¹ng file MP3, video, c¸c bµi kiÓm tra thùc hµnh, eBook vµ nhiÒu häc liÖu kh¸c t¹i ®Þa chØ Web www.masteringbio.com
C¸c ph−¬ng ph¸p míi ®� gióp gia t¨ng tèc ®é gi¶i tr×nh tù c¸c hÖ gen (c¸c trang 427 –––– 429)
� Gi¶i tr×nh tù hÖ gen qua ba giai ®o¹n: Trong giai ®o¹n lËp b¶n ®å liªn kÕt, trËt tù cña c¸c gen vµ c¸c dÊu chuÈn di truyÒn kh¸c trong hÖ gen vµ kho¶ng c¸ch t−¬ng ®èi gi÷a chóng cã thÓ ®−îc x¸c ®Þnh th«ng qua c¸c tÇn sè t¸i tæ hîp. Trong giai ®o¹n tiÕp theo, b¶n ®å vËt lý dïng c¸c tr×nh tù gèi lªn nhau cña c¸c ph©n ®o¹n ADN ®Ó s¾p xÕp c¸c ph©n ®o¹n nµy vµo ®óng trËt tù cña chóng trong hÖ gen, ®ång thêi x¸c ®Þnh kho¶ng c¸ch gi÷a c¸c dÊu chuÈn tÝnh theo ®¬n vÞ cÆp baz¬. Cuèi cïng, ë giai ®o¹n thø ba, c¸c ph©n ®o¹n ADN ®· theo ®óng trËt tù ®−îc gi¶i tr×nh tù, tõ ®ã chóng ta thu ®−îc tr×nh tù hÖ gen ®Çy ®ñ.
� Gi¶i tr×nh tù ngÉu nhiªn toµn hÖ gen: Toµn hÖ gen ®−îc ph©n c¾t thµnh nhiÒu ®o¹n nhá, gèi lªn nhau. Nh÷ng ®o¹n nµy sau ®ã ®−îc gi¶i tr×nh tù, råi ®−îc r¸p nèi l¹i thµnh c¸c tr×nh tù hoµn chØnh nhê phÇn mÒm m¸y tÝnh. NÕu cã s½n c¸c th«ng tin vÒ b¶n ®å di truyÒn, th× viÖc r¸p nèi sÏ thuËn lîi vµ chÝnh x¸c.
Tãm t¾t c¸c kh¸i niÖm chÝnh
§a ph−¬ng tiÖn Ho¹t ®éng Dù ¸n hÖ gen ng−êi: C¸c gen trªn NST sè 17 cña ng−êi C¸c nhµ khoa häc øng dông tin sinh häc ®Ó ph©n tÝch c¸c hÖ gen vµ chøc n¨ng cña chóng (c¸c trang 429 –––– 432)
� TËp hîp d÷ liÖu ®Ó ph©n tÝch c¸c hÖ gen NhiÒu trang web trªn Internet cung cÊp tµi nguyªn truy cËp vµ t×m kiÕm tr×nh tù cña c¸c hÖ gen, c¸c c«ng cô ph©n tÝch còng nh− c¸c th«ng tin kh¸c cã liªn quan ®Õn c¸c hÖ gen.
� X¸c ®Þnh c¸c gen m� hãa protein trong c¸c tr×nh tù ADN ViÖc ph©n tÝch c¸c tr×nh tù hÖ gen nhê m¸y tÝnh gióp c¸c nhµ nghiªn cøu x¸c ®Þnh ®−îc c¸c tr×nh tù nhiÒu kh¶ n¨ng m· hãa cho c¸c protein. ViÖc so s¸nh c¸c tr×nh tù cña c¸c gen "míi" víi c¸c gen ®· biÕt ë nh÷ng loµi kh¸c cã thÓ gióp x¸c ®Þnh chøc n¨ng cña c¸c gen míi. §èi víi gen ch−a râ chøc n¨ng, viÖc g©y bÊt ho¹t gen thùc nghiÖm vµ quan s¸t hiÖu qu¶ kiÓu h×nh thu ®−îc cã thÓ cung cÊp ®Çu míi th«ng tin vÒ chøc n¨ng cña chóng.
� T×m hiÓu c¸c gen vµ c¸c s¶n phÈm cña gen ë cÊp ®é sinh häc hÖ thèng B»ng viÖc sö dông m¸y tÝnh vµ c¸c c«ng cô sinh tin häc, c¸c nhµ khoa häc cã thÓ so s¸nh c¸c hÖ gen vµ nghiªn cøu tËp hîp c¸c gen vµ protein nh− c¸c hÖ thèng hoµn chØnh (hÖ gen häc vµ hÖ protein häc). Nh÷ng nghiªn cøu nµy bao gåm c¸c ph©n tÝch vÒ t−¬ng t¸c protein ë quy m« lín.
§a ph−¬ng tiÖn
Kh¸i niÖm 21.2
Kh¸i niÖm 21.1
21.6
1. Theo b¹n, hÖ gen cña khØ gièng hÖ gen cña chuét h¬n hay gièng hÖ gen cña ng−êi h¬n? T¹i sao?
2. C¸c tr×nh tù ADN ®−îc gäi lµ c¸c homeobox, gióp c¸c gen ®iÒu khiÓn ph¸t triÓn ë ®éng vËt cã thÓ ®iÒu phèi ®−îc qu¸ tr×nh ph¸t triÓn, rÊt gièng nhau gi÷a ruåi vµ chuét. H·y gi¶i thÝch t¹i sao mÆc dï cã sù gièng nhau nµy, nh−ng h×nh th¸i cña c¸c ®éng vËt nµy lµ rÊt kh¸c nhau.
3. C¸c yÕu tè Alu trong hÖ gen ng−êi nhiÒu gÊp 3 lÇn so víi hÖ gen tinh tinh. Theo b¹n, b»ng c¸ch nµo hÖ gen ng−êi cã thªm nh÷ng b¶n sao cña c¸c yÕu tè Alu? H·y nªu mét vai trß cã thÓ cã cña yÕu tè Alu trong qu¸ tr×nh tiÕn hãa ph©n ly gi÷a hai loµi.
Xem gîi ý tr¶ lêi ë Phô lôc A.
KiÓm tra kh¸i niÖm
®iÒu g× NÕu
448 khèi kiÕn thøc 3 Di truyÒn häc
C¸c hÖ gen kh¸c nhau vÒ kÝch cì, sè gen vµ mËt ®é gen (c¸c trang 432 – 434)
Vi khuÈn Vi khuÈn cæ Sinh vËt nh©n thËt
KÝch cì hÖ gen
PhÇn lín trong kho¶ng 1 - 6 Mb
PhÇn lín trong kho¶ng 10 - 4000
Mb, nh−ng mét sè lín h¬n
Sè gen 1500 - 7500 5000 - 40.000
MËt ®é gen
Cao h¬n so víi sinh vËt nh©n thËt
ThÊp h¬n so víi sinh vËt nh©n s¬
(Trong c¸c sinh vËt nh©n thËt, mËt ®é gen thÊp h¬n ë c¸c hÖ gen lín h¬n)
C¸c intron
Kh«ng cã ë c¸c gen m· hãa protein
Cã ë mét sè gen
ë sinh vËt nh©n thËt ®¬n bµo: cã, song chØ phæ biÕn ë mét sè loµi ë sinh vËt nh©n thËt ®a bµo: cã ë phÇn lín gen
ADN kh«ng m� hãa kh¸c
ChØ cã rÊt Ýt trong hÖ gen
ChiÕm l−îng lín trong hÖ gen: nh×n chung cã nhiÒu tr×nh tù lÆp l¹i kh«ng m· hãa ë c¸c sinh vËt nh©n thËt ®a
bµo
Sinh vËt nh©n thËt ®a bµo cã nhiÒu ADN kh«ng m� hãa vµ nhiÒu hä ®a gen (c¸c trang 434 –––– 438) � ChØ cã 1,5% hÖ gen ng−êi m· hãa cho protein hoÆc cho rARN vµ
tARN; phÇn cßn l¹i lµ c¸c tr×nh tù ADN kh«ng m· hãa, bao gåm nhiÒu tr×nh tù ADN lÆp l¹i.
� C¸c yÕu tè di truyÒn vËn ®éng vµ c¸c tr×nh tù cã liªn quan ®Õn chóng. Lo¹i tr×nh tù ADN lÆp l¹i phæ biÕn nhÊt trong hÖ gen sinh vËt nh©n thËt ®a bµo lµ c¸c yÕu tè di truyÒn vËn ®éng vµ c¸c tr×nh tù cã liªn quan ®Õn chóng. Cã hai lo¹i yÕu tè vËn ®éng trong hÖ gen sinh vËt nh©n thËt: transposon vËn ®éng th«ng qua mét ph©n tö ADN trung gian, vµ retrotransposon cã møc ®é phæ biÕn cao h¬n vµ vËn ®éng th«ng qua mét ph©n tö ARN trung gian.
� C¸c tr×nh tù ADN lÆp l¹i kh¸c, bao gåm c¶ c¸c ADN tr×nh tù ®¬n gi¶n. NhiÒu tr×nh tù ng¾n kh«ng m· hãa lÆp l¹i liªn tôc hµng ngh×n lÇn (gäi lµ c¸c ADN tr×nh tù ®¬n gi¶n, bao gåm c¶ c¸c STR) cã mÆt ®Æc biÖt phæ biÕn ë vïng t©m ®éng vµ c¸c ®Çu mót nhiÔm s¾c thÓ; chóng cã thÓ cã vai trß quan träng trong cÊu tróc cña nhiÔm s¾c thÓ.
� C¸c gen vµ c¸c hä ®a gen. MÆc dï nhiÒu gen ë sinh vËt nh©n thËt chØ cã mét b¶n sao duy nhÊt trong bé nhiÔm s¾c thÓ ®¬n béi cña chóng, c¸c gen cßn l¹i (phÇn lín ë mét sè loµi) lµ thµnh viªn cña cïng hä c¸c gen cã quan hÖ víi nhau. §¬n vÞ phiªn m· t−¬ng øng víi ba lo¹i rARN lín nhÊt lÆp l¹i liªn tiÕp hµng tr¨m ngh×n lÇn trªn mét hoÆc mét sè vÞ trÝ kh¸c nhau cña c¸c nhiÔm s¾c thÓ; cÊu tróc nµy gióp tÕ bµo cã thÓ nhanh chãng tæng hîp rARN cÇn
Kh¸i niÖm 21.3
Kh¸i niÖm 21.4
LÆp ®o¹n, t¸i s¾p xÕp vµ ®ét biÕn trong tr×nh tù ADN ®ãng gãp vµo qu¸ tr×nh tiÕn hãa (c¸c trang 438 –––– 442) � Sù nh©n ®«i c¸c bé nhiÔm s¾c thÓ. C¸c sù kiÖn ngÉu nhiªn
trong qu¸ tr×nh ph©n bµo cã thÓ dÉn ®Õn c¸c tÕ bµo cã thªm nh÷ng b¶n sao cña tÊt c¶ hay mét phÇn hÖ gen. Nh÷ng hÖ gen nµy sau ®ã cã thÓ ph©n ly nÕu nh− mét bé nhiÔm s¾c thÓ tÝch lòy c¸c biÕn ®æi trong tr×nh tù ADN.
� Sù thay ®æi cÊu tróc nhiÔm s¾c thÓ. CÊu tróc nhiÔm s¾c thÓ c¸c hÖ gen cã thÓ ®−îc ®em so s¸nh gi÷a c¸c loµi, qua ®ã cung cÊp th«ng tin vÒ mèi quan hÖ tiÕn hãa. Trong ph¹m vi mét loµi nhÊt ®Þnh, sù s¾p xÕp l¹i c¸c nhiÔm s¾c thÓ ®−îc cho lµ mét c¬ chÕ ®ãng gãp vµo sù ph¸t sinh loµi míi.
� LÆp ®o¹n vµ sù ph©n ly cña c¸c vïng ADN cã kÝch th−íc t−¬ng øng víi gen. C¸c gen m· hãa cho c¸c lo¹i protein globin kh¸c nhau tiÕn hãa b¾t nguån tõ mét gen globin tæ tiªn chung; gen tæ tiªn nµy ®· nh©n ®«i vµ ph©n ly thµnh c¸c gen tæ tiªn cña α-globin vµ β-globin. HiÖn t−îng nh©n ®«i sau ®ã kÕt hîp víi c¸c ®ét biÕn ngÉu nhiªn ®· dÉn ®Õn sù h×nh thµnh c¸c gen hiÖn nay; tÊt c¶ nh÷ng gen nµy ®Òu m· hãa cho c¸c protein liªn kÕt «xy. C¸c b¶n sao kh¸c nhau cña gen lÆp ®· ph©n ly ®Õn møc mµ chøc n¨ng cña c¸c protein hiÖn nay do chóng m· hãa ®· trë nªn kh¸c nhau mét c¸ch c¨n b¶n.
� Sù s¾p xÕp l¹i c¸c phÇn cña gen: lÆp ®o¹n vµ trao ®æi exon. Sù s¾p xÕp l¹i c¸c exon trong ph¹m vi mét gen vµ gi÷a c¸c gen trong qu¸ tr×nh tiÕn hãa ®· dÉn ®Õn c¸c gen chøa nhiÒu b¶n sao cña c¸c exon gièng nhau vµ/hoÆc cña mét sè exon kh¸c nhau b¾t nguån tõ c¸c gen kh¸c.
� C¸c yÕu tè vËn ®éng gãp phÇn vµo sù tiÕn hãa cña hÖ gen nh− thÕ nµo ? Sù di chuyÓn cña c¸c yÕu tè vËn ®éng hay t¸i tæ hîp gi÷a c¸c b¶n sao cña cïng mét yÕu tè vËn ®éng ®«i khi t¹o ra nh÷ng tæ hîp tr×nh tù míi cã lîi cho c¬ thÓ sinh vËt. Nh÷ng c¬ chÕ nh− vËy cã thÓ lµm thay ®æi c¸c chøc n¨ng cña c¸c gen hoÆc kiÓu biÓu hiÖn hay ®iÒu hßa biÓu hiÖn cña chóng.
Phßng thÝ nghiÖm (PTN) sinh häc trùc tuyÕn PTN Hemoglobin
So s¸nh c¸c tr×nh tù hÖ gen cung cÊp b»ng chøng vÒ c¸c qu¸ tr×nh tiÕn hãa vµ ph¸t triÓn � So s¸nh c¸c hÖ gen C¸c nghiªn cøu so s¸nh hÖ gen gi÷a c¸c
loµi cã quan hÖ gÇn gòi còng nh− gi÷a c¸c loµi cã møc ®é ph©n ly xa h¬n cung cÊp nhiÒu th«ng tin gi¸ trÞ t−¬ng øng vÒ lÞch sö tiÕn hãa cËn ®¹i vµ cæ x−a. C¸c tr×nh tù hÖ gen ng−êi vµ tinh tinh kh¸c nhau kho¶ng 4%, chñ yÕu do thªm ®o¹n, mÊt ®o¹n, vµ lÆp ®o¹n trong mét nh¸nh tiÕn hãa. Cïng víi c¸c biÕn ®æi vÒ c¸c nucleotit trong nh÷ng gen ®Æc thï (vÝ dô nh− gen FOXP2, mét gen ¶nh h−ëng ®Õn kh¶ n¨ng ph¸t ©m), nh÷ng thay ®æi nµy cã thÓ gi¶i thÝch cho c¸c ®Æc ®iÓm kh¸c biÖt gi÷a hai loµi. C¸c ®a h×nh ®¬n nucleotit gi÷a c¸c c¸ thÓ trong ph¹m vi mét loµi còng cã thÓ cung cÊp th«ng tin vÒ lÞch sö tiÕn hãa cña loµi ®ã.
� So s¸nh qu¸ tr×nh ph¸t triÓn C¸c gen ®iÒu khiÓn ph¸t triÓn vµ mét sè gen kh¸c cã liªn quan ®Õn qu¸ tr×nh ph¸t triÓn ë ®éng vËt chøa mét vïng homeobox; ®ã lµ tr×nh tù gièng hÖt nhau hoÆc rÊt gièng nhau ë nhiÒu loµi. NhiÒu tr×nh tù cã quan hÖ víi nhau ®−îc t×m thÊy ®ång thêi ë c¸c hÖ gen cthùc vËt vµ nÊm men. C¸c gen ®iÒu hßa ph¸t triÓn kh¸c còng cã tÝnh b¶o thñ cao ë c¸c loµi ®éng vËt, nh−ng chóng cã thÓ cã vai trß kh¸c nhau trong qu¸ tr×nh ph¸t triÓn cña c¸c loµi kh¸c nhau. Trong qu¸ tr×nh ph¸t triÓn ph«i ë ®éng vËt còng nh− thùc vËt cã mét chuçi c¸c yÕu tè phiªn m· gióp bËt hoÆc t¾t c¸c gen theo mét trËt tù nghiªm ngÆt. Tuy vËy, c¸c gen ®iÒu khiÓn qu¸ tr×nh ph¸t triÓn t−¬ng tù l¹i cã tr×nh tù kh¸c nhau ®¸ng kÓ khi so s¸nh gi÷a ®éng vËt vµ thùc vËt; cã lÏ do tæ tiªn cña chóng ®· ph©n ly tõ l©u trong qu¸ tr×nh tiÕn hãa.
Kh¸i niÖm 21.5
§a ph−¬ng tiÖn
Kh¸i niÖm 21.6
Ch−¬ng 21 C¸c hÖ gen vµ sù tiÕn hãa cña chóng 449
chuét vµ ng−êi. §©y chÝnh lµ nh÷ng ph©n ®o¹n chøa tÊt c¶ c¸c axit amin kh¸c nhau trong protein FOXP2 khi so s¸nh gi÷a nh÷ng loµi nµy. 1. ATETI … PKSSD … TSSTT … NARRD 2. ATETI … PKSSE … TSSTT … NARRD 3. ATETI … PKSSD … TSSTT … NARRD 4. ATETI … PKSSD … TSSNT … SARRD 5. ATETI … PKSSD … TSSTT … NARRD 6. VTETI … PKSSD … TSSTT … NARRD H·y dïng bót ®¸nh dÊu b«i mµu vµo c¸c axit amin kh¸c biÖt gi÷a c¸c loµi. (phñ mµu lªn axit amin ®ã ë tÊt c¶ c¸c loµi.) Sau ®ã, tr¶ lêi c¸c c©u hái d−íi ®©y: a. C¸c tr×nh tù cña tinh tinh (T), khØ gorila (G) vµ khØ rªzut (R) gièng hÖt nhau. Nh÷ng dßng nµo t−¬ng øng víi nh÷ng loµi nµy.
b. Tr×nh tù ë ng−êi kh¸c víi tr×nh tù cña c¸c loµi T, G vµ R ë hai axit amin. Dßng nµo t−¬ng øng víi tr×nh tù cña ng−êi? G¹ch ch©n hai axit amin kh¸c biÖt.
c. Tr×nh tù cña ®−êi −¬i kh¸c víi tr×nh tù cña c¸c loµi T, G vµ R ë mét axit amin (thay thÕ alanine b»ng valine) vµ kh¸c víi tr×nh tù cña ng−êi ë ba axit amin. Dßng nµo t−¬ng øng víi tr×nh tù cña ®−êi −¬i ?
d. Cã bao nhiªu axit amin kh¸c biÖt gi÷a tr×nh tù cña chuét so víi tr×nh tù cña c¸c loµi T, G vµ R? Khoanh trßn vµo c¸c axit amin kh¸c biÖt ë chuét. Cã bao nhiªu axit amin kh¸c biÖt gi÷a chuét vµ ng−êi? VÏ h×nh vu«ng bao quanh axit amin kh¸c biÖt ë chuét.
e. C¸c loµi linh tr−ëng vµ bé gÆm nhÊm ph©n ly khái nhau c¸ch ®©y kho¶ng tõ 60 ®Õn 100 triÖu n¨m, cßn ng−êi vµ tinh tinh ph©n ly khái nhau c¸ch ®©y kho¶ng 6 triÖu n¨m. Tõ c¬ së ®ã, b¹n cã thÓ kÕt luËn ®iÒu g× khi so s¸nh sù kh¸c biÖt vÒ tr×nh tù axit amin gi÷a chuét víi c¸c loµi T, G vµ R ®ång thêi ®èi chiÕu víi sù kh¸c biÖt gi÷a ng−êi víi c¸c loµi T, G vµ R?
Xem gîi ý tr¶ lêi C¸c c©u hái tù ®¸nh gi¸ ë Phô lôc A.
Thùc hiÖn bµi KiÓm tra thùc hµnh t¹i trang web www.masteringbio.com
liªn hÖ víi tiÕn hãa
8. C¸c gen gi÷ vai trß quan träng trong ph¸t triÓn ph«i ë ®éng vËt, ch¼ng h¹n nh− c¸c gen mang miÒn homeobox, cã tÝnh b¶o thñ t−¬ng ®èi cao trong qu¸ tr×nh tiÕn hãa; nghÜa lµ, khi so s¸nh gi÷a c¸c loµi, chóng gièng nhau nhiÒu h¬n so víi nhiÒu gen kh¸c. T¹i sao l¹i nh− vËy?
T×m hiÓu khoa häc
9. C¸c nhµ khoa häc khi lËp b¶n ®å c¸c SNP trong hÖ gen ng−êi ®· ®Ó ý thÊy hiÖn t−îng c¸c nhãm SNP cã xu h−íng di truyÒn víi nhau thµnh tõng khèi vµ ®−îc gäi lµ c¸c ®¬n d¹ng (hoÆc ®¬n nh¸nh; haplotype) cã chiÒu dµi tõ 5000 ®Õn 200.000 cÆp baz¬. Mçi haplotype chØ cã kho¶ng tõ 4 ®Õn 5 kiÓu tæ hîp cña c¸c SNP xuÊt hiÖn phæ biÕn. H·y nªu gi¶ thiÕt gi¶i thÝch cho hiÖn t−îng nµy trªn c¬ së kÕt hîp c¸c th«ng tin thu nhËn ®−îc tõ ch−¬ng nµy nãi riªng vµ khèi kiÕn thøc di truyÒn häc nãi chung.
§a ph−¬ng tiÖn
C¸c c©u hái tù ®¸nh gi¸
1. Tin sinh häc bao gåm tÊt c¶ c¸c néi dung sau, trõ a. sö dông c¸c ch−¬ng tr×nh m¸y tÝnh ®Ó so s¸nh c¸c tr×nh tù ADN.
b. ph©n tÝch t−¬ng t¸c gi÷a c¸c protein trong mét loµi. c. sö dông sinh häc ph©n tö ®Ó kÕt hîp ADN tõ c¸c nguån kh¸c nhau trong ®iÒu kiÖn in-vitro.
d. ph¸t triÓn c¸c c«ng cô m¸y tÝnh ®Ó ph©n tÝch hÖ gen. e. sö dông c¸c c«ng cô to¸n häc ®Ó t×m hiÓu c¸c hÖ thèng sinh häc.
2. Loµi nµo d−íi ®©y cã hÖ gen lín nhÊt vµ mËt ®é gen thÊp nhÊt tÝnh theo sè cÆp baz¬ cã trong hÖ gen ? a. Haemophilus influenza (vi khuÈn) b. Saccharomyces cerevisiae (nÊm men) c. Arabidopsis thaliana (thùc vËt) d. Drosophila melanogaster (ruåi giÊm) e. Homo sapiens (ng−êi hiÖn ®¹i)
3. Mét ®Æc ®iÓm cña c¸c retrotransposon lµ a. chóng m· hãa cho mét enzym tæng hîp ADN sö dông
ARN lµm m¹ch khu«n. b. chóng chØ ®−îc t×m thÊy ë c¸c tÕ bµo ®éng vËt. c. chóng th−êng vËn ®éng bëi c¬ chÕ c¾t - d¸n. d. chóng ®ãng gãp mét phÇn ®¸ng kÓ vµo c¸c biÕn dÞ di
truyÒn quan s¸t thÊy trong mét quÇn thÓ c¸c giao tö. e. chóng ®−îc nh©n b¶n phô thuéc vµo mét retrovirut.
4. C¸c hä ®a gen lµ a. c¸c nhãm tr×nh tù t¨ng c−êng ®iÒu khiÓn phiªn m·. b. c¸c gen th−êng kÕt thµnh côm ë c¸c ®Çu mót. c. c¸c cÊu tróc t−¬ng øng víi c¸c operon cña sinh vËt nh©n s¬.
d. c¸c nhãm gen ®−îc ®iÒu khiÓn ®ång thêi. e. c¸c bé gen gièng hÖt nhau hoÆc rÊt gièng nhau tiÕn hãa qua qu¸ tr×nh lÆp gen.
5. Hai protein ë sinh vËt nh©n thËt chøa mét miÒn chøc n¨ng gièng nhau, song phÇn cßn l¹i cña chóng th× rÊt kh¸c nhau. Qu¸ tr×nh nµo d−íi ®©y nhiÒu kh¶ n¨ng gãp phÇn g©y ra sù gièng nhau nµy cña chóng ? a. LÆp gen d. BiÕn ®æi histone b. XÐn ARN e. C¸c ®ét biÕn ®iÓm ngÉu nhiªn c. Trao ®æi exon
6. C¸c gen ®iÒu khiÓn ph¸t triÓn (homeotic genes) a. m· hãa cho c¸c yÕu tè phiªn m· ®iÒu khiÓn sù biÓu hiÖn cña c¸c gen cã vai trß x¸c ®Þnh cÊu tróc gi¶i phÉu ®Æc thï.
b. chØ ®−îc t×m thÊy ë Drosophila vµ c¸c loµi th©n ®èt. c. lµ nh÷ng gen duy nhÊt mang miÒn homeobox. d. m· hãa cho c¸c protein h×nh thµnh nªn cÊu tróc gi¶i phÉu cña ruåi giÊm.
e. cã vai trß x¸c ®Þnh mÉu h×nh ph¸t triÓn cña thùc vËt.
7. ë phÝa trªn cña cét bªn lµ c¸c tr×nh tù axit amin (dïng kiÓu viÕt t¾t mét ch÷ c¸i; xem H×nh 5.17) thuéc bèn ph©n ®o¹n ng¾n cña protein FOXP2 ®−îc t×m thÊy ë 6 loµi kh¸c nhau, gåm: tinh tinh, ®−êi −¬i, khØ gorila, khØ rªzut,
KiÓm tra kiÕn thøc cña b¹n
vÏ tiÕp