15. fejezet - A genetikai kód feltörése

Tartalom

15.1. A genetikai kód megfejtését megalapozó ismeretek
15.1.1. A fehérjeszintézis helyének azonosítása
15.1.2. Az adapter RNS (tRNS) azonosítása
15.1.3. Az információt közvetítő, hírvivő RNS (mRNS) azonosítása
15.1.4. A genetikai kód triplet voltának felismerése
15.1.5. A kód nem átfedő
15.1.6. Egyetlen érvényes leolvasási keret van
15.2.  A genetikai kód feltöréséhez vezető kísérletek
15.2.1. Az első tripletek jelentésének feltárása mesterséges homopolimer RNS-ekkel
15.2.2. A random nukleotid keveréses módszer
15.2.3. Szintetikus trinukleotid módszer: a Nirenberg-Leder kísérlet
15.2.4. Khorana repetitív ismétlődéseket tartalmazó szintetikus RNS módszere
15.3. A genetikai kódszótár szabályos szerkezete
15.3.1. A kodon-aminosav hozzárendelés szabályossága
15.3.2. Degenerált kód és lötyögő kodon-antikodon kapcsolat
15.4. A genetikai kód majdnem tökéletesen univerzális

(szerző: Pál Gábor)

Francis Crick centrális dogmája szerint a fehérjékben lévő aminosavsorrendet a nukleinsavakban lévő nukleotid sorrend határozza meg. A nukleinsavakba írt szöveg nyelvezete 4 betűből áll, a fehérjékben lévő szöveg pedig 20-betűs. A kettő között kell, hogy legyen egy kódolási eljárás, egy szabályrendszer, ami szerint a nukleinsavakban szereplő szöveg lefordítható a fehérjékben szereplő szövegre. Ezt a szabályrendszert nevezzük genetikai kódnak. Fontos tehát megértenünk, hogy a „kód” nem valamilyen fizikai entitás, például nem egy trinukleotid egység, hanem maga a szabályrendszer.

Ennek a szabályrendszernek a feltárása a biológiai kutatások körében az egyik legnagyobb intellektuális teljesítmény volt.

15.1. A genetikai kód megfejtését megalapozó ismeretek

Mint arról korábban szó volt, már a negyvenes években kiderült Avery és munkatársai nyomán, hogy az örökítő anyag a DNS, amit Hershey és Chase kísérlete 1952-ben megerősített. A negyvenes években Tatum és Beadle pedig már azt is demonstrálták, hogy egy-egy enzim előállítására vonatkozóan egy-egy gén hordozza az instrukciókat.

Watson és Crick 1953-ban megoldotta a DNS térszerkezeti modelljét, hipotézist állítottak fel a replikáció modelljére, amit Meselson és Stahl kísérlete 1957-ben igazolt.

Ugyanakkor semmilyen konkrét ismeret nem utalt arra, hogy mi viheti át az információt a DNS-ről a fehérjére.

Mielőtt a kód megfejtése irányába konkrét kísérleteket tehettek volna, számos előzetes eredménynek kellett megszületnie. Az első ilyen eredmény a fehérjék keletkezési helyének azonosítása volt.

15.1.1. A fehérjeszintézis helyének azonosítása

Nyilvánvaló, hogy ahol a fehérjék keletkeznek, ott kell, hogy legyen helyileg az az instrukció is valamilyen molekuláris formájában, ami alapján az adott aminosavsorrendű fehérje létrejön.

A riboszómákat 1955-ben George Palade azonosította elektronmikroszkópos technikával mind szabadon a citoplazmában, mind pedig membránokhoz kötve. Festési technikákkal arra jutott, hogy a képződmények, (amelyeket csak 1958-ban neveztek el riboszómának), fehérjét és RNS-t egyaránt tartalmaznak. A sejtek szerkezeti és funkcionális felépítésének feltárásában elért meghatározó eredményeikért Albert Claude, Christian de Duve és George Palade 1974-ben megosztott orvosi Nobel-díjat kaptak. A munka keretében kidolgozták a sejtfrakcionálás eljárását, és elektronmikroszkópos valamint biokémiai vizsgálattal egy sor sejtalkotót azonosítottak.

Paul Zamecnik volt az, aki szintén 1955-ben a fehérjék szintézisének helyeként azonosította az ugyanabban az évben Palade által leírt riboszómákat (lásd 15.1. ábra).

15.1. ábra: A durvafalú endoplazmás retikulum a riboszómákkal

15.1. ábra: A durvafalú endoplazmás retikulum a riboszómákkal

Zamecnik kifejezetten biokémiai szemlélettel a fehérjeszintézis színhelyét igyekezett meghatározni. A fehérjék nukleinsavak általi kódolásának elméleti problémakörével nem foglalkozott. Ezért nem ismerte azokat a hipotéziseket sem, amelyeket Francis Crick és kutatótársai ugyanebben az időszakban alkottak.

Zamecnik radioaktív aminosavakat injektált patkányba, és májból izolált sejtfrakciókban követte, hol jelenik meg a radioaktív jel. Ha a jelölés és az izolálás között órák, vagy napok teltek el, minden sejtfrakció jelölődött. Ha csak percek teltek el, akkor a fehérjék kizárólag ribonukleoprotein-tartalmú frakciókban voltak jelen, a riboszómákhoz kötve. Zamecnik arra következtetett, hogy a fehérjék riboszómákon szintetizálódnak.

15.1.2. Az adapter RNS (tRNS) azonosítása

Az a tény, hogy az eukariótákban a DNS a sejtmagban van, a fehérjeszintézis helye viszont a citoplazma, szükségessé tette egy, vagy több információközvetítő molekula létét. Crick 1955-ben elméleti alapon felvetette egy információközvetítő nukleinsav, és egy adapter nukleinsav létének szükségességét ahhoz, hogy a DNS-ben tárolt információ alapján fehérjék szintetizálódjanak.

Crickadapter-hipotézisé”-t is alátámasztotta, hogy világossá vált, az aminosavak nem kötődnek spontán sem DNS-hez, sem RNS-hez. Tehát ha lenne is egy információközvetítő molekula, ami a sejtmagból kiviszi a DNS információját a citoplazmába, egy további adapter molekulának is lennie kell, amely kapcsolatot teremt a négybetűs nukleinsav nyelv és a húszbetűs fehérje nyelv között. Crick úgy vélte, az adapter egy RNS lehet, amelynek egyik része specifikusan felismer egy adott aminosavat, míg a másik része specifikusan felismeri az adott aminosavhoz tartozó kódoló egységet a közvetítő nukleinsavon (lásd 15.2. ábra).

Arra azonban senki nem gondolt, hogy ezt a hipotetikus adaptert még abban az évben felfedezik. Ismét Zamecnik szolgáltatta az eredményt. Biokémiai ismeretei alapján tisztában volt azzal, hogy ahhoz, hogy a szabad aminosavak polipeptidlánccá kapcsolódjanak össze, energia kell, amit bizonyára ATP szolgáltat.

A további vizsgálatokhoz ezért Mahlon Hoagland-dal közösen kidolgozott egy májsejt kivonaton alapuló, sejtmentes fehérjeszintetizáló rendszert. Ezt a rendszert használva Hoagland és Zamecnik aminosavakat inkubáltak ATP-vel és felfedezték, hogy az aminosavak ideiglenesen kovalens kötéssel AMP-hez kapcsolódnak, majd ennek a vegyületnek a bomlása során kovalens kötéssel RNS molekulához kapcsolódnak. Zamecnik és Hoagland tehát felfedezték a tRNS-t.

James Watson személyesen értesülve ezekről az eredményekről azonnal rájött, hogy az az RNS, amit Hoagland és Zamecnik felfedezett, megfelelhet Crick feltételezett adapter molekulájának. Crick az eredményről értesülve azt vetette fel, hogy óriási előrelépés lenne, ha egy kóli citoplazma alapú sejtmentes fehérjeszintetizáló rendszert is létre lehetne hozni. Zamecnik ezt 1960-ra meg is alkotta, és később ez a rendszer alapvető fontosságúnak bizonyult a genetikai kód megfejtésében.

15.2. ábra: A Francis Crick által megjósolt adapter molekula

15.2. ábra: A Francis Crick által megjósolt adapter molekula

Térjünk vissza a Crick által felvetett elméleti problémára. Az adapter molekula azonosításra került, de a később hírvivőnek elnevezett RNS-t még nem találták meg.

15.1.3. Az információt közvetítő, hírvivő RNS (mRNS) azonosítása

Tudománytörténeti érdekesség, hogy a riboszómák felfedezése Francis Crick-et egy később alapvetően hibásnak bizonyult hipotézisre vezette. Miután kiderült, hogy a riboszómákban nagy mennyiségben van jelen RNS, Crick az RNS genomú növényi vírusok alapján feltételezte, hogy a riboszómák esetében is kódoló szerepe van ennek az RNS-nek.

Megalkotott egy elméletet, amely szerint minden riboszóma egy-egy fehérjegén RNS másolatát hordozza, tehát a riboszómákban lévő RNS lenne maga az információ közvetítő RNS. Ez a hipotézis hamar megdőlt, amikor kiderült, hogy a riboszómák rendkívül homogének. Ráadásul a bennük lévő RNS bázisösszetétele még olyan távoli fajok esetében is nagyon hasonló, mely fajok DNS-ének bázisösszetétele nagyon eltérő. Az is világossá vált, hogy a bakteriális RNS frakció, amiről kiderült, hogy legnagyobb arányban riboszómális RNS-t tartalmaz, bázisösszetétele nem hasonlít a bakteriális DNS bázisösszetételére.

A hírvivő RNS-t elsőként Elliot Volkin és Lazarus Astrachan azonosították 1956-ban. T2 fággal fertőztek kóli sejteket. A sejtekben a fertőzést követően szinte leáll a saját fehérjék szintézise, a kóli sejt T2-gyárrá válik, és szinte csak a fág fehérjéit termeli. Volkin és Astrachan radioaktív uracilt adtak a sejteknek a fág-fertőzéssel egyidőben, és megfigyelték, hogy a fertőzést követően szinte azonnal nagy mennyiségű RNS szintetizálódik a coli sejtben. Ennek az RNS-nek a bázisösszetételét analitikai módszerekkel meghatározták, és kimutatták, hogy az sem a kóli egyéb RNS-einek bázisösszetételével, sem a kóli DNS-ének bázisösszetételével nem mutat rokonságot, ugyanakkor nagyon hasonlít a T2 fág egyszálú DNS-ének bázisösszetételére. Ezt az RNS-t DNS-szerű RNS-nek nevezték el. Azt is kimutatták, hogy ez az RNS rendkívül rövid idő alatt lebomlik a sejtben.

Volkin és Astrachan eredményei széles körben elterjedtek. Ennek ellenére a tudományos közvélemény  Sidney Brenner, Jacob Monod és Matthew Meselson eredményének ismerte el az mRNS felfedezését. Való igaz, hogy Volkin és Astrachan korábbi kísérleteire támaszkodva, azokat továbbfejlesztve, Brenner, Monod és Meselson egy kifinomultabb kísérletsorozatot publikáltak 1961-ben.

Baktériumokat tenyésztettek 15N és 13C tartalmú tápoldatban. A baktériumok riboszómái így „nehéz” riboszómák lettek. A sejteket ezek után izolálták, radioaktív uracilt adtak nekik, T4 fággal fertőzték, és mindeközben normál 14N és 12C tartalmú tápoldatba vitték. Rövid idő után cézium kloridos egyensúlyi sűrűséggradiens centrifugával izolálták a riboszómákat.

Nem találták jelét új, tehát „normál sűrűségű” riboszómáknak, viszont a régi bakteriális riboszómákhoz ideiglenesen hozzákötődve megtalálták az újonnan keletkezett RNS radioaktív jelét.

Ezt a radioaktív RNS-t izolálták, és kimutatták, hogy az hibridizál (Watson-Crick bázispárosodáson keresztül kötődik) az egyszálú fág genomhoz, de nem kötődik a kóli genomhoz.

Az új vírusfehérjék gyártására vonatkozó információt tehát nem a riboszómális RNS hordozta (abból nem keletkezett új készlet), hanem egy másfajta RNS, amit elneveztek hírvivő (messenger) RNS-nek, röviden mRNS-nek.

15.1.4. A genetikai kód triplet voltának felismerése

Ezek után már világos koncepció állt rendelkezésre a „kódtörők” számára. Adott a DNS-ről másolódó mRNS, ez viszi a hírt az rRNS tartalmú riboszómákra. Ugyanide szállítják a tRNS molekulák, mint adapterek az aminosavakat. Az információ és az adapterek segítségével a riboszóma katalizálja az aminosavak összeépülését fehérjévé.

Pár fontos elméleti kérdés azonban még tisztázásra várt. Például az, hogy az mRNS-en hány nukleotid egység határoz meg egy aminosavat. Ezt Francis Crick és Sydney Brenner fejtették meg 1961-ben.

Egy adott fágnak különböző variánsait állították elő. Ezekben a variánsokban rendre ugyanaz a gén hordozott mutációt, de mindegyik típusban a gén más pontján következett be a mutáció. Ráadásul speciális kémiai mutagenezis eljárásokat alkalmaztak, amelyekkel az egyik eljárás szerint elsősorban inszerciót, vagyis egy extra nukleotid beépülését érték el, míg egy másikkal deléciót, vagyis egy nukleotid kiesését.

A fágokkal kapcsolatban kiderült, hogy amennyiben két eltérő mutánst juttattak be ugyanabba a kóli sejtbe, megesett, hogy a fágok genomja rekombinálódott. Ennek során egyes homológ génszakaszok kicserélődtek egymással, tehát megjelenhetett a sejtben a vadtípusú fág, és egy dupla mutáns fág.

A kísérletek eredményeként kiderült, hogy amikor deléciós mutánst inszercióssal rekombináltak, akkor az esetek egy részében génen belüli komplementáció történt: a dupla-mutáns vadtípusú tulajdonságú lett. (A komplementáció, mint genetikai kifejezés ebben a konkrét esetben azt jelenti, hogy a kettős mutáns az eredeti fenotípust mutatja, tehát a második mutáció eltörli az első hatását. A két mutáció mintegy egymást kiegészítve, komplementálva, kialakítja az eredeti állapotot.) Ha azonban két delécióst kombináltak egymással, akkor ilyen eredményt soha nem kaptak, és ugyanez volt igaz arra az esetre is, ha két inszercióst kombináltak egymással. Ezek sem mutattak vadtípusú eredményt.

Három inszerciós együttes fertőzése ugyanakkor néha vadtípusúhoz hasonló triplamutánst eredményezett, és ugyanezt kapták, amikor három deléciós fággal fertőztek.

Mindebből Crick és Brenner a genetikai kóddal kapcsolatban az alábbiakra következtettek: a kódban szerepel egy kezdőpont, ami kijelöli, hogy honnan kell kiolvasni a nukleinsavból az információt. Ebből a pontból elindulva a kiolvasás szisztematikus rendben, sorban halad. A kódolási eljárásban nincs fizikai központozás, ami önmagában kijelölné az olvasási keretet, tehát a kódolási eljárás vesszőmentes. A meghatározott kezdőpont, a szisztematikus haladás és a központozás hiánya miatt egy inszerció vagy egy deléció eltolja a leolvasási keretet (frame-shift mutáció). A tripla deléciós illetve a tripla inszerciós mutánsok esete alapján arra jutottak, hogy a kódolási eljárás három nukleotid egységeken, tehát tripleteken alapul (lásd 15.3. ábra).

15.3. ábra: Az inszerció, illetve a deléció eltolja a leolvasási keretet

15.3. ábra: Az inszerció, illetve a deléció eltolja a leolvasási keretet

A 15.3. ábra jól illusztrálja, hogy amennyiben egy inszerció, vagy deléció történik, úgy azt követően a leolvasási keret eltolódása miatt teljesen más információ olvasódik le, mint eredetileg. Ha azonban egymáshoz közel következik be egy inszerció és egy deléció, akkor csak a mutációk közvetlen közelében változik meg a leolvasandó információ, azt követően megmarad az eredeti rend. Amennyiben határozott jelek mutatnák a kódolt szövegekben a kódoló egységek határát (központozás), úgy egy inszerció vagy deléció csak egyetlen egységet érintene.

Arra egyébként már korábban George Gamow fizikus is felhívta a figyelmet, hogy a 20-féle aminosav 4-féle DNS nukleotidon alapuló egyszerű kódolásához legalább 3 nukleotid egység kell, hiszen két egység csak 42=16, eltérő jelsort jelent. Mivel a 3 egység viszont már 43=64 eltérő jelsort jelent, a kód degenerált” (másképpen kifejezve redundáns), egy aminosavra átlagosan több mint 3 triplet jut.

15.1.5. A kód nem átfedő

Részben elméleti megfontolások, részben korábbi ismeretek alapján kijelenthető volt, hogy a kód nem átfedő. Ez szabatosan megfogalmazva azt jelenti, hogy minden nukleotid egység csak egyetlen aminosav meghatározásában vesz részt. Az átfedő kódolás (lásd 15.4. ábra) ugyan háromszor tömörebb információtárolást tenne lehetővé, de több szempontból is rugalmatlan lenne.

15.4. ábra: A kódolási eljárás nem átfedő

15.4. ábra: A kódolási eljárás nem átfedő

Átfedő kódolásnál az egyes tripletek részben meghatároznák egymást. Például ha egyenkénti elcsúszással olvasódnának le, akkor az első tripletet követő második triplet első két pozíciója már adott lenne, tehát csak négyféle triplet következhetne. A fehérjék aminosavsorrendjével kapcsolatban azonban már ismert volt, hogy bármilyen aminosavat bármilyen másik követhet a fehérjében. Másrészt ez a kódolási eljárás azért is előnytelen lenne, mert egyetlen mutáció így három egymást követő tripletet érintene, tehát három egymást követő aminosav is megváltozna.

Ekkorra már Linus Pauling sarlósejtes anémiával kapcsolatos 1949-ben közölt eredménye alapján ismert volt, hogy azt az egyik hemoglobin láncban bekövetkező egyetlen aminosav cseréje okozza.

A kód tehát tripletekből áll, elválasztójeleket nem tartalmaz és átfedésmentesen olvasódik le.

15.1.6. Egyetlen érvényes leolvasási keret van

Az átfedés-mentes, tripletenkénti leolvasás elvileg nem zárná ki, hogy egy adott irányt tekintve három leolvasási keretben is értelmezhető legyen ugyanannak a nukleinsavnak a szekvenciája. Ez azt jelentené, hogy minden gén egyszerre három fehérje szekvenciáját kódolná. Ez az elvi lehetőség is egy tömörítést jelentene, hiszen egységnyi DNS mennyiségre háromszor annyi kódolt fehérje jutna, mint egyetlen érvényes leolvasási keret esetében (lásd 15.5. ábra).

15.5. ábra: Egy DNS szálról lefordított mRNS szekvenciája elvileg 3 leolvasási keretben is lefordítható lenne

15.5. ábra: Egy DNS szálról lefordított mRNS szekvenciája elvileg 3 leolvasási keretben is lefordítható lenne

Azonban ez az eljárás is rugalmatlan lenne. Egyetlen pontmutáció egyszerre három fehérjét is érintene. Másrészt ekkora már a mioglobin és a hemoglobin térszerkezete kapcsán ismert volt, hogy a fehérjék komplex felépítésűek, 1961-ben pedig Anfinsen bizonyította, hogy a fehérje szekvenciája határozza meg a térszerkezetét és funkcióját.

A három, egyenkénti elcsúsztatással generált leolvasási keretben az egyes fehérjék szekvenciája olyan nagymértékben függene egymástól, hogy nem lenne elegendő szabadság a rendszerben ahhoz, hogy három egymástól független stabil térszerkezet jöhessen létre.

A három lehetséges leolvasási keret közül tehát csak egy lehet érvényes. Ez azt is jelenti, hogy kell, hogy legyen egy kezdő start triplet. Az is nyilvánvaló volt, hogy záró tripletnek, tehát stop jelnek is lennie kell.