W czasie podgrzewania roztworu DNA, na skutek wzrastającej energii ruchów termicznych poszczególnych atomów zerwaniu ulegają wiązania wodorowe łączące dwa komplementarne łańcuchy podwójnej spirali. Proces ten nazywa się denaturacją DNA, a temperatura, w której następuje przejście formy dwuniciowej w formę jednoniciową — temperaturą topnienia DNA. Proces denaturacji jest jednak odwracalny. Obniżenie temperatury roztworu poniżej temperatury topnienia umożliwia powtórne odtworzenie struktury dwuniciowej pomiędzy komplementarnymi nićmi. Całkowicie prawidłowe odtworzenie pierwotnej postaci dwuniciowej związane jest z pewnymi warunkami. Przede wszystkim proces renaturacji musi zachodzić bardzo wolno, a więc w temperaturze bliskiej punktowi topnienia. Tylko wówczas nieprawidłowo sparowane elementy łańcuchów mogą ulec powtórnemu rozczepieniu i odszukać swoje właściwe pozycje. Britten i Davidson przeprowadzili następujące rozumowanie. Załóżmy, że fragmentujemy cały badany DNA na krótkie odcinki o mniej więcej jednakowej długości, np. kilkuset par nukleotydów. Odcinki te denaturujemy, a następnie umożliwiamy ich re- naturację. Od czego będzie zależała szybkość renaturacji, to jest liczba odcinków dwuniciowych, powstających w jednostce czasu? Wśród przypadkowo rozmieszczonych w roztworze sekwencji jednoniciowych odtworzenie formy dwuniciowej nastąpi wówczas, gdy spotkają się dwa odcinki o sekwencjach komplementarnych.

Zbadanie przebiegu renaturacji DNA z genomów wielu różnych organizmów pozwoliło na wyciągnięcie dwóch ogólnych wniosków na temat zorganizowania ich sekwencji. DNA wirusów i bakterii zbudowany jest prawie wyłącznie z sekwencji unikalnych, to jest powtarzających się tylko raz na cały genom. W przeciwieństwie do tego, DNA organizmów eukariotycznych zawiera powszechnie sekwencje powtarzające się, występujące obok sekwencji unikalnych. W DNA tym można ogólnie wyróżnić trzy klasy sekwencji: fragmenty powtarzające się 100 tysięcy i więcej razy fragmenty unikalne, powtarzające się 1—2 razy. Długość powtarzających się sekwencji jest zróżnicowana. Waha się ona od kilku do kilku tysięcy par nukleotydów. Spośród genów tylko bardzo nieliczne struktury występują w postaci wielokrotnej. Klasycznym przypadkiem jest gen kodujący RNA rybosomalny. W komórkach południowoafrykańskiej żaby Xeno- pus laevis występuje on na przykład w liczbie ponad tysiąca kopii na jeden genom. Powtarzają się również geny kodujące tRNA oraz geny wspomnianych już zasadowych białek chromosomów — histonów. Jednak większość sekwencji powtarzających się nie koduje białek. Mimo iż dokładna ich rola w genomie wciąż jest niejasna, wielu biologów skłania się do wniosku, że mogą one zawierać informację służącą do regulacji aktywności genów struktury. Nie wiemy dokładnie, jak powstały powtarzające się sekwencje. Można przypuszczać, że zasadniczą rolę odegrał tu proces wielokrotnej replikacji pojedynczego odcinka DNA. Samo istnienie powtarzających się sekwencji wskazuje, że duplikacja genów w DNA jest procesem dość częstym.

Zasadniczy skok ilościowy między genomem pro- i eukariontów mógł mieć różne przyczyny. Jedną z nich mogła być zmiana struktury przestrzennej genomu. Kolisty genom bakteryjny narzuca ograniczenie wielkości DNA głównie ze względu na skomplikowaną geometrię replikacji. Liniowy chromosom organizmów eukariotycznych charakteryzuje się przede wszystkim tym, że mieści znaczną ilość DNA w stosunkowo niewielkiej objętości. Co więcej, chromosom ten osiąga jeszcze większy stopień skondensowania w czasie podziału zreplikowanego materiału genetycznego. W stanie maksymalnego skondensowania, w metafazie mitozy, DNA chromosomów eukariotycznych zajmuje zaledwie 1/10 000 tej długości, jaką zająłby w stanie całkowicie rozprostowanym. Struktura skondensowanego chromosomu jest przy tym niezwykle regularna. Regularność tej struktury i możliwość osiągania różnych stopni jej skondensowania zawdzięcza komórka eukariotyczna istnieniu pięciu rodzajów niewielkich białek zasadowych, zwanych histonami. Są one skompleksowane z DNA na całej jego długości, tworząc regularne podjednostki organizacji strukturalnej. Nietrudno sobie wyobrazić, jak korzystna dla komórki jest możliwość kondensowania swego DNA do niewielkich, zbitych struktur — wręcz małych organelli — w czasie złożonego i wymagającego najwyższej precyzji procesu podziału. Być może właśnie ta właściwość dzisiejszych chromosomów przyczyniła się w istotny sposób do umożliwienia przodkom eukariontów bezpiecznego zwiększania wielkości genomu. Rzecz jasna, nie można nie doceniać przełomowego wydarzenia, jakim było pojawienie się w ewolucji jądra, wydzielonego przedziału komórkowego, dzięki któremu w historii rozwoju eukariontów raz na zawsze replikacja i transkrypcja oddzielone zostały od przebiegającej w cytoplazmie biosyntezy białka.

Jedna ze znajdujących się w użyciu terminologii nazywa fragmenty kodujące białko egzonami, nie kodujące zaś — intronami. Nasza wiedza o genach pofragmentowanych wciąż jeszcze jest bardzo skromna. Wiemy, że nie występują u prokariontów, wiemy też, że u eukariontów kodują zwykle białka wysoce wyspecjalizowane, to jest produkowane przez silnie zróżnicowane komórki i tkanki. U ssaków na przykład w postaci pofragmentowanej występuje gen globiny, białka tworzącego hemoglobinę, służącą przenoszeniu tlenu we krwi. Pofragmentowane są również geny kodujące lekkie łańcuchy polipeptydowe immunoglobulin myszy, geny kurzej owoalbuminy oraz geny fibroiny. Pofragmentowane geny okazały się bardzo częste wśród wirusów pasożytujących w komórkach ssaków. Nie wiemy natomiast nic na temat fragmentacji genów metabolizmu podstawowego komórek, np. kodujących enzymy cyklu Krebsa, czy glikolizy. Na pewno ciągłe, są geny białek strukturalnych chromosomów — histonów. Organizmy eukariotyczne zawierają więc z pewnością zarówno geny ciągłe, jak i pofragmentowane. Wykrycie obecności tych ostatnich nasunęło od razu wiele istotnych pytań. Jak z pofragmentowanego zapisu w DNA powstaje ciągły łańcuch mRNA (nie ulega wątpliwości, że obecne w cytoplazmie komórek cząsteczki mRNA,- które służą w translacji, zawierają ciągły zapis sekwencji aminokwasów w białku).

Walter Gilbert, biochemik amerykański, zaproponował bardzo interesujące wyjaśnienie, pasujące szczególnie dobrze do przypadku genu globiny. Według koncepcji Gilberta w ewolucji gen globinowy nie powstał od razu jako pojedynczy, nieprzerwany fragment sekwencji DNA. Jego obecne trzy egzony stanowiły kiedyś geny trzech osobnych białek, które ewoluowały oddzielnie i zupełnie niezależnie od siebie. Dopiero przypadkowe przetasowanie egzonów w genomie sprawiło, że znalazły się one blisko siebie, przedzielone niewielkimi wstawkami odpowiadającymi dzisiejszym intronom. Wówczas też po raz pierwszy owe przedzielające wstawki zostały wycięte w procesie obróbki posttranskrypcyjnej i powstać mogła globina o znanej dziś sekwencji. Nie trzeba dodawać, że kombinacja sekwencji aminokwasowych, kodowanych przez trzy egzony globiny w jedno funkcjonalne białko, okazała się wyjątkowo sprawnie działającą całością. Według tej koncepcji ewolucja, zamiast żmudnego udoskonalania przez mutację jednej długiej sekwencji, próbuje nowych kombinacji już dojrzałych i sprawdzonych w funkcjonujących białkach sekwencji mniejszych egzonów. Podobnie jak w przypadku wspomnianej uprzednio konstrukcji nowego genu poprzez duplikację i zmianę genu już istniejącego, mechanizm postulowany przez Gilberta mógłby być jednym ze źródeł genów w ewolucji. W przypadku globiny mechanizm ten dobrze tłumaczy fakt, iż każdy z egzonów koduje jakby wydzieloną domenę przestrzenną całej cząsteczki. Każda z tych domen mogła być kiedyś niezależnie funkcjonującym białkiem. Model Gilberta nie tłumaczy jednak przypadku, w którym egzony są zbyt krótkie, aby mogły kodować niezależną domenę przestrzenną w cząsteczce białka.

W miarę upływu czasu i pojawiania się nowych faktów idea podstawowa obrasta zwykle w liczne szczegóły, subtelności i wyjątki. W przypadku replikacji będą to z kolei dodatkowe procesy, jak: enzymatyczne rozplatanie podwójnej spirali poprzedzające właściwą akcję polimerazy, inicjacja i terminacja replikacji, łączenie ze sobą odcinków po zsyntetyzowaniu, likwidowanie naprężeń powstałych na skutek rozplatania dwóch zawiniętych wokół siebie nici, itp. Proces replikacji DNA bynajmniej nie jest wyjaśniony do końca. Wciąż na przykład bardzo mało wiadomo o procesach inicjacji i terminacji syntezy DNA. Podczas replikacji nie dochodzi nigdy do kompletnego rozplecenia dwóch nici podwójnej spirali. Przeciwnie, w trakcie replikacji nie obserwuje się praktycznie dłuższych odcinków jednoniciowych. Stąd wniosek, że rozplecenia następują w krótkich fragmentach, bezpośrednio poprzedzających postępującą syntezę DNA. Prawidłowe rozmnażanie się całych komórek uzależnione jest od wielu współdziałających procesów wewnątrzkomórkowych. Praktycznie każdy większy defekt metaboliczny stwarza tu poważne niebezpieczeństwo. Komórka jest przecież systemem, który można określić jako całkowicie sprzężony. Istnieje jednak w komórce ciąg procesów związany w sposób bezpośredni z rozdziałem informacji genetycznej między potomstwo. Początkowym etapem tego ciągu jest replikacja, czyli powielanie się DNA. Powodzenie rozmnażania zależy w dalszej kolejności od symetrycznego rozdziału zreplikowanego DNA. Proces ten, złożony już na poziomie bakterii, przybiera postać skomplikowanego cyklu morfologicznego u organizmów mających jądra komórkowe.

Najczęstszym mechanizmem naprawy uszkodzenia powstałego w jednej z dwu nici DNA jest wycinanie uszkodzonego miejsca dobudowanie brakującej sekwencji według wzoru zachowanego w nici komplementarnej. Mimo iż w reperacji „przez wycinanie” zaangażowanych jest wiele enzymów, między innymi nukleazy wycinające uszkodzony odcinek, polimeraza uzupełniająca lukę po wycięciu, ligaza — enzym łączący nowo wstawiony odcinek z przylegającymi końcami nici DNA, proces ten jest bardzo dokładny i praktycznie nie powoduje błędów. I tu jednak mogą powstawać trwałe mutacje. Skąd się one biorą? Niektórzy badacze skłaniają się do wniosku, że mogą one powstawać podczas tak zwanej naprawy SOS. Jest to, jak wskazuje sama nazwa, naprawa przeprowadzana w warunkach największego zagrożenia, a więc wtedy, gdy brak jest nici komplementarnej, według której mogłaby nastąpić normalna naprawa, na przykład przez wycinanie. Naprawa SOS występowałaby podczas replikacji DNA, w momencie jej zatrzymania w miejscu, które uległo zmianie chemicznej (np. na skutek fotodimeryzacji lub działania mutagenu chemicznego) i nie zostało naprawione przez żaden z działających w komórce systemów naprawczych. Do sytuacji takiej może dochodzić na przykład wtedy, gdy za częstością uszkodzeń nie nadąża wydajność systemu naprawczego. Ponieważ w zmienionym miejscu w DNA tworzenie normalnych par komplementarnych nie jest możliwe, replikacja ulega zatrzymaniu.

Same mutacje nie są wyłącznym powodem olbrzymiej zmienności informacji zawartej w DNA występujących na Ziemi. DNA każdego organizmu jest przecież zestawem genów, a jego zawartość informacyjna zależy nie tylko od tego, jak wyglądają poszczególne geny, ale również od tego, w jakim zestawie i w jakim porządku w ramach danego zestawu geny występują. Przechodzimy tym samym do podstawowych pytań postawionych w drugim etapie rozwoju biologii molekularnej. Pytania te dotyczą ogólnie zawartości informacyjnej DNA w genomach różnych organizmów. Czy znajduje się w nim coś jeszcze poza genami kodującymi określone białka? Do jakiego stopnia skład DNA różnych genomów jest podobny? W jakim stopniu zależne są ilość i treść przenoszonej informacji od bezwzględnej zawartości DNA w pojedynczym genomie? Równie intrygujące jest dla biologów pytanie: jak powstały geny i różne ich liniowe kombinacje — chromosomy? Wiemy już, że DNA może gromadzić przypadkowe mutacje i że jest to praktycznie jedyny mechanizm odpowiedzialny za dostarczanie nowych układów sąsiedztwa zasad. Nie wiemy do tej pory, jak w procesie powstawania życia na Ziemi doszło do ustalenia się dzisiejszej relacji gen—białko. Możemy jednak wyliczyć, że jeżeli funkcjonalny gen miałby powstać w drodze przypadkowych mutacji przypadkowej, niefunkcjonalnej sekwencji DNA o długości na przykład 400 nukleotyścią wyraźnie nie używanego DNA. Czy jest to pamiątka po ślepej uliczce ewolucji, czy też może DNA ten pełni jakąś uboczną funkcję, dostatecznie jednak ważną, by równoważyła niebezpieczeństwa związane z replikacją i podziałem tak wielkiej ilości materiału genetycznego? A może mamy tu do czynienia z przejawem samolubności DNA? Samolubny DNA i samolubny gen to terminy wprowadzone stosunkowo niedawno do biologii i służące do określenia pewnej, wciąż hipotetycznej właściwości DNA, mianowicie dążności do replikowania i zachowywania również tych sekwencji, które nie mają żadnego związku z cechami fenotypu, istnieją jakby same dla siebie.

Rozpad mRNA w komórkach bakterii jest zwykle o wiele szybszy niż w komórkach eukariotycznych. W tych ostatnich istnieje jednak również bardzo krótkotrwały mRNA. Degradacja w obu przypadkach wydaje się wynikać z jakiegoś wydarzenia inaktywującego, nie zaś z naturalnego starzenia się cząsteczek mRNA. Warto jeszcze wspomnieć, że mRNA odznacza się czasami bardzo złożoną strukturą przestrzenną. Wydaje się, że w mRNA eukariotycznych może również występować bogata struktura przestrzenna. Z powyższego opisu mRNA wyłania się nader złożony system regulacji rozmaitych wydarzeń, w których cząsteczka ta uczestniczy. System ten oparty jest przede wszystkim na oddziaływaniu między nukleotydami. Regulacja prawidłowego przebiegu translacji zależy nie tylko od sekwencji kodujących białko, ale również od towarzyszących im sekwencji nie kodujących. Wszystkie one jednak, z wyjątkiem końcowej poli A, zapisane są w DNA. Zatem program wewnętrznej regulacji samego procesu translacji jest również zapisany w DNA. Termin cistron jest tu równoważny z terminem gen. Obok policistronowych mRNA w bakteriach występują również mRNA kodujące tylko jeden polipeptyd. Ten ostatni typ mRNA jest natomiast jedynym, jaki występuje w cytoplazmie komórek eukariotycznych. Brak tam zupełnie mRNA policistronowych. Natomiast zarówno prokariotyczny, jak i eukariotyczny mRNA zawierają fragmenty, które nie kodują sekwencji białkowych. Odgrywają one ważną rolę w strukturalnym organizowaniu procesu translacji.

Sekwencje wszystkich podstawowych rodzajów komórkowych RNA biorących udział w biosyntezie białka zakodowane są w DNA. Wszystkie rodzaje RNA powstają zatem w wyniku transkrypcji. Oczywiście ani tRNA, ani rybosomalny RNA nie kodują sekwencji białkowych. Jako matryca w procesie biosyntezy białka służy wyłącznie mRNA. Bakteria jest czymś w rodzaju garnka, do którego jednocześnie wrzucono produkty do gotowania całego obiadu. Skoro tylko wolny koniec transkrybowanego RNA odłączy się od matrycowej nici DNA, natychmiast przyłącza rybosomy i rozpoczyna biosyntezę białka. W procesie transkrypcji DNA powstaje zatem gotowy do translacji mRNA. Transkrypcja w komórkach eukariotycznych jest bardziej złożona. Przede wszystkim miejsce, transkrypcji, jądro, jest oddzielone błoną od miejsca translacji — cytoplazmy. Oba procesy są zatem wyraźnie rozgraniczone do dwóch osobnych przedziałów komórkowych. Wprawdzie eukariotyczna polimeraza RNA działa na tej samej zasadzie co polimeraza bakteryjna, z DNA nie schodzą jednak gotowe do translacji cząsteczki mRNA. Pierwotny transkrypt jądrowy to właściwie dopiero półprodukt, z którego następnie, w wyniku skomplikowanej obróbki w jądrze, powstaje mRNA gotowy do wyeksportowania do przedziału biosyntezy białka. Pierwotny transkrypt jądrowy to olbrzymie RNA, z którego tylko niewielki procent stanowi przyszłe mRNA. Rola pozostałej części nie jest do tej pory całkowicie wyjaśniona.