Największe znane wirusy mogą zawierać w swoim DNA od 200 do 300 genów. Jak na skromne wciąż możliwości analityczne biologii molekularnej są to już bardzo skomplikowane układy. Wirusy średniej wielkości, np. bakteriofag lambda lub T4, zawierają po kilkadziesiąt genów. Zupełnie małe wirusy, np. należące do DNA-wirusów 0X 174 i FI, zawierają do kilkunastu genów. Jeszcze mniejsze od nich są to najmniejsze z dotychczas poznanych wirusów — bakteriofagi zawierające RNA, i np. R17, F2, QB. Ich RNA liczy niewiele ponad 3000 nukleotydów, a więc wystarcza do zakodowania zaledwie 4—5 białek średniej wielkości. Wystarczy porównać tę liczbę z około 5000 genów (jest to przybliżony szacunek) znajdujących się w genomie bakterii Escherichia coli| by zdać sobie sprawę z tego, jak bardzo ograniczona jest zawartość informacyjna tych struktur. Białkowe otoczki wirusów, zwłaszcza małych wirusów, składają się zwykle z niewielu rodzajów białek. Jest to oczywisty wymóg wirusowej ekonomii. W kwasie nukleinowym wirusa nie ma. po prostu miejsca na zakodowanie większej różnorodności białek. Otoczki wirusowe budowane są więc z wielu kopii kilku podstawowych podjednostek białkowych. Białka te muszą oczywiście ściśle do siebie pasować, co więcej — właściwie rozpoznawać jedno drugie tak, by sekwencja ich aminokwasów z góry determinowała specyficzne tworzenie z podjednostek właściwej struktury otoczki.