Краткий словарь терминов из области Генетики наглядно и доступным языком

Генетический код

Генети́ческий код — свойственный всем живым организмам способ кодирования аминокислотной последовательности белков при помощи последовательности нуклеотидов. В ДНК используется четыре азотистых основания — аденин (А), гуанин (G), цитозин (С), тимин (T), которые в русскоязычной литературе обозначаются буквами А, Г, Ц и Т. Эти буквы составляют алфавит генетического кода. В РНК используются те же нуклеотиды, за исключением тимина, который заменён похожим нуклеотидом — урацилом, который обозначается буквой U (У в русскоязычной литературе). В молекулах ДНК и РНК нуклеотиды выстраиваются в цепочки и, таким образом, получаются последовательности генетических букв. Белки практически всех живых организмов построены из аминокислот всего 20 видов. Эти аминокислоты называют каноническими. Каждый белок представляет собой цепочку или несколько цепочек аминокислот, соединённых в строго определённой последовательности. Эта последовательность определяет строение белка, а следовательно все его биологические свойства.
Реализация генетической информации в живых клетках (то есть синтез белка, кодируемого геном) осуществляется при помощи двух матричных процессов: транскрипции (то есть синтеза мРНК на матрице ДНК) и трансляции генетического кода в аминокислотную последовательность (синтез полипептидной цепи на мРНК). Для кодирования 20 аминокислот, а также сигнала «стоп», означающего конец белковой последовательности, достаточно трёх последовательных нуклеотидов. Набор из трёх нуклеотидов называется триплетом. Принятые сокращения, соответствующие аминокислотам и кодонам, изображены на рисунке.

История изучения

Знания о белках и нуклеиновых кислотах накапливались в течение длительного времени. К середине XX века их стало достаточно для того, чтобы выдвинуть первые идеи о природе генетического кода. К 1953 году было известно, что отдельные белки имеют уникальные аминокислотные последовательности и что, по-видимому, не существует никаких ограничений на порядок аминокислот в полипептиде. Имелись данные о том, что белки состоят примерно из 20—23 различных аминокислот, однако списки различались у разных авторов. В генетике была сформирована концепция «один ген — один фермент» (более точно «один ген — один полипептид»), также было установлено, что гены это ДНК, а не белки. В 1953 году Уотсон и Крик опубликовали две работы: в первой говорилось о вторичной структуре ДНК, а во второй — о возможном механизме копирования ДНК путём матричного синтеза. В последней работе, они указали на то, что определённая последовательность оснований является кодом, который несёт генетическую информацию. Теперь предстояло решить вопрос о том, как эта последовательность оснований определяет последовательность аминокислот в белках. Хотя некоторые предположения о механизме кодирования высказывались и раньше, первым кто предложил абстрактную гипотезу кодирования, а также способ её проверки, был советский и американский физик-теоретик Георгий (Джордж) Гамов.

Свойства

  1. Триплетность — значащей единицей кода является сочетание трёх нуклеотидов (триплет, или кодон).
  2. Непрерывность — между триплетами нет знаков препинания, то есть информация считывается непрерывно.
  3. Неперекрываемость — один и тот же нуклеотид не может входить одновременно в состав двух или более триплетов (не соблюдается для некоторых перекрывающихся генов вирусов, митохондрий и бактерий, которые кодируют несколько белков, считывающихся со сдвигом рамки).
  4. Однозначность (специфичность) — определённый кодон соответствует только одной аминокислоте (однако, кодон UGA у Euplotes crassus кодирует две аминокислоты — цистеин и селеноцистеин)
  5. Вырожденность (избыточность) — одной и той же аминокислоте может соответствовать несколько кодонов.
  6. Универсальность — генетический код работает одинаково в организмах разного уровня сложности — от вирусов до человека (на этом основаны методы генной инженерии; есть ряд исключений, показанный в таблице раздела «Вариации стандартного генетического кода» ниже).
  7. Помехоустойчивость — мутации замен нуклеотидов, не приводящие к смене класса кодируемой аминокислоты, называют консервативными; мутации замен нуклеотидов, приводящие к смене класса кодируемой аминокислоты, называют радикальными.

Таблицы соответствия кодонов мРНК и аминокислот

Генетический код, общий для большинства про- и эукариот. В таблице приведены все 64 кодона и указаны соответствующие аминокислоты. Порядок оснований — от 5' к 3' концу мРНК.
2-е основание
U C A G
1-е
основание
U

UUU (Phe/F)Фенилаланин
UUC (Phe/F)Фенилаланин
UUA (Leu/L)Лейцин
UUG (Leu/L)Лейцин

UCU (Ser/S)Серин
UCC (Ser/S)Серин
UCA (Ser/S)Серин
UCG (Ser/S)Серин

UAU (Tyr/Y)Тирозин
UAC (Tyr/Y)Тирозин
UAA Ochre (Стоп)
UAG Amber (Стоп)

UGU (Cys/C)Цистеин
UGC (Cys/C)Цистеин
UGA Opal (Стоп)
UGG (Trp/W)Триптофан

C

CUU (Leu/L)Лейцин
CUC (Leu/L)Лейцин
CUA (Leu/L)Лейцин
CUG (Leu/L)Лейцин

CCU (Pro/P)Пролин
CCC (Pro/P)Пролин
CCA (Pro/P)Пролин
CCG (Pro/P)Пролин

CAU (His/H)Гистидин
CAC (His/H)Гистидин
CAA (Gln/Q)Глутамин
CAG (Gln/Q)Глутамин

CGU (Arg/R)Аргинин
CGC (Arg/R)Аргинин
CGA (Arg/R)Аргинин
CGG (Arg/R)Аргинин

A

AUU (Ile/I)Изолейцин
AUC (Ile/I)Изолейцин
AUA (Ile/I)Изолейцин
AUG (Met/M)Метионин, Start[12]

ACU (Thr/T)Треонин
ACC (Thr/T)Треонин
ACA (Thr/T)Треонин
ACG (Thr/T)Треонин

AAU (Asn/N)Аспарагин
AAC (Asn/N)Аспарагин
AAA (Lys/K)Лизин
AAG (Lys/K)Лизин

AGU (Ser/S)Серин
AGC (Ser/S)Серин
AGA (Arg/R)Аргинин
AGG (Arg/R)Аргинин

G

GUU (Val/V)Валин
GUC (Val/V)Валин
GUA (Val/V)Валин
GUG (Val/V)Валин

GCU (Ala/A)Аланин
GCC (Ala/A)Аланин
GCA (Ala/A)Аланин
GCG (Ala/A)Аланин

GAU (Asp/D)Аспарагиновая кислота
GAC (Asp/D)Аспарагиновая кислота
GAA (Glu/E)Глутаминовая кислота
GAG (Glu/E)Глутаминовая кислота

GGU (Gly/G)Глицин
GGC (Gly/G)Глицин
GGA (Gly/G)Глицин
GGG (Gly/G)Глицин

Секторный вариант записи, внутренний круг — 1-е основание кодона (от 5'-конца)


Обратная таблица (указаны кодоны для каждой аминокислоты, а также стоп-кодоны)
Ala/A GCU, GCC, GCA, GCG Leu/L UUA, UUG, CUU, CUC, CUA, CUG
Arg/R CGU, CGC, CGA, CGG, AGA, AGG Lys/K AAA, AAG
Asn/N AAU, AAC Met/M AUG
Asp/D GAU, GAC Phe/F UUU, UUC
Cys/C UGU, UGC Pro/P CCU, CCC, CCA, CCG
Gln/Q CAA, CAG Ser/S UCU, UCC, UCA, UCG, AGU, AGC
Glu/E GAA, GAG Thr/T ACU, ACC, ACA, ACG
Gly/G GGU, GGC, GGA, GGG Trp/W UGG
His/H CAU, CAC Tyr/Y UAU, UAC
Ile/I AUU, AUC, AUA Val/V GUU, GUC, GUA, GUG
START AUG STOP UAG, UGA, UAA

Вариации стандартного генетического кода

Первый пример отклонения от стандартного генетического кода был открыт в 1979 году при исследовании генов митохондрий человека. С того времени было найдено несколько подобных вариантов[13], включая многообразные альтернативные митохондриальные коды,[14] например, прочитывание стоп-кодона УГА в качестве кодона, определяющего триптофан у микоплазм. У бактерий и архей ГУГ и УУГ часто используются как стартовые кодоны. В некоторых случаях гены начинают кодировать белок со старт-кодона, который отличается от обычно используемого данным видом[13]. В некоторых белках нестандартные аминокислоты, такие как селеноцистеин и пирролизин, вставляются рибосомой, прочитывающей стоп-кодон, что зависит от последовательностей в мРНК. Селеноцистеин сейчас рассматривается в качестве 21-й, а пирролизин 22-й аминокислот, входящих в состав белков. Несмотря на эти исключения, у всех живых организмов генетический код имеет общие черты: кодон состоят из трёх нуклеотидов, где два первых являются определяющими, кодоны транслируются тРНК и рибосомами в последовательность аминокислот. Отклонения от стандартного генетического кода.

Отклонения от стандартного генетического кода.
Пример Кодон Обычное значение Читается как:
Некоторые виды дрожжей рода Candida CUG Лейцин Серин
Митохондрии, в частности у Saccharomyces cerevisiae CU(U, C, A, G) Лейцин Серин
Митохондрии высших растений CGG Аргинин Триптофан
Митохондрии (у всех без исключения исследованных организмов) UGA Стоп Триптофан
Митохондирии млекопитающих, дрозофилы, S. cerevisiae и многих простейших AUA Изолейцин Метионин = Старт
Прокариоты GUG Валин Старт
Эукариоты (редко) CUG Лейцин Старт
Эукариоты (редко) GUG Валин Старт
Прокариоты (редко) UUG Лейцин Старт
Эукариоты (редко) ACG Треонин Старт
Митохондрии млекопитающих AGC, AGU Серин Стоп
Митохондрии дрозофилы AGA Аргинин Стоп
Митохондрии млекопитающих AG(A, G) Аргинин Стоп

Эволюция

Считается, что триплетный код сложился достаточно рано в ходе эволюции жизни. Но существование различий в некоторых организмах, появившихся на разных эволюционных стадиях, указывает на то, что он был не всегда таким.

Согласно некоторым моделям, сначала код существовал в примитивном виде, когда малое число кодонов обозначало сравнительно небольшое число аминокислот. Более точное значение кодонов и большее число аминокислот могли быть введены позже. Сначала только первые два из трёх оснований могли быть использованы для узнавания [что зависит от структуры тРНК].

Б. Льюин. Гены, М.: 1987, с. 62.

ДезоксирибоНуклеиновая Кислота

ДНК — макромолекула (одна из трех основных, две другие — РНК и белки), обеспечивающая хранение, передачу из поколения в поколение и реализацию генетической программы развития и функционирования живых организмов. ДНК содержит информацию о структуре различных видов РНК и белков.
В клетках эукариот (животных, растений и грибов) ДНК находится в ядре клетки в составе хромосом, а также в некоторых клеточных органоидах (митохондриях и пластидах). В клетках прокариотических организмов (бактерий и архей) кольцевая или линейная молекула ДНК, так называемый нуклеоид, прикреплена изнутри к клеточной мембране. У них и у низших эукариот (например, дрожжей) встречаются также небольшие автономные, преимущественно кольцевые молекулы ДНК, называемые плазмидами. Кроме того, одно- или двухцепочечные молекулы ДНК могут образовывать геном ДНК-содержащих вирусов.
С химической точки зрения ДНК — это длинная полимерная молекула, состоящая из повторяющихся блоков — нуклеотидов. Каждый нуклеотид состоит из азотистого основания, сахара (дезоксирибозы) и фосфатной группы. Связи между нуклеотидами в цепи образуются за счёт дезоксирибозы и фосфатной группы (фосфодиэфирные связи). В подавляющем большинстве случаев (кроме некоторых вирусов, содержащих одноцепочечную ДНК) макромолекула ДНК состоит из двух цепей, ориентированных азотистыми основаниями друг к другу. Эта двухцепочечная молекула спирализована. В целом структура молекулы ДНК получила название «двойной спирали».
В ДНК встречается четыре вида азотистых оснований (аденин, гуанин, тимин и цитозин). Азотистые основания одной из цепей соединены с азотистыми основаниями другой цепи водородными связями согласно принципу комплементарности: аденин соединяется только с тимином, гуанин — только с цитозином. Последовательность нуклеотидов позволяет «кодировать» информацию о различных типах РНК, наиболее важными из которых являются информационные, или матричные (мРНК), рибосомальные (рРНК) и транспортные (тРНК). Все эти типы РНК синтезируются на матрице ДНК за счёт копирования последовательности ДНК в последовательность РНК, синтезируемой в процессе транскрипции, и принимают участие в биосинтезе белков (процессе трансляции). Помимо кодирующих последовательностей, ДНК клеток содержит последовательности, выполняющие регуляторные и структурные функции. Кроме того, в геноме эукариот часто встречаются участки, принадлежащие «генетическим паразитам», например, транспозонам.
Расшифровка структуры ДНК (1953 г.) стала одним из поворотных моментов в истории биологии. За выдающийся вклад в это открытие Фрэнсису Крику, Джеймсу Уотсону и Морису Уилкинсу была присуждена Нобелевская премия по физиологии или медицине 1962 г. Розалинд Франклин, которая получила рентгенограммы, без которых Уотсон и Крик не имели бы возможность сделать выводы о структуре ДНК, умерла в 1958 г. от рака, а Нобелевскую премию не дают посмертно.

Структура молекулы. Нуклеотиды

Adenine.svg Guanine chemical structure Thymine chemical structure Cytosine chemical structure
Аденин Гуанин Тимин Цитозин
Структуры оснований, наиболее часто встречающихся в составе ДНК

ДНК представляет собой биополимер (полианион), мономером которого является нуклеотид. Каждый нуклеотид состоит из остатка фосфорной кислоты, присоединённого по 5'-положению к сахару дезоксирибозе, к которому также через гликозидную связь (C—N) по 1'-положению присоединено одно из четырёх азотистых оснований. Именно наличие характерного сахара и составляет одно из главных различий между ДНК и РНК, зафиксированное в названиях этих нуклеиновых кислот (в состав РНК входит сахар рибоза)[7]. Пример нуклеотида — аденозинмонофосфат, у которого основанием, присоединённым к фосфату и рибозе, является аденин (показан на рисунке). Исходя из структуры молекул, основания, входящие в состав нуклеотидов, разделяют на две группы: пурины (аденин [A] и гуанин [G]) образованы соединёнными пяти- и шестичленным гетероциклами; пиримидины (цитозин [C] и тимин [T]) — шестичленным гетероциклом[8]. В виде исключения, например, у бактериофага PBS1, в ДНК встречается пятый тип оснований — урацил ([U]), пиримидиновое основание, отличающееся от тимина отсутствием метильной группы на кольце, обычно заменяющее тимин в РНК. Следует отметить, что тимин и урацил не так строго приурочены к ДНК и РНК соответственно, как это считалось ранее. Так, после синтеза некоторых молекул РНК значительное число урацилов в этих молекулах метилируется с помощью специальных ферментов, превращаясь в тимин. Это происходит в транспортных и рибосомальных РНК.

Двойная спираль

В зависимости от концентрации ионов и нуклеотидного состава молекулы, двойная спираль ДНК в живых организмах существует в разных формах. На рисунке представлены формы A, B и Z (слева направо)

Полимер ДНК обладает довольно сложной структурой. Нуклеотиды соединены между собой ковалентно в длинные полинуклеотидные цепи. Эти цепи в подавляющем большинстве случаев (кроме некоторых вирусов, обладающих одноцепочечными ДНК-геномами) попарно объединяются при помощи водородных связей во вторичную структуру, получившую название двойной спирали. Остов каждой из цепей состоит из чередующихся фосфатов и сахаров[11]. Внутри одной цепи ДНК соседние нуклеотиды соединены фосфодиэфирными связями, которые формируются в результате взаимодействия между 3'-гидроксильной (3'—ОН) группой молекулы дезоксирибозы одного нукдеотида и 5'-фосфатной группой (5'—РО3) другого. Асимметричные концы цепи ДНК называются 3' (три прим) и 5' (пять прим). Полярность цепи играет важную роль при синтезе ДНК (удлинение цепи возможно только путём присоединения новых нуклеотидов к свободному 3'-концу). Как уже было сказано выше, у подавляющего большинства живых организмов ДНК состоит не из одной, а из двух полинуклеотидных цепей. Эти две длинные цепи закручены одна вокруг другой в виде двойной спирали, стабилизированной водородными связями, образующимися между обращёнными друг к другу азотистыми основаниями входящих в неё цепей. В природе эта спираль, чаще всего, правозакрученная. Направления от 3'-конца к 5'-концу в двух цепях, из которых состоит молекула ДНК, противоположны (цепи «антипараллельны» друг другу). Ширина двойной спирали составляет от 22 до 24 A, или 2,2 — 2,4 нм, длина каждого нуклеотида 3,3 A (0,33 нм). Подобно тому, как в винтовой лестнице сбоку можно увидеть ступеньки, на двойной спирали ДНК в промежутках между фосфатным остовом молекулы можно видеть рёбра оснований, кольца которых расположены в плоскости, перпендикулярной по отношению к продольной оси макромолекулы. В двойной спирали различают малую (12 A) и большую (22 A) бороздки. Белки, например, факторы транскрипции, которые присоединяются к определённым последовательностям в двухцепочечной ДНК, обычно взаимодействуют с краями оснований в большой бороздке, где те более доступны.

Образование связей между основаниями

Каждое основание на одной из цепей связывается с одним определённым основанием на второй цепи. Такое специфическое связывание называется комплементарным. Пурины комплементарны пиримидинам (то есть, способны к образованию водородных связей с ними): аденин образует связи только с тимином, а цитозин — с гуанином. В двойной спирали цепочки также связаны с помощью гидрофобных взаимодействий и стэкинга, которые не зависят от последовательности оснований ДНК. Комплементарность двойной спирали означает, что информация, содержащаяся в одной цепи, содержится и в другой цепи. Обратимость и специфичность взаимодействий между комплементарными парами оснований важна для репликации ДНК и всех остальных функций ДНК в живых организмах. Так как водородные связи нековалентны, они легко разрываются и восстанавливаются. Цепочки двойной спирали могут расходиться как замок-молния под действием ферментов (хеликазы) или при высокой температуре. Разные пары оснований образуют разное количество водородных связей. АТ связаны двумя, ГЦ — тремя водородными связями, поэтому на разрыв ГЦ требуется больше энергии. Процент ГЦ-пар и длина молекулы ДНК определяют количество энергии, необходимой для диссоциации цепей: длинные молекулы ДНК с большим содержанием ГЦ более тугоплавки. Части молекул ДНК, которые из-за их функций должны быть легко разделяемы, например ТАТА последовательность в бактериальных промоторах, обычно содержат большое количество А и Т.

Химические модификации оснований. Метилирование ДНК

Интеркалированное химическое соединение, которое находится в середине спирали — бензопирен, основной мутаген табачного дыма

Структура хроматина влияет на транскрипцию генов: участки гетерохроматина (отсутствие или низкий уровень транскрипции генов) коррелируют с метилированием цитозина. Например, метилирование цитозина с образованием 5-метилцитозина важно для инактивации Х-хромосомы. Средний уровень метилирования отличается у разных организмов, так, у нематоды Caenorhabditis elegans метилирование цитозина не наблюдается, а у позвоночных обнаружен высокий уровень метилирования — до 1 %. Несмотря на биологическую роль, 5-метилцитозин может спонтанно утрачивать аминную группу (деаминироваться), превращаясь в тимин, поэтому метилированные цитозины являются источником повышенного числа мутаций. Другие модификации оснований включают метилирование аденина у бактерий и гликозилирование урацила с образованием «J-основания» в кинетопластах.

Повреждения ДНК. Мутация.

ДНК может повреждаться разнообразными мутагенами, к которым относятся окисляющие и алкилирующие вещества, а также высокоэнергетическая электромагнитная радиация — ультрафиолетовое и рентгеновское излучение. Тип повреждения ДНК зависит от типа мутагена. Например, ультрафиолет повреждает ДНК путём образования в ней димеров тимина, которые возникают при образовании ковалентных связей между соседними основаниями. Оксиданты, такие как свободные радикалы или перекись водорода, приводят к нескольким типам повреждения ДНК, включая модификации оснований, в особенности гуанозина, а также двухцепочечные разрывы в ДНК. По некоторым оценкам, в каждой клетке человека окисляющими соединениями ежедневно повреждается порядка 500 оснований. Среди разных типов повреждений наиболее опасные — это двухцепочечные разрывы, потому что они трудно репарируются и могут привести к потерям участков хромосом (делециям) и транслокациям. Многие молекулы мутагенов вставляются (интеркалируют) между двумя соседними парами оснований. Большинство этих соединений, например, этидий, даунорубицин, доксорубицин и талидомид имеют ароматическую структуру. Для того чтобы интеркалирующее соединение могло поместиться между основаниями, они должны разойтись, расплетая и нарушая структуру двойной спирали. Эти изменения в структуре ДНК мешают транскрипции и репликации, вызывая мутации. Поэтому интеркалирующие соединения часто являются канцерогенами, наиболее известные из которых — бензопирен, акридины, афлатоксин и бромистый этидий. Несмотря на эти негативные свойства, в силу их способности подавлять транскрипцию и репликацию ДНК, интеркалирующие соединения используются в химиотерапии для подавления быстро растущих клеток рака.

Суперскрученность. Суперскрученная ДНК

Если взяться за концы верёвки и начать скручивать их в разные стороны, она становится короче и на верёвке образуются «супервитки». Так же может быть суперскручена и ДНК. В обычном состоянии цепочка ДНК делает один оборот на каждые 10,4 основания, но в суперскрученном состоянии спираль может быть свёрнута туже или расплетена. Выделяют два типа суперскручивания: положительное — в направлении нормальных витков, при котором основания расположены ближе друг к другу; и отрицательное — в противоположном направлении. В природе молекулы ДНК обычно находятся в отрицательном суперскручивании, которое вносится ферментами — топоизомеразами. Эти ферменты удаляют дополнительное скручивание, возникающее в ДНК в результате транскрипции и репликации.

Структуры на концах хромосом

Структура теломер. Зелёным цветом показан ион металла, хелатированный в центре структуры

На концах линейных хромосом находятся специализированные структуры ДНК, называемые теломерами. Основная функция этих участков — поддержание целостности концов хромосом. Теломеры также защищают концы ДНК от деградации экзонуклеазами и предотвращают активацию системы репарации. Поскольку обычные ДНК-полимеразы не могут реплицировать 3' концы хромосом, это делает специальный фермент — теломераза. В клетках человека теломеры часто представлены одноцепочечной ДНК и состоят из нескольких тысяч повторяющихся единиц последовательности ТТАГГГ. Эти последовательности с высоким содержанием гуанина стабилизируют концы хромосом, формируя очень необычные структуры, называемые G-квадруплексами и состоящие из четырёх, а не двух взаимодействующих оснований. Четыре гуаниновых основания, все атомы которых находятся в одной плоскости, образуют пластинку, стабилизированную водородными связями между основаниями и хелатированием в центре неё иона металла (чаще всего калия). Эти пластинки располагаются стопкой друг над другом. На концах хромосом могут образовываться и другие структуры: основания могут быть расположены в одной цепочке или в разных параллельных цепочках. Кроме этих «стопочных» структур теломеры формируют большие петлеобразные структуры, называемые Т-петли или теломерные петли. В них одноцепочечная ДНК располагается в виде широкого кольца, стабилизированного теломерными белками. В конце Т-петли одноцепочечная теломерная ДНК присоединяется к двухцепочечной ДНК, нарушая спаривание цепочек в этой молекуле и образуя связи с одной из цепей. Это трёхцепочечное образование называется Д-петля (от англ. displacement loop).

Биологические функции

ДНК является носителем генетической информации, записанной в виде последовательности нуклеотидов с помощью генетического кода. С молекулами ДНК связаны два основополагающих свойства живых организмов — наследственность и изменчивость. В ходе процесса, называемого репликацией ДНК, образуются две копии исходной цепочки, наследуемые дочерними клетками при делении, таким образом образовавшиеся клетки оказываются генетически идентичны исходной. Генетическая информация реализуется при экспрессии генов в процессах транскрипции (синтеза молекул РНК на матрице ДНК) и трансляции (синтеза белков на матрице РНК). Последовательность нуклеотидов «кодирует» информацию о различных типах РНК: информационных, или матричных (мРНК), рибосомальных (рРНК) и транспортных (тРНК). Все эти типы РНК синтезируются на основе ДНК в процессе транскрипции. Роль их в биосинтезе белков (процессе трансляции) различна. Информационная РНК содержит информацию о последовательности аминокислот в белке, рибосомальные РНК служат основой для рибосом (сложных нуклеопротеиновых комплексов, основная функция которых — сборка белка из отдельных аминокислот на основе иРНК), транспортные РНК доставляют аминокислоты к месту сборки белков — в активный центр рибосомы, «ползущей» по иРНК.

Структура генома. Геном, Ген, Клеточное ядро, Хроматин, Хромосома

ДНК генома бактериофага: фотография под просвечивающим электронным микроскопом

Большинство природных ДНК имеет двухцепочечную структуру, линейную (эукариоты, некоторые вирусы и отдельные роды бактерий) или кольцевую (прокариоты, хлоропласты и митохондрии). Линейную одноцепочечную ДНК содержат некоторые вирусы и бактериофаги. Молекулы ДНК находятся in vivo в плотно упакованном, конденсированном состоянии. В клетках эукариот ДНК располагается главным образом в ядре в виде набора хромосом. Бактериальная (прокариоты) ДНК обычно представлена одной кольцевой молекулой ДНК, расположенной в неправильной формы образовании в цитоплазме, называемым нуклеоидом. Генетическая информация генома состоит из генов. Ген — единица передачи наследственной информации и участок ДНК, который влияет на определённую характеристику организма. Ген содержит открытую рамку считывания, которая транскрибируется, а также регуляторные последовательности (англ.)русск., например, промотор и энхансер, которые контролируют экспрессию открытых рамок считывания. У многих видов только малая часть общей последовательности генома кодирует белки. Так, только около 1,5% генома человека состоит из кодирующих белок экзонов, а больше 50% ДНК человека состоит из некодирующих повторяющихся последовательностей ДНК. Причины наличия такого большого количества некодирующей ДНК в эукариотических геномах и огромная разница в размерах геномов (С-значение) — одна из неразрешённых научных загадок; исследования в этой области также указывают на большое количество фрагментов реликтовых вирусов в этой части ДНК.

Последовательности генома, не кодирующие белок. Некодирующая ДНК

В настоящее время накапливается всё больше данных, противоречащих идее о некодирующих последовательностях как «мусорной ДНК» (англ. junk DNA). Теломеры и центромеры содержат малое число генов, но они важны для функционирования и стабильности хромосом. Часто встречающаяся форма некодирующих последовательностей человека — псевдогены, копии генов, инактивированные в результате мутаций. Эти последовательности нечто вроде молекулярных ископаемых, хотя иногда они могут служить исходным материалом для дупликации и последующей дивергенции генов. Другой источник разнообразия белков в организме — это использование интронов в качестве «линий разреза и склеивания» в альтернативном сплайсинге. Наконец, некодирующие белок последовательности могут кодировать вспомогательные клеточные РНК, например, мяРНК. Недавнее исследование транскрипции генома человека показало, что 10% генома даёт начало полиаденилированным РНК, а исследование и генома мыши показало, что 62% его транскрибируется.

Транскрипция и трансляция. Генетический код

Генетическая информация, закодированная в ДНК, должна быть прочитана и в конечном итоге выражена в синтезе различных биополимеров, из которых состоят клетки. Последовательность оснований в цепочке ДНК напрямую определяет последовательность оснований в РНК, на которую она «переписывается» в процессе, называемом транскрипцией. В случае мРНК эта последовательность определяет аминокислоты белка. Соотношение между нуклеотидной последовательностью мРНК и аминокислотной последовательностью определяется правилами трансляции, которые называются генетическим кодом. Генетический код состоит из трёхбуквенных «слов», называемых кодонами, состоящих из трёх нуклеотидов (то есть ACT CAG TTT и т. п.). Во время транскрипции нуклеотиды гена копируются на синтезируемую РНК РНК-полимеразой. Эта копия в случае мРНК декодируется рибосомой, которая «читает» последовательность мРНК, осуществляя спаривание матричной РНК с транспортными РНК, которые присоединены к аминокислотам. Поскольку в трёхбуквенных комбинациях используются 4 основания, всего возможны 64 кодона (4? комбинации). Кодоны кодируют 20 стандартных аминокислот, каждой из которых соответствует в большинстве случаев более одного кодона. Один из трёх кодонов, которые располагаются в конце мРНК, не означает аминокислоту и определяет конец белка, это «стоп» или «нонсенс» кодоны — TAA, TGA, TAG.

Репликация ДНК

Деление клеток необходимо для размножения одноклеточного и роста многоклеточного организма, но до деления клетка должна удвоить геном, чтобы дочерние клетки содержали ту же генетическую информацию, что и исходная клетка. Из нескольких теоретически возможных механизмов удвоения (репликации) ДНК реализуется полуконсервативный. Две цепочки разделяются, а затем каждая недостающая комплементарная последовательность ДНК воспроизводится ферментом ДНК-полимеразой. Этот фермент строит полинуклеотидную цепь, находя правильное основание через комплементарное спаривание оснований и присоединяя его к растущей цепочке. ДНК-полимераза не может начинать новую цепь, а только лишь наращивать уже существующую, поэтому она нуждается в короткой цепочке нуклеотидов (праймере), синтезируемой праймазой. Так как ДНК-полимеразы могут строить цепочку только в направлении 5' --> 3', для копирования антипараллельных цепей используются разные механизмы.

Взаимодействие с белками

Взаимодействие фактора транскрипции STAT3 с ДНК (показана в виде синей спирали)

Все функции ДНК зависят от её взаимодействия с белками. Взаимодействия могут быть неспецифическими, когда белок присоединяется к любой молекуле ДНК, или зависеть от наличия особой последовательности. Ферменты также могут взаимодействовать с ДНК, из них наиболее важные — это РНК-полимеразы, которые копируют последовательность оснований ДНК на РНК в транскрипции или при синтезе новой цепи ДНК — репликации.

Структурные и регуляторные белки

Хорошо изученными примерами взаимодействия белков и ДНК, не зависящего от нуклеотидной последовательности ДНК, является взаимодействие со структурными белками. В клетке ДНК связана с этими белками, образуя компактную структуру, которая называется хроматин. У прокариот хроматин образован при присоединении к ДНК небольших щелочных белков — гистонов, менее упорядоченный хроматин прокариот содержит гистон-подобные белки. Гистоны формируют дискообразную белковую структуру — нуклеосому, вокруг каждой из которых вмещается два оборота спирали ДНК. Неспецифические связи между гистонами и ДНК образуются за счёт ионных связей щелочных аминокислот гистонов и кислотных остатков сахарофосфатного остова ДНК. Химические модификации этих аминокислот включают метилирование, фосфорилирование и ацетилирование. Эти химические модификации изменяют силу взаимодействия между ДНК и гистонами, влияя на доступность специфических последовательностей для факторов транскрипции и изменяя скорость транскрипции. Другие белки в составе хроматина, которые присоединяются к неспецифическим последовательностям — белки с высокой подвижностью в гелях, которые ассоциируют большей частью с согнутой ДНК. Эти белки важны для образования в хроматине структур более высокого порядка. Особая группа белков, присоединяющихся к ДНК, — это белки, которые ассоциируют с одноцепочечной ДНК. Наиболее хорошо охарактеризованный белок этой группы у человека — репликационный белок А, без которого невозможно протекание большинства процессов, где расплетается двойная спираль, включая репликацию, рекомбинацию и репарацию. Белки этой группы стабилизируют одноцепочечную ДНК и предотвращают формирование стеблей-петель или деградации нуклеазами. В то же время другие белки узнают и присоединяются к специфическим последовательностям. Наиболее изученная группа таких белков — различные классы факторов транскрипции, то есть белки, регулирующие транскрипцию. Каждый из этих белков узнаёт свою последовательность, часто в промоторе, и активирует или подавляет транскрипцию гена. Это происходит при ассоциации факторов транскрипции с РНК-полимеразой либо напрямую, либо через белки-посредники. Полимераза ассоциирует сначала с белками, а потом начинает транскрипцию. В других случаях факторы транскрипции могут присоединяться к ферментам, которые модифицируют находящиеся на промоторах гистоны, что изменяет доступность ДНК для полимераз. Так как специфические последовательности встречаются во многих местах генома, изменения в активности одного типа фактора транскрипции могут изменить активность тысяч генов. Соответственно, эти белки часто регулируются в процессах ответа на изменения в окружающей среде, развития организма и дифференцировки клеток. Специфичность взаимодействия факторов транскрипции с ДНК обеспечивается многочисленными контактами между аминокислотами и основаниями ДНК, что позволяет им «читать» последовательность ДНК. Большинство контактов с основаниями происходит в главной бороздке, где основания более доступны.

Ферменты, модифицирующие ДНК. Топоизомеразы и хеликазы.

В клетке ДНК находится в компактном, т. н. суперскрученном состоянии, иначе она не смогла бы в ней уместиться. Для протекания жизненно важных процессов ДНК должна быть раскручена, что производится двумя группами белков — топоизомеразами и хеликазами. Топоизомеразы — ферменты, которые имеют и нуклеазную, и лигазную активности. Они изменяют степень суперскрученности в ДНК. Некоторые из этих ферментов разрезают спираль ДНК и позволяют вращаться одной из цепей, тем самым уменьшая уровень суперскрученности, после чего фермент заделывает разрыв. Другие ферменты могут разрезать одну из цепей и проводить вторую цепь через разрыв, а потом лигировать разрыв в первой цепи. Топоизомеразы необходимы во многих процессах, связанных с ДНК, таких как репликация и транскрипция. Хеликазы — белки, которые являются одним из молекулярных моторов. Они используют химическую энергию нуклеотидтрифосфатов, чаще всего АТФ, для разрыва водородных связей между основаниями, раскручивая двойную спираль на отдельные цепочки. Эти ферменты важны для большинства процессов, где белкам необходим доступ к основаниям ДНК.

Нуклеазы и лигазы.

ДНК-лигаза I (кольцеобразная структура, состоящая из нескольких одинаковых молекул белка, показанных разными цветами), лигирующая повреждённую цепь ДНК

В различных процессах, происходящих в клетке, например, рекомбинации и репарации, участвуют ферменты, способные разрезать и восстанавливать целостность нитей ДНК. Ферменты, разрезающие ДНК, носят название нуклеаз. Нуклеазы, которые гидролизуют нуклеотиды на концах молекулы ДНК, называются экзонуклеазами, а эндонуклеазы разрезают ДНК внутри цепи. Наиболее часто используемые в молекулярной биологии и генетической инженерии нуклеазы — это рестриктазы, которые разрезают ДНК около специфических последовательностей. Например, фермент EcoRV (рестрикционный фермент № 5 из E. coli) узнаёт шестинуклеотидную последовательность 5'-GAT|ATC-3' и разрезает ДНК в месте, указанном вертикальной линией. В природе эти ферменты защищают бактерии от заражения бактериофагами, разрезая ДНК фага, когда она вводится в бактериальную клетку. В этом случае нуклеазы — часть системы модификации-рестрикции. ДНК-лигазы сшивают сахарофосфатные основания в молекуле ДНК, используя энергию АТФ. Рестрикционные нуклеазы и лигазы используются в клонировании и фингерпринтинге (англ. Fingerprinting).

Полимеразы. ДНК-полимераза

Существует также важная для метаболизма ДНК группа ферментов, которые синтезируют цепи полинуклеотидов из нуклеозидтрифосфатов — ДНК-полимеразы. Они добавляют нуклеотиды к 3'-гидроксильной группе предыдущего нуклеотида в цепи ДНК, поэтому все полимеразы работают в направлении 5'--> 3'. В активном центре этих ферментов субстрат — нуклеозидтрифосфат — спаривается с комплементарным основанием в составе одноцепочечной полинуклеотидной цепочки — матрицы.
В процессе репликации ДНК ДНК-зависимая ДНК-полимераза синтезирует копию исходной последовательности ДНК. Точность очень важна в этом процессе, так как ошибки в полимеризации приведут к мутациям, поэтому многие полимеразы обладают способностью к «редактированию» — исправлению ошибок. Полимераза узнаёт ошибки в синтезе по отсутствию спаривания между неправильными нуклеотидами. После определения отсутствия спаривания активируется 3'--> 5' экзонуклеазная активность полимеразы, и неправильное основание удаляется. В большинстве организмов ДНК-полимеразы работают в виде большого комплекса, называемого реплисомой, которая содержит многочисленные дополнительные субъединицы, например, хеликазы.
РНК-зависимые ДНК-полимеразы — специализированный тип полимераз, которые копируют последовательность РНК на ДНК. К этому типу относится вирусный фермент обратная транскриптаза, который используется ретровирусами при инфекции клеток, а также теломераза, необходимая для репликации теломер. Теломераза — необычный фермент, потому что она содержит собственную матричную РНК.
Транскрипция осуществляется ДНК-зависимой РНК-полимеразой, которая копирует последовательность ДНК одной цепочки на мРНК. В начале транскрипции гена РНК-полимераза присоединяется к последовательности в начале гена, называемой промотором, и расплетает спираль ДНК. Потом она копирует последовательность гена на матричную РНК до тех пор, пока не дойдёт до участка ДНК в конце гена — терминатора, где она останавливается и отсоединяется от ДНК. Также как ДНК-зависимая ДНК-полимераза человека, РНК-полимераза II, которая транскрибирует большую часть генов в геноме человека, работает в составе большого белкового комплекса, содержащего регуляторные и дополнительные единицы.

Генетическая рекомбинация. Рекомбинация (биология)

Рекомбинация происходит в результате физического разрыва в хромосомах (М) и (F) и их последующего соединения с образованием двух новых хромосом (C1 and C2)

Двойная спираль ДНК обычно не взаимодействует с другими сегментами ДНК, и в человеческих клетках разные хромосомы пространственно разделены в ядре. Это расстояние между разными хромосомами важно для способности ДНК действовать в качестве стабильного носителя информации. В процессе рекомбинации с помощью ферментов две спирали ДНК разрываются, обмениваются участками, после чего непрерывность спиралей восстанавливается, поэтому обмен участками негомологичных хромосом может привести к повреждению целостности генетического материала. Рекомбинация позволяет хромосомам обмениваться генетической информацией, в результате этого образуются новые комбинации генов, что увеличивает эффективность естественного отбора и важно для быстрой эволюции новых белков. Генетическая рекомбинация также играет роль в репарации, особенно в ответе клетки на разрыв обеих цепей ДНК. Самая распространённая форма кроссинговера — это гомологичная рекомбинация, когда принимающие участие в рекомбинации хромосомы имеют очень похожие последовательности. Иногда в качестве участков гомологии выступают транспозоны. Негомологичная рекомбинация может привести к повреждению клетки, поскольку в результате такой рекомбинации возникают транслокации. Реакция рекомбинации катализируется ферментами, которые называются рекомбиназы, например, Cre. На первом этапе реакции рекомбиназа делает разрыв в одной из цепей ДНК, позволяя этой цепи отделиться от комплементарной цепи и присоединиться к одной из цепей второй хроматиды. Второй разрыв в цепи второй хроматиды позволяет ей также отделиться и присоединиться к оставшейся без пары цепи из первой хроматиды, формируя структуру Холлидея. Структура Холлидея может передвигаться вдоль соединённой пары хромосом, меняя цепи местами. Реакция рекомбинации завершается, когда фермент разрезает соединение, а две цепи лигируются.

Эволюция метаболизма, основанного на ДНК

ДНК содержит генетическую информацию, которая делает возможной жизнедеятельность, рост, развитие и размножение всех современных организмов. Однако как долго в течение четырёх миллиардов лет истории жизни на Земле ДНК была главным носителем генетической информации, неизвестно. Существуют гипотезы, что РНК играла центральную роль в обмене веществ, поскольку она может и переносить генетическую информацию, и осуществлять катализ с помощью рибозимов. Кроме того, РНК — один из основных компонентов «фабрик белка» — рибосом. Древний РНК-мир, где нуклеиновая кислота была использована и для катализа, и для переноса информации, мог послужить источником современного генетического кода, состоящего из четырёх оснований. Это могло произойти в результате того, что число оснований в организме было компромиссом между небольшим числом оснований, увеличивавшим точность репликации, и большим числом оснований, увеличивающим каталитическую активность рибозимов. К сожалению, древние генетические системы не дошли до наших дней. ДНК в окружающей среде в среднем сохраняется в течение 1 миллиона лет, а потом деградирует до коротких фрагментов. Извлечение ДНК и определение последовательности их 16S рРНК генов из бактериальных спор, заключённых в кристаллах соли 250 млн лет назад, служит темой оживлённой дискуссии в научной среде.

Гаплогруппа

В генетике человека — науке, изучающей генетическую историю человечества — группа схожих гаплотипов, имеющих общего предка, у которого в обоих гаплотипах имела место одна и та же мутация — однонуклеотидный полиморфизм. Термин «гаплогруппа» широко применяется в генетической генеалогии, где изучаются гаплогруппы Y-хромосомные (Y-ДНК), митохондриальные (мтДНК) и ГКГ-гаплогруппы. Генетические маркеры Y-ДНК передаются с Y-хромосомой исключительно по отцовской линии (то есть от отца сыновьям), а маркеры мтДНК — по материнской линии (от матери всем детям). Таким образом, мужчины являются носителями маркеров Y-ДНК.

Гаплотип

Сокр. от «гаплоидный генотип» — совокупность аллелей на локусах одной хромосомы, обычно наследуемых вместе. Если же при кроссинговере комбинация аллелей меняется (что происходит очень редко), говорят о возникновении нового гаплотипа. Гаплотип может быть как у одного локуса, так и у целого генома. Генотип определенных генов диплоидной особи состоит из двух гаплотипов, расположенных на двух хромосомах, полученных от матери и отца соответственно. В генетической генеалогии гаплотипом также называют результат исследования STR-маркеров на нескольких локусах Y хромосомы, при этом количество повторов называется аллелем.

Генотип и гаплотип

AA AT TT
GG AG AG AG TG TG TG
GC AG AC AG TC
or
AC TG
TT
CC AC AC AC TC TC TC

Не всегда возможно определить гаплотип особи по ее генотипу. Рассмотрим, например, диплоидный организм и два локуса (на одной хромосоме) каждый из которых имеет два возможных аллеля. Первый локус имеет аллели A и T, что дает 3 возможных генотипа AA, TT и AT. Второй локус имеет аллели C и G (генотипы CC,GG,CG). Таким образом для отдельно взятой особи существует 9 возможных генотипов по этой паре локусов. Как видно из таблицы, для организма, гомозиготного хотя бы по одному локусу, существует единственная комбинация гаплотипов (например, для генотипа AA GC соответствующими гаплотипами являются AG и AC). Если же особь гетерозиготна по обоим локусам, то возможны две комбинации гаплотипов. Точное определение гаплотипа обеспечивается только секвенированием. Однако существуют алгоритмы, позволяющие оценить вероятность определенного гаплотипа в случае подобной неопределености.

Генетическая генеалогия

Использует ДНК-тесты совместно с традиционными генеалогическими методами исследования. Обычно успех традиционных методов целиком зависит от сохранности и существования документов (например, переписных и писцовых книг, ревизских сказок и т. д.). Каждый человек несёт в себе своего рода «биологический документ», который не может быть утерян — это ДНК человека. Методы генетической генеалогии позволяют получить доступ к той части ДНК, которая передаётся неизменной от отца к сыну по прямой мужской линии — Y-хромосоме. ДНК-тест Y-хромосомы позволяет, например, двум мужчинам определить, разделяют ли они общего предка по мужской линии или нет. ДНК-тесты не просто помощь в генеалогических исследованиях — это современный передовой инструмент, который генеалоги могут использовать для того, чтобы установить или опровергнуть родственные связи между несколькими людьми. STR В процессе теста специальных ДНК-маркеров последовательность оснований в них повторяется множество раз (это называется «коротким тандемным повтором» (англ. Short Tandem Repeat)). Например, специальное оборудование читает последовательность ДНК так:


… CTGT TCTA TCTA TCTA TCTA TCTA TCTA TCTA TCTA TCTA TCTGCC …

Можно заметить, что TCTA повторяется 9 раз, а поскольку этот STR маркер называется DYS391 (DNA Y-chromosome Segment № 391) делается запись: DYS391 = 9. В этом маркере число повторений может быть между 7 и 14. Y-хромосома уникальна в этом отношении, потому что не подвергается кроссинговеру с каждым новым поколением. В результате слияния яйцеклетки и сперматозоида, ребёнок получает гены, которые будут являться смесью генов отца и матери. Но Y-хромосома передается только от отца, таким образом число повторов в маркерах сына будет тем же самым, что и у его отца. Диаграмма ниже показывает путь Y-хромосомы, которая путешествует вниз по всем мужским линиям, таким образом генетические кузены также разделят ту же самую Y-хромосому. Иногда число повторов увеличивается или уменьшается, обычно в одной из линий. Таким образом, отец может иметь DYS391 = 9, а его сын DYS391 = 10. Это называется мутацией и случается, когда ДНК копируется немного неправильно. Стоит отметить, что это естественное явление. Эти мутации очень важны, потому что учёные знают примерную частоту их возникновения, и таким образом можно высчитать приблизительное время, когда жил Ближайший Общий Предок (MRCA, Most Recent Common Ancestor)

Интерпретация результатов

После проверки и объединения результатов нескольких STR из одного генома определяется гаплотип, который может быть представлен в виде последовательности числа каждого маркера. Тест из 12 маркеров может быть похож на данную таблицу:

STR Маркеры Y-ДНК
19 385a 385b 388 389i 389ii 390 391 392 393 425 426
Your Haplotype 14 12 17 12 13 29 24 11 13 13 12 10

Маркеры STR записаны в заголовке, а сам гаплотип в ячейках таблицы. Так, например, для DYS19 написано 14 повторов. Гаплотип может дать информацию о том, откуда произошла ваша Y-хромосома, то есть проследить весь путь предков данного человека в течение 100 тысяч лет. Например, Атлантический Модальный Гаплотип (AMH) определен только шестью маркерами, и это самый общий гаплотип в Западной Европе.

19 388 390 391 392 393
14 12 24 11 13 13

В базе данных YHRD каждый может сравнить его гаплотип с другими занесенными в неё образцами. Эта база данных содержит большое количество евразийских образцов, а теперь содержит ещё и образцы американцев и жителей восточной Азии, а также эскимосов. База данных YHDR использует до одиннадцати маркеров. Кроме этого, Ybase — полезный инструмент исследователя, позволяет добавить результаты своих тестов Y-хромосомы в базу данных. Интереснейший проект-база данных гаплотипов и генеалогических данных — Sorenson Molecular Genealogy Foundation. После заполнения в критериях поиска гаплотип программа покажет в результатах самые близкие по совпадениям гаплотипы с фамилиями людей и покажет генеалогическое древо, где будет показан предполагаемый общий предок и все другие образцы, с которыми совпали результаты маркеров. В этой базе данных зарегистрировано более 50000 гаплотипов. Тестирование Y-хромосомы наиболее интересно, если сравнивать результаты двух и более человек совместно с результатами традиционных генеалогических поисков. Ниже описан гипотетический случай, где три генетических кузена с одной фамилией прошли тест. В какой-то момент в прошлом этой семьи произошла единственная мутация в Y-хромосоме. Эта мутация оставила след в ДНК всех мужчин этой семьи . При сравнении их гаплотипов наблюдается следующее:

Y-DNA STR Markers
19 385a 385b 388 389i 389ii 390 391 392 393 425 426
Кузен 1 14 12 17 12 13 29 24 11 13 13 12 10
Кузен 2 14 12 17 12 13 29 24 11 13 13 12 10
Кузен 3 14 12 17 12 13 29 24 11 14 13 12 10

В этой таблице большинство чисел совпадают, за исключением маркера, помеченного серым цветом. У участника № 3 показана мутация в DYS392. Участники № 1 и № 2, цифры которых полностью совпадают, очень близкие родственники. Участник № 3 тоже является их родственником, но более далеким.

Использование результатов

Генетическая генеалогия помогает подтвердить результаты традиционных архивных исследований, показывая, что два или более человека с той же фамилией связаны родством, то есть имеют общего предка. Оценка времени жизни их гипотетического Общего Предка сводится к математике и статистике. Исследования показывают, что мутация в любом маркере — редкий случай, и происходит примерно каждые 500 поколений (то есть раз в 10000 лет). Если есть точное совпадение в 21 маркере, то среднее время, прошедшее с тех пор, когда жил Общий Предок (MRCA), только 8,3 поколений. Если есть хотя бы одно единственное несовпадение (мутация), тогда время увеличивается до 20,5 поколений. Сколько мутаций (несоответствий) должно присутствовать в результатах тестов двух людей, чтобы можно было исключить их принадлежность к одному клану? Большое количество мутаций говорит о более отдалённом родстве или его отсутствии. В случае с 21 маркером 2 мутации между гаплотипами — это пограничный результат, а 3 мутации обычно исключают вообще достаточно близкое родство между этими людьми (в пределах тысячелетий).