Русский изменить

Ошибка: нет перевода

×

глава 12

Main page / Генетика XXII века / ГЕНЫ. ДНК. РНК / Триплет. Антисмысловая и кодирующая ДНК. Кодоны. Генетический код. Синонимичные кодоны. Кодоны глицина GGN. Старт-кодон AUG. Трансляция. 5′-НТО, 3′-НТО. 5′-НТО-интроны. Экспрессия гена. Гены домашнего хозяйства. Рибосома. Шпилька. Стебель и петля шпильки. Альтернативные 5′-НТО. Стоп-кодоны UGA, UAG и UAA. Основание+4. Трансляционное перекодирование

Содержание

    Свойства белка в сильнейшей степени зависят от его первичной структуры, от того – в каком именно порядке размещены аминокислотные остатки. Когда мы изучали белки, мы не думали о том – каким образом образовалась эта первичная структура, как именно происходит процесс выбора подходящей аминокислоты для того, чтобы ее остаток был вставлен на правильную позицию в первичной структуре – так, чтобы это соответствовало информации, записанной в генах. Сейчас мы знаем, что информация записана в ДНК, а структуру ДНК мы рассмотрели выше. И что там вообще может являться информацией? Разумеется, не сахарофосфатный остов, потому что на всем протяжении всех молекул ДНК он один и тот же. Но вот что в ДНК не одно и то же, так это последовательность азотистых оснований. Их четыре разновидности, и они чередуются в каком-то порядке. Можно ли с помощью чередования четырех разных азотистых оснований зашифровать информацию об аминокислотах, встречающихся в белках? Для простоты мы будем сейчас рассматривать основные 20 протеиногенных аминокислот. Допустим, мы попробуем зашифровать эту информацию с помощью сочетания двух разных букв. АА, АГ, ГА, АЦ, ЦА, АТ, ТА, ГГ, ГЦ, ЦГ, ГТ, ТГ, ЦЦ, ЦТ, ТЦ, ТТ. Всё. Шестнадцать сочетаний из четырех элементов по два дает 16. А аминокислот 20. Недостаточно. Значит надо брать сочетания по три элемента. И именно так дело и обстоит. Определенному сочетанию из трех азотистых оснований (такое сочетание трех оснований называется триплетом) соответствует определенная аминокислота. Осталось понять – что в данном контексте означает «соответствует»?

    Взглянем на таблицу генетического кода:

     

    В ней указано – какому триплету матричной РНК соответствует та или иная аминокислота. В соответствии аминокислотам ставятся триплеты именно мРНК, а не ДНК, поскольку в рибосому попадает именно мРНК, и именно в соответствии со структурой мРНК и строится белок. Поэтому в таблице нет тимина (T), а есть урацил (U).

    Из двух цепочек ДНК, составляющих одну хромосому, только в одной из цепей зашифрована информация – она называется «смысловой цепочкой», или «смысловой ДНК». Возьмем смысловую ДНК, построим по ней мРНК, приведем мРНК к рибосоме и начнем считывать информацию в соответствии с таблицей (обязательно в направлении от 5` к 3`), т.е. смотреть – из каких триплетов состоит мРНК, и начать собирать белок из соответствующих аминокислот – одну за другой.

    Допустим, мы видим, что первые три азотистых основания – это GCU. Находим этот триплет в таблице и видим, что ему соответствует аланин. Следующий триплет – ACG, и ему соответствует треонин, и так далее. Рибосома так и будет поступать. Первым аминокислотным остатком (т.е. первым с N-конца) нового белка будет аланин, вторым – треонин и т.д. Вот и всё. На бумаге это чрезвычайно просто. Три триплета, напротив которых есть надпись «стоп», мы пока оставим в стороне.

    Сочетаний из четырех элементов по три, как легко видеть из таблицы, ровно 64. Минус три, соответствующих надписям «стоп», остается 61. Значит с помощью 61 триплета кодируется вся аминокислотная цепочка первичной структуры любого белка, и поэтому триплеты еще называют кодонами (от слова «кодировать»), хотя на самом деле желательно все же эти слова не путать, так как триплет – это любые три расположенные последовательно нуклеозида или дезоксинуклеозида, а кодон – это именно такая группа последовательно расположенных нуклеозидов, которая находится именно в мРНК и несет, таким образом, генетическую информацию. При этом на самом деле кодон вовсе не обязательно должен быть триплетом (см. ниже про 4-хбуквенные кодоны). В будущем для простоты изложения термины «кодон» и «триплет» используются как синонимы.

    Термин «генетический код» и обозначает совокупность правил, выраженных этой таблицей, согласно которым в живых клетках тот или иной триплет азотистых оснований переводится в конкретный, точно определенный аминокислотный остаток в составе первичной структуры белка. Как именно происходит считывание этой информации, и как по ней строится белок – об этом будет написано позже. На следующем рисунке видно, как информация с ДНК переносится через РНК к рибосоме, которая строит белок. Производство рибосомой белка согласно информации, заложенной в ДНК и переносимой мРНК, называется трансляцией.

    Здесь нужно разобраться в том – какую роль играет каждая из двух ДНК, составляющих этот участок хромосомы, и правильно запомнить их названия. Та ДНК, которая будет служить матрицей для производства мРНК путем подбора и соединения комплементарных оснований, называется матричной или антисмысловой. Вторая ДНК, которая не участвует в создании мРНК, называется смысловой или кодирующей. Понятно, что полученная мРНК будет идентична кодирующей ДНК (за тем исключением, что вместо тимина там будет урацил).

    В таблице мы видим, что некоторым аминокислотам соответствует сразу несколько кодонов, и в ряде случаев оказывается неважным – каким будет третье основание в триплете, потому что при любом третьем основании в белок будет вставлена одна и та же аминокислота. То есть в таких случаях аминокислота однозначно определяется первыми двумя основаниями, так что тут можно говорить и о двухбуквенных кодонах. Такой код, в котором нескольким исходным объектам соответствует один и тот же результат, называется вырожденным.

    Мы видим, что эти несколько кодонов, соответствующие одной аминокислоте, расположены не случайным образом, не вразброс. Например, глицину соответствуют все четыре кодона, начинающиеся с GG, а пролину – все четыре кодона, начинающиеся с CC и т.д. Это очень важная особенность кода. Представим себе, что в кодоне, кодирующем глицин, произошла точечная мутация. Если в результате этой мутации последнее азотистое основание будет заменено на любое другое, то… для организма вообще ничего не изменится! Этот триплет по-прежнему будет кодировать именно глицин. Вырожденность кода придает геному важную устойчивость, значительно уменьшая воздействие точечных мутаций.

    Кодоны, кодирующие одну и ту же аминокислоты, называются синонимичными.

    Важно, что в мРНК триплеты идут строго один за другим, без перекрываний и пропусков.

    В принципе, было бы полезным постепенно (подчеркиваю – постепенно!) запоминать эту таблицу. Во многих случаях такое знание облегчает восприятие материала, и можно начинать с самого простого. Вот совсем несложно запомнить, что все кодоны, начинающиеся с GG (мы можем их обозначить как GGN), кодируют глицин.

    Очень важно то, что генетический код является почти на 100% универсальным для всех организмов (исключения редки, и мы сейчас не будем их касаться). Это дает нам в руки уникальные возможности, потому что если в клетке человека определенный белок производится по определенному гену, то нам будет достаточно засунуть этот ген в геном бактерии, после чего безо всяких дополнительных хлопот мы получим результат: бактерия начнет производить нужные нам белки, используя свой собственный аппарат транскрипции и трансляции. Мы так и делаем, в результате чего умеем получать очень важные для создания лекарств белки практически в неограниченных количествах.

    Как видно из таблицы, кодон AUG, соответствующий метионину, является также и старт-кодоном (иначе – инициаторным кодоном) — первым кодоном мРНК, c которого рибосома и начинает строить белок. Этот кодон необходимо запомнить, чтобы в будущем легче было ориентироваться (мнемоническое правило: чтобы начать трансляцию, надо крикнуть рибосоме «AU, Go»).

    Теперь посмотрим повнимательней на ближайшее окружение старт-кодона в мРНК – тут все устроено довольно-таки непросто. Непосредственно перед старт-кодоном находится лидерная последовательность азотистых оснований. Более частое ее наименование — 5′-Нетранслируемая область. Кратко будем ее обозначать как 5′-НТО. «Пять штрих» указывает, что речь идет не о любой нетранслируемой области, а именно той, что находится в начальном секторе мРНК. «Нетранслируемая» означает, что эта область мРНК не несет в себе информации о том, из каких аминокислотных остатков будет создаваться белок.

    Такое же название — 5′-НТО — и у соответствующего участка ДНК, поэтому там, где из контекста непонятно – о чем идет речь, приходится говорить «5′-НТО РНК» или «5′-НТО ДНК».

    То, что этот участок нетранслируемый, совсем не означает, что он бесполезный – на самом деле он совершенно необходим, потому что в нем находятся элементы, которые занимаются регулированием нормального процесса трансляции. Под «элементами» я здесь имею в виду те или иные совокупности азотистых оснований мРНК, входящие в 5′-НТО.

    С другого конца мРНК тоже есть нетранслируемый участок, и он, естественно, обозначается как 3′-НТО.

    5′-НТО является не слишком длинной, и все же она имеет достаточную длину, чтобы там разместились все нужные регулирующие трансляцию элементы – у эукариотов это примерно 100-200 оснований. У некоторых организмов она достигает в длину несколько тысяч оснований, а у человека ее средняя длина – около 200, хотя разброс величин тут довольно большой: самая маленькая 5′-НТО в геноме человека имеет лишь 18 оснований, а самая большая – около 3000.

    Интересно, что содержание пар C-G в 5′-НТО больше, чем в 3′-НТО, причем у теплокровных позвоночных эта разница очень хорошо заметна: в их 5′-НТО находится 65% C-G, в то время как в 3′-НТО – лишь 45%.

    (Когда мы говорим об участках ДНК или РНК, рассматривая их как носителей информации для обеспечения функционирования механизмов транскрипции и последующей трансляции, то здесь значение имеет только то – какое азотистое основание находится на том или ином месте, поэтому я и пишу, что элементы 5′-НТО состоят из оснований. Если же мы говорим о ДНК или РНК с точки зрения структурного устройства, то конечно мы должны помнить, что их мономерами являются дезокси/нуклеозид монофосфаты). Для обозначения этих мономеров можно использовать и термин попроще: дезокси/нуклеотидный остаток (по аналогии с аминокислотным остатком).

    Интересно, что и в 5′-НТО, и в 3′-НТО имеются, как и в генах, не только «имеющие смысл участки», т.е. аналоги генных экзонов, но и участки, «не имеющие смысла», т.е. аналоги генных интронов. Здесь тоже надо понимать, что говоря о «неимении смысла», мы имеем в виду, что мы не обнаружили [пока что] их прямого (!) участия именно в процессах трансляции. Никогда заранее не знаешь в точности – не окажется ли так, что кажущийся нефункциональным тот или иной участок нуклеиновой кислоты обнаружит свою пользу в каких-то важных процессах.

    Есть некоторые закономерности в параметрах интронов этих двух типов: в 5′-НТО они примерно в два раза длиннее, чем интроны в кодирующей области, и это можно попробовать объяснить: интроны в кодирующей области в основном предназначены для того, чтобы мог осуществляться альтернативный сплайсинг, т.е. они в основном играют роль простого разделителя в довольно простом по сути объекте – в совокупности триплетов, в то время как интроны 5′-НТО находятся в области «управленческой» — в той, где расположены элементы, контролирующие процесс трансляции, и поэтому здесь требуется больше возможностей для более точной настройки процессов управления.

    Еще одна любопытная закономерность состоит в том, что чем чаще данный ген экспрессируется (т.е. по нему строится белок), тем короче его 5′-НТО-интроны, а зачастую у таких генов и вовсе нет 5′-НТО-интронов.

    Не менее странно то, что особенно много 5′-НТО-интронов в тех генах, по которым строятся белки, выполняющие регуляторные функции. Вообще в этой области нам пока еще многое непонятно.

    В целях удобства будущего изложения, введем довольно простой термин: гены домашнего хозяйства. Это такие гены, продукция которых необходима для того, чтобы поддерживать на оптимальном уровне важнейшие жизненные функции клетки в целом независимо от того – чем именно эта клетка занимается, на какой стадии развития находится и в какие ткани входит. К примеру, и клетка печени, и клетка мышцы должны осуществлять процессы репликации ДНК, транскрипции и трансляции, анаболизма и катаболизма. А вот если нужно произвести по некоему гену белок, который участвует в производстве эритроцитов, или другой белок, который входит в состав мышечного волокна – то гены, по которым такие белки строятся, уже не являются генами домашнего хозяйства, поскольку они должны работать только в конкретных клетках, входящих в конкретную ткань конкретного органа. Я бы не сказал, что это название для таких генов является удачным, но вот так сложилось.

    Любопытно, что 5′-НТО генов домашнего хозяйства отличаются по своей структуре от 5′-НТО других генов. Почему – тоже непонятно.

    Важная особенность 5′-НТО состоит в том, что помимо основного старт-кодона, в них имеются еще и дополнительные старт-кодоны, причем основной старт-кодон расположен самым последним из них. Для того, чтобы эти другие старт-кодоны не приводили к тому, что именно с них рибосома начнет строить белок, перед основным старт-кодоном стоит один из стоп-кодонов. Существуют разные объяснения того, каким образом в процессе эволюции сложилась такая структура 5′-НТО.

    Если мы посмотрим на то, насколько активно экспрессируются те или иные гены, сравним активность гомологичных генов, то заметим, что если какой-то ген должен в клетке работать помедленней, не так активно экспрессироваться, то в таком гене основной старт-кодон обрамлен некоторыми структурами (т.е. некоторыми наборами азотистых оснований). Каков механизм такого притормаживания, мы пока в точности не знаем, но скорее всего эти структуры облегчают или, наоборот, усложняют прикрепление к этому месту каких-то белков, в результате работы которых экспрессия гена замедляется. Это очень распространенный механизм, с помощью которого те или иные элементы нуклеиновой кислоты (т.е. те или иные совокупности азотистых оснований, входящих в ДНК или РНК) влияют на разнообразные процессы, являющиеся составной частью транскрипции и трансляции: эти элементы создают те или иные условия, влияющие на специфику работы вспомогательных белков.

    Не надо забывать, что свойства ДНК и РНК очень сильно зависят не только от первичной, но и от вторичной структуры, т.е. от того – как их цепочки изгибаются, сплетаются и еще как-то располагаются в пространстве. Мы знаем, что в 5′-НТО довольно много гуанина, а в некоторых областях 5′-НТО его прямо-таки особенно много, и там могут происходить удивительные вещи: например, там на определенный период времени могут образовываться уже хорошо знакомые нам… G-квадруплексы! И если такое происходит в 5′-НТО РНК, то трансляция этой мРНК подавляется полностью и безапелляционно – рибосома наотрез откажется принимать такую мРНК в работу.

    Примерно 3000 разных мРНК человека обладают такой способностью образовывать G-квадруплексы в 5′-НТО. Если же такое происходит в 5′-НТО ДНК, то данный ген даже не начинает транскрибироваться.

    Здесь есть один очень важный момент, который мы должны понять. Мы еще не изучали – что из себя представляет рибосома и как она работает, но просто представим себе некоторый большой конгломерат из рРНК и белков. Важная для нас сейчас особенность её устройства заключается в том, что она собирается из двух субъединиц: одна большая, и одна малая (это они так называются, на самом деле обе они являются большими по сравнению с другими белковыми комплексами). На рисунке красным цветом выделена большая субъединица, синим – малая, причем более светлым оттенком показаны рибосомные белки, а более темным — рРНК.

    Можно и так взглянуть на рибосому, чтобы ощутить всю ее сложность, хотя и этот рисунок упрощен:

    Сначала малая рибосомная субъединица находит мРНК и ползет по ней в направлении 5′-3′, пока не найдет нужный старт-кодон. Потом к ней присоединяется большая субъединица, и они объединяются в готовую рибосому, зажимая между собой мРНК, и начинается процесс трансляции – процесс производства белка по матрице мРНК. Это все мы будем подробно изучать позже.

    Так вот на протяжении многих лет считалось (и до сих пор так пишут почти во всех учебниках), что если в 5′-НТО мРНК есть некоторые стабильные элементы вторичной структуры типа «шпилек», то это мешает малой субъединице двигаться дальше, и процесс трансляции прерывается. На самом деле оказалось, что это совершенно не так и полностью ошибочно. Наличие шпилек и в самом деле зачастую приводит к прекращению движения малой субъединицы, но не потому, что они ей мешают, а потому что здесь работает описанный выше механизм: имеющий вид шпильки участок мРНК привлекает к себе некоторые служебные белки, которые облепляют его, и вот именно поэтому рибосома в таких случаях и не может собраться вокруг этой мРНК. В то же время многие другие шпильки в 5′-НТО мРНК выполняют свои функции и никак не мешают работе рибосомы. А вот G-квадруплекс является, в отличие от шпильки, слишком крупным образованием, и рибосома его обойти не может.

    Вообще шпилька – довольно простой по сути объект, в которой мы выделяем стебель и петлю.

    Она может возникать и на РНК, и на ДНК. Допустим, нить РНК изогнулась так, что два ее куска сблизились, причем так получилось, что они оказались комплементарны друг другу. В этом случае конечно произойдет спаривание оснований, и мы получим шпильку. При этом в петле не может быть меньше 4-х оснований, а слишком крупные петли будут нестабильны. Оптимально, если в петле 4-8 оснований.

    Многие РНК в результате эволюции получили такую первичную структуру, т.е. такую последовательность оснований, что образование шпилек происходит в обязательном порядке, и именно наличие шпилек в нужных местах и позволяет РНК выполнять свои функции. То есть можно сказать, что у многих РНК образование шпилек является программируемым. Когда мы начнем изучать транспортные РНК, мы увидим, какую гигантскую роль там играют шпильки.

    Как именно клетка может управлять процессом экспрессии гена с использованием 5′-НТО? Да очень просто – в результате альтернативного сплайсинга могут образовываться не только такие зрелые мРНК, по которым строятся совсем разные белки, но и такие мРНК, по которым строятся разные изоформы одного и того же белка, поскольку в этих мРНК будут альтернативные 5′-НТО. Или будет производиться одна и та же изоформа белка, но за счет особого варианта 5′-НТО в мРНК этот белок будет производиться в разных количествах.

    Мы кратко рассмотрели старт-кодон AUG, но мы еще вернемся к этой теме, так как существуют еще и альтернативные старт-кодоны. Для того, чтобы понять механизм их работы, мы должны еще многое узнать. И для компании рассмотрим так же кратко стоп-кодоны (их еще называют терминаторными). В таблице мы видим, что существует три стоп-кодона: UAG (янтарь), UGA (опал) и UAA (охра). Названия цветов им присвоены просто для удобства. Когда рибосома в процессе трансляции доходит до стоп-кодона, она останавливается (т.е. происходит прекращение трансляции — терминация), и в дело вступают специальные белки — факторы терминации трансляции, которые проводят работу по завершению обработки мРНК и разделяют рибосому на две отдельные субъединицы, которые отправляются искать новую мРНК.

    Три стоп-кодона обладают разной силой. Это означает, что терминация будет происходить с разной вероятностью в зависимости от того, какой именно встретится стоп-кодон. Это очень интересная функция, с помощью которой клетка достигает нужных ей целей. Самым сильным стоп-кодоном является UGA. Мнемоническое правило: «если встретился UGA, то легко угадать, что сейчас будет терминация».

    Самая важная вещь, которую надо сказать, когда мы говорим о стоп-кодонах, заключается в том, что в осуществлении терминации важнейшую роль помимо собственно стоп-кодонов играет одно азотистое основание, которое стоит сразу же за ними (иначе еще говорят – «ниже», т.е. ближе к 3`-концу мРНК). Если считать с первого основания стоп-кодона, то это будет основание на четвертой позиции, поэтому оно называется основанием+4. Несколько следующих за ним оснований также играют некоторую роль в терминации. Почему так происходит, понять несложно. Как уже говорилось, процесс терминации выполняется группой ферментов, и чтобы начать свою работу, они должны присоединиться к мРНК, зафиксироваться на ней, и эта посадка и происходит в районе +4 и далее. Поэтому возможно управление процессом терминации через выбор основания, которое будет на позиции +4 и далее.

    Значение основания+4 настолько велико, что многие ученые вообще предлагают рассматривать не трехбуквенные стоп-кодоны, а четырехбуквенные, потому что просто указать трехбуквенный стоп-кодон – это значит дать слишком мало информации о том характере событий, который будет происходить. Ситуация усложняется еще и тем, что ход терминации также в некоторых случаях (как минимум) зависит и от оснований, лежащих выше стоп-кодона, т.е. тех, которые входят в состав уже обработанного триплета, лежащего выше стоп-кодона.

    В некоторых редких случаях стоп-кодоны могут распознаваться рибосомой как смысловые, т.е. как кодирующие аминокислоту (такой механизм называется трансляционным перекодированием), но это относится лишь к самым редким протеиногенным аминокислотам. Одну из них мы уже рассматривали – селеноцистеин, а другую еще нет, и рассмотрим позже — пирролизин. То, каким именно образом рибосома прочтет стоп-кодон – как команду остановиться, или как команду вставить аминокислоту, опять-таки зависит от окружения стоп-кодона. К примеру, именно в результате трансляционного перекодирования UGA кодирует селеноцистеин.