Домой Любвь При расшифровке генома дрозофилы было установлено что. Медицинская генетика

При расшифровке генома дрозофилы было установлено что. Медицинская генетика

Является пандемичным паразитом, инфицирующим 70% беспозвоночных во всем мире и эволюционирующим вместе с ними. Наиболее часто паразит поражает насекомых, при этом он проникает в их яйцеклетки и сперматозоиды и передается потомству. Этот факт натолкнул ученых на предположение о том, что любые возникающие при этом генетические изменения передаются из поколения в поколение.

Эта находка, сделанная учеными под руководством Джека Веррена (Jack Werren) указывает на то, что горизонтальный (межвидовой) перенос генов между бактериями и многоклеточными организмами происходит чаще, чем принято считать, и накладывает определенный отпечаток на процесс эволюции. Бактериальная ДНК может быть полноценной частью генома организма и даже отвечать за формирование определенных признаков — по крайней мере, у беспозвоночных.

Вероятность того, что такой большой фрагмент ДНК абсолютно нейтрален, минимальна, и специалисты считают, что содержащиеся в нем гены обеспечивают насекомым определенные селекционные преимущества. В настоящее время авторы занимаются выявлением этих преимуществ. Эволюционные биологи должны обратить пристальное внимание на это открытие.

Прыгающие гены

В середине прошлого века американская исследовательница Барбара Макклинток обнаружила у кукурузы удивительные гены, способные самостоятельно менять свое положение на хромосомах. Сейчас их называют «прыгающие гены» или транспозабельные (мобильные) элементы. Открытие долгое время не признавали, считая мобильные элементы уникальным явлением, характерным только для кукурузы. Однако именно за это открытие в 1983 году Макклинток была удостоена Нобелевской премии - на сегодня прыгающие гены обнаружены практически у всех изученных видов животных и растений.

Откуда же взялись гены-попрыгунчики, что они делают в клетке, есть ли от них польза? Почему при генетически здоровых родителях семья плодовой мушки дрозофилы из-за прыгающих генов может с большой частотой производить мутантное потомство или даже вовсе оказаться бездетной? Какова роль прыгающих генов в эволюции?

Нужно сказать, что гены, обеспечивающие работу клеток, расположены в хромосомах в определенном порядке. Благодаря этому для многих видов одноклеточных и многоклеточных организмов удалось построить так называемые генетические карты. Однако между генами находится на порядок больше генетического материала, чем в них самих! Какую роль играет эта «балластная» часть ДНК, до конца не установлено, но именно здесь чаще всего и обнаруживают мобильные элементы, которые не только сами перемещаются, но могут прихватывать с собой и соседние фрагменты ДНК.

Откуда ведут свое происхождение гены-попрыгунчики? Предполагают, что по крайней мере часть из них ведет свое происхождение от вирусов, поскольку некоторые мобильные элементы способны формировать вирусные частицы (как, например, мобильный элемент gipsy у плодовой мушки Drosophila melanogaster ). Часть мобильных элементов появляется в геноме путем так называемого горизонтального переноса из других видов. Например, установлено, что мобильный hobo -элемент (в переводе на русский он так и называется - бродяга) Drosophila melanogaster неоднократно заново внедрялся в геном этого вида. Есть версия, что автономность и склонность к «бродяжничеству» могут иметь и некоторые регуляторные участки ДНК.

Полезный балласт

С другой стороны, большая часть прыгающих генов, несмотря на название, ведет себя смирно, хотя и составляет пятую часть от всего генетического материала Drosophila melanogaster или почти половину человеческого генома.

В избыточности ДНК, о которой упоминалось выше, есть свой плюс: балластная ДНК (в том числе и пассивные мобильные элементы) берет на себя удар в случае внедрения в геном чужеродной ДНК. Вероятность того, что новый элемент встроится в полезный ген и тем самым нарушит его работу, снижается, если балластной ДНК гораздо больше, чем значимой.

Некоторая избыточность ДНК полезна так же, как и «избыточность» букв в словах: мы пишем «Мария Ивановна», а говорим «Маривана». Часть букв неизбежно теряется, но смысл остается. Тот же принцип работает и на уровне значимости отдельных аминокислот в молекуле белка-фермента: строго консервативна лишь последовательность аминокислот, формирующая активный центр. Таким образом, на разных уровнях избыточность оказывается своеобразным буфером, обеспечивающим резерв прочности системы. Вот так и мобильные элементы, потерявшие подвижность, оказываются не бесполезными для генома. Как говорится, «с худой овцы хоть шерсти клок», хотя, может быть, здесь лучше бы подошла другая пословица - «каждое лыко в строку».

Мобильные элементы, сохранившие способность прыгать, перемещаются по хромосомам дрозофилы с частотой 10 –2 -10 –5 на ген за поколение в зависимости от типа элемента, генетического фона и внешних условий. Это означает, что один из ста прыгающих генов, находящихся в клетке, после очередного клеточного деления может поменять свою позицию. В результате через несколько поколений распределение мобильных элементов по хромосоме может измениться очень существенно.

Изучать такое распределение удобно на политенных (многонитчатых) хромосомах из слюнных желез личинок дрозофилы. Эти хромосомы во много раз толще обычных, что значительно упрощает их исследование под микроскопом. Как получаются такие хромосомы? В клетках слюнных желез ДНК каждой из хромосом умножается, как при обычном клеточном делении, но сама клетка при этом не делится. В итоге число клеток в железе не меняется, но зато за 10-11 циклов в каждой хромосоме накапливается несколько тысяч одинаковых нитей ДНК.

Отчасти именно благодаря политенным хромосомам прыгающие гены у дрозофилы изучены лучше, чем у других многоклеточных. В результате этих исследований выяснилось, что даже внутри одной популяции дрозофилы трудно найти две особи, которые имеют хромосомы с одинаковым распределением мобильных элементов. Неслучайно считается, что большая часть спонтанных мутаций у дрозофилы вызвана перемещением этих «попрыгунчиков».

Последствия могут быть разными…

По влиянию на геном активные мобильные элементы можно разделить на несколько групп. Часть их выполняет функции, исключительно важные и полезные для генома. Например, теломерная ДНК, расположенная на концах хромосом, у дрозофилы как раз и состоит из особых мобильных элементов. Эта ДНК крайне важна - потеря ее влечет за собой потерю всей хромосомы в процессе клеточного деления, что приводит клетки к гибели.

Другие мобильные элементы - откровенные «вредители». По крайней мере, таковыми их считают на данный момент. Например, мобильные элементы класса R2 могут специфически внедряться в гены членистоногих, кодирующие один из белков рибосом - клеточных «фабрик» по синтезу белка. Особи с подобными нарушениями выживают только потому, что при этом в геноме повреждается лишь часть из множества генов, кодирующих эти белки.

Есть и такие мобильные элементы, которые перемещаются только в репродуктивных тканях, продуцирующих половые клетки. Это объясняется тем, что в разных тканях один и тот же мобильный элемент может производить разные по длине и функции молекулы белка-фермента, необходимого для перемещения.

Примером последних может служить Р-элемент Drosophila melanogaster , попавший в ее природные популяции путем горизонтального переноса из другого вида дрозофил не более ста лет назад. Однако на Земле сейчас вряд ли найдется популяция Drosophila melanogaster , в которой не нашелся бы Р-элемент. При этом надо отметить, что большая часть его копий дефектна, более того - практически везде обнаружен один и тот же вариант дефекта. Роль последнего в геноме своеобразна: он «нетерпим» к своим собратьям и играет роль репрессора, блокируя их перемещение. Так что защита генома дрозофилы от прыжков «чужака» может частично осуществляться его же производными.

Главное - правильно выбрать родителей!

Большая часть прыжков мобильных элементов не сказывается на внешнем виде дрозофилы, потому что приходится на балластную ДНК, но бывают другие ситуации, когда активность их резко возрастает.

Как ни странно, самым мощным фактором, индуцирующим перемещение прыгающих генов, является неудачный подбор родителей. Например, что получится, если скрещивать самок из лабораторной популяции Drosophila melanogaster , которые не имеют Р-элемента (потому что их предки были выловлены из природы около ста лет назад), с самцами, несущими Р-элемент? У гибридов из-за бурного перемещения мобильного элемента может появиться большое количество разнообразных генетических нарушений. Это явление, названное гибридным дисгенезом, вызвано тем, что в материнской цитоплазме отсутствует репрессор, запрещающий перемещение мобильного элемента.

Таким образом, если женихи из популяции А и невесты из популяции Б могут создать многодетные семьи, то обратное не всегда верно. Семья из генетически здоровых родителей может произвести большое количество мутантных или бесплодных потомков, или даже вовсе оказаться бездетной, в случае если папа и мама имеют в геноме разный набор мобильных элементов. Особенно много нарушений появляется, если эксперимент проводить при температуре 29° С. Влияние внешних факторов, накладываясь на генетический фон, усиливает эффект несоответствия геномов, хотя сами по себе эти факторы (даже ионизирующая радиация) в одиночку не способны вызвать столь массовые перемещения мобильных элементов.

Сходные события у Drosophila melanogaster могут произойти с участием и других семейств мобильных элементов.

«Мобильная» эволюция

Клеточный геном можно рассматривать как своего рода экосистему из постоянных и временных членов, где соседи не просто сосуществуют, но и взаимодейст­вуют друг с другом. Взаимодействие хозяйских генов с мобильными элементами пока плохо изучено, но результатов его можно привести множество - от гибели организма в случае повреждения важного гена до восстановления ранее поврежденных функций.

Случается, что и сами прыгающие гены взаимодействуют друг с другом. Так, известно явление, напоминающее иммунитет, когда мобильный элемент не может внедриться в непосредственной близости от уже имеющегося. Однако не все мобильные элементы столь деликатны: например, Р-элементы могут запросто внедряться друг в друга и выводить собратьев из игры.

Кроме того, в геноме существует своего рода саморегуляция числа мобильных элементов. Дело в том, что мобильные элементы могут обмениваться друг с другом гомологичными участками - этот процесс называется рекомбинацией . В результате такого взаимодействия мобильные элементы могут в зависимости от своей ориентации терять (делеция ) или разворачивать (инверсия ) фрагменты хозяйской ДНК, расположенные между ними. Если теряется значительный кусок хромосомы, геном погибнет. В случае инверсии или небольшой делеции создается разнообразие хромосом, что считается необходимым условием для эволюции.

Если рекомбинации происходят между мобильными элементами, расположенными в разных хромосомах, то в результате образуются хромосомные перестройки, которые при последующих клеточных делениях могут привести к несбалансированности генома. А несбалансированный геном, так же как и несбалансированный бюджет, очень плохо делится. Так что гибель неудачных геномов - одна из причин, почему активные мобильные элементы не заполоняют хромосомы безгранично.

Напрашивается естественный вопрос: насколько значим вклад мобильных элементов в эволюцию? Во-первых, большая часть мобильных элементов внедряется, грубо говоря, куда придется, в результате чего они могут повредить или изменить структуру или регуляцию гена, в который внедрились. Тогда естественный отбор отметает неудачные варианты, а удачные варианты с адаптивными свойствами закрепляются.

Если же последствия внедрения мобильного элемента окажутся нейтральными, то такой вариант может сохраниться в популяции, обеспечив некоторое разнообразие структуры гена. Это может пригодиться при неблагоприятных условиях. Теоретически при массовом перемещении мобильных элементов мутации могут появиться во многих генах одновременно, что может оказаться очень полезным при резкой смене условий существования.

Итак, подытожим: мобильных элементов в геноме много и они разные; они могут взаимодейст­вовать как друг с другом, так и с хозяйскими генами; могут вредить и быть незаменимыми. Нестабильность генома, вызванная перемещением мобильных элементов, может закончиться трагедией для особи, но умение быстро меняться - необходимое условие выживания популяции или вида. Благодаря этому создается разнообразие, являющееся базой для естественного отбора и последующих эволюционных преобразований.

Можно провести некоторую аналогию между прыгающими генами и иммигрантами: некоторые иммигранты или их потомки становятся равноправными гражданами, другим дают вид на жительство, третьих - тех, кто не соблюдает законов, - депортируют или сажают в тюрьму. А массовые переселения народов могут быстро изменить само государство.

Литература

Ратнер В. А., Васильева Л. А. Индукция транспозиций мобильных генетических элементов стрессовыми воздейст-виями. Русский переплет. 2000.

Гвоздев В. А. Подвижные ДНК эукариот // Соросовский образовательный журнал. 1998. № 8.

определена полностью. Поэтому работу по расшифровке генома нематоды следует признать весьма успешной.

Еще больший успех связан с расшифровкой генома дрозофилы, лишь в

2 раза уступающего по размеру ДНК человека и в 20 раз превосходящего ДНК нематоды. Несмотря на высокую степень генетической изученности дрозофилы, около 10% ее генов были до этого момента неизвестны. Но самым парадоксальным является тот факт, что у гораздо более высоко организованной по сравнению с нематодой дрозофилы количество генов оказалось меньше, чем у микроскопического круглого червя! С современных биологических позиций это трудно объяснить. Больше генов, чем у дрозофилы, присутствует и в расшифрованном геноме растения из семейства крестоцветных - арабидопсиса, широко используемого генетиками в качестве классического экспериментального объекта.

Разработка геномных проектов сопровождалась интенсивным развитием многих областей науки и техники. Так, мощный импульс для своего развития получила биоинформатика . Был создан новый математический аппарат для хранения и обработки огромных массивов информации; сконструированы системы суперкомпьютеров, обладающие невиданной мощностью; написаны тысячи программ, позволяющих в считанные минуты проводить сопоставительный анализ различных блоков информации, ежедневно вводить в компьютерные базы новые данные,

получаемые в различных лабораториях мира, и адаптировать новую информацию к той, которая была накоплена ранее. Одновременно были разработаны системы для эффективной изоляции различных элементов генома и автоматического секвенирования, то есть определения нуклеотидных последовательностей ДНК. На этой базе были сконструированы мощные роботы, значительно ускоряющие секвенирование и делающие его менее дорогостоящим.

Развитие геномики, в свою очередь, привило к открытию огромного количества новых фактов. Значение многих из них еще предстоит оценить в

будущем. Но и сейчас очевидно, что эти открытия приведут к переосмыслению многих теоретических положений, касающихся возникновения и эволюции различных форм жизни на Земле. Они будут способствовать лучшему пониманию молекулярных механизмов, лежащих в основе работы отдельных клеток и их взаимодействий; детальной расшифровке многих до сих пор неизвестных биохимических циклов;

анализу их связи с фундаментальными физиологическими процессами.

Таким образом, происходит переход от структурной геномики к

функциональной, которая в свою очередь создает предпосылки для

исследования молекулярных основ работы клетки и организма в целом.

Накопленная уже сейчас информация будет предметом анализа в течение

нескольких ближайших десятилетий. Но каждый следующий шаг в

направлении расшифровки структуры геномов разных видов, порождает новые технологии, облегчающие процесс получения информации. Так,

использование данных о структуре и функции генов более низко организованных видов живых существ может значительно ускорить поиск

вытесняют достаточно трудоемкие молекулярные методы поиска генов.

Наиболее важным следствием расшифровки структуры генома определенного вида является возможность идентификации всех его генов и,

соответственно, идентификации и определения молекулярной природы транскрибируемых молекул РНК и всех его белков. По аналогии с геномом родились понятия транскриптома , объединяющего пул образовавшихся в результате транскрипции молекул РНК, ипротеома , включающего множество кодируемых генами белков. Таким образом, геномика создает фундамент для интенсивного развития новых наук –протеомики итранскриптомики . Протеомика занимается изучением структуры и функции каждого белка; анализом белкового состава клетки; определением молекулярных основ функционирования отдельной клетки, являющегося

результатом координированной работы многих сотен белков, и

исследованием формирования фенотипического признака организма,

являющегося результатом координированной работы миллиардов клеток.

Очень важные биологические процессы происходят и на уровне РНК. Их анализ является предметом транскриптомики.

Наибольшие усилия ученых многих стран мира, работающих в области геномики, были направлены на решение международного проекта «Геном человека». Значительный прогресс в этой области связан с реализацией идеи,

предложенной Дж. С. Вентером, заняться поиском и анализом

экспрессирующихся последовательностей ДНК, которые в дальнейшем могут быть использованы в качестве своеобразных «ярлыков» или маркеров определенных участков генома. Другой независимый и не менее плодотворный подход, был использован в работе группы, возглавляемой Фр.

Коллинзом. Он основан на первоочередной идентификации генов наследственных болезней человека.

Расшифровка структуры генома человека привела к сенсационному открытию. Оказалось, что в геноме человека только 32 000 генов, что в несколько раз меньше количества белков. При этом белок-кодирующих генов только 24 000, продуктами остальных генов являются молекулы РНК.

Процент сходства по нуклеотидным последовательностям ДНК между разными индивидуумами, этническими группами и расами составляет 99,9%.

Это сходство и делает нас людьми – Homo sapiens! Вся наша изменчивость на нуклеотидном уровне укладывается в очень скромную цифру – 0,1%.

Таким образом, генетика не оставляет места для идей национального или расового превосходства.

Но, посмотрим друг на друга – мы все разные. Еще более заметны национальные, а тем более, расовые различия. Так какое же количество мутаций определяют изменчивость человека не в процентном, а в абсолютном выражении? Для того чтобы получить эту оценку, нужно вспомнить, каков размер генома. Длина молекулы ДНК человека составляет

3,2х109 пар оснований. 0,1% от этого – 3,2 миллиона нуклеотидов. Но вспомним, что кодирующая часть генома занимает менее 3% от общей длины молекулы ДНК, а мутации вне этой области, чаще всего, не оказывают никакого влияния на фенотипическую изменчивость. Таким образом, для получения интегральной оценки числа мутаций, оказывающих влияние на фенотип, нужно взять 3% от 3,2 миллионов нуклеотидов, что и даст нам цифру порядка 100 000. То есть, около 100 тысяч мутаций формируют нашу фенотипическую изменчивость. Если мы сопоставим эту цифру с общим числом генов, то получится, что в среднем на ген приходится 3-4 мутации.

Что это за мутации? Их подавляющее большинство (не менее 70%)

определяет нашу индивидуальную непатологическую изменчивость, то, что нас отличает, но не делает хуже по отношению друг к другу. Сюда входят такие признаки, как цвет глаз, волос, кожи, характер телосложения, рост, вес,

тип поведения, который тоже в значительной степени генетически детерминирован, и многое другое. Около 5% мутаций ассоциированы с моногенными заболевания. Около четверти оставшихся мутаций относятся к классу функциональных полиморфизмов. Они участвуют в формировании наследственной предрасположенности к широко распространенной мультифакториальной патологии. Конечно, эти оценки достаточно грубые,

но они позволяют судить о структуре наследственной изменчивости человека.

Глава 1.16. Молекулярно-генетические основы эволюции

Произошедшая на рубеже тысячелетий революция в области молекулярной биологии, завершившаяся расшифровкой структуры геномов многих сотен видов микроорганизмов, а также некоторых видов простейших,

дрожжей, растений, животных и человека, перевернула многие традиционные представления классической генетики и вплотную приблизила возможность исследования молекулярных механизмов эволюции и видообразования. Родилась новая наука - сравнительная геномика,

позволяющая регистрировать появление в различных филогенетических линиях эволюционно значимых событий, происходящих на уровне отдельных молекул. Оказалось, что в общем случае эволюционный прогресс ассоциируется не только, и не столько с увеличением числа, протяженности и даже сложности структурной организации генов, но в гораздо большей степени с изменением регуляции их работы, определяющей координацию и тканеспецифичность экспрессии десятков тысяч генов. Это, в конечном счете, и привело к появлению у высших организмов более сложных, высоко специфичных, многофункциональных комплексов взаимодействующих белков, способных выполнять принципиально новые задачи.

Рассмотрим характер изменений, происходящих в процессе эволюции на трех информационных уровнях: ДНК – РНК – белок или геном – транскриптом – протеом. В общем случае можно сказать, что по мере нарастания сложности организации жизни, происходит увеличение размера генома. Так, размер ДНК прокариот не превышает 8х106 п. о., он становится вдвое больше у дрожжей и простейших, в 10-15 раз больше у насекомых, а у млекопитающих увеличение достигает 3 порядков, то есть в тысячу раз (103 ).

Однако эта зависимость не носит линейный характер. Так в пределах млекопитающих мы уже не наблюдаем существенного увеличения размера генома. Кроме того, не всегда удается наблюдать зависимость между величиной генома и сложностью организации жизни. Так, у некоторых растений величина генома на порядок или даже на два порядка больше, чем у человека. Напомним, что увеличение размера генома эукариот по сравнению с прокариотами происходит, главным образом, за счет появления некодирующих последовательностей, то есть факультативных элементов. Мы уже говорили о том, что в геноме человека экзоны суммарно составляют не более 1-3%. А это значит, что количество генов у высших может быть лишь в несколько раз больше, чем у микроорганизмов.

Увеличение сложности организации эукариот частично объясняется возникновением дополнительной системы регуляции, необходимой для

обеспечения тканеспецифичности экспрессии генов. Одним из последствий возникшей у эукариот прерывистой организации генов явилось широкое распространение альтернативного сплайсинга и альтернативной транскрипции. Это привело к появлению нового свойства у огромного числа генов - способности кодировать множественные функционально различающиеся изоформы белков. Таким образом, общее количество белков,

то есть размер протеома, у высших может быть в несколько раз больше количества генов.

У прокариот допустима внутривидовая изменчивость по числу генов, и

подобные различия между разными штаммами многих микроорганизмов, в

том числе и патогенных, могут составлять десятки процентов. При этом сложность организации различных видов микроорганизмов прямо коррелирует с числом и протяженностью кодирующих последовательностей.

Таким образом, фенотипическая внутри- и межвидовая изменчивость находится в строгой ассоциации с очень близкими по своим значениям размерами транскриптома и протеома. У эукариот число генов является жестко детерминированным видовым признаком, и в основе увеличения эволюционной сложности лежит иной принцип – дифференциальное многоуровневое использование различных компонентов ограниченного и достаточно стабильного протеома.

Секвенирование геномов нематоды и дрозофилы показало, что размеры протеомов у этих столь разных видов очень близки и лишь вдвое больше, чем у дрожжей и некоторых видов бактерий. Эта закономерность – значительное нарастание сложности организации различных форм жизни при сохранении или относительно небольшом увеличении размеров протеома – характерна для всей последующей эволюции вплоть до человека. Так,

протеомы человека и мыши практически не различаются между собой и по своим размерам менее чем в 2 раза превосходят протеомы круглого микроскопического червя нематоды или плодовой мушки дрозофилы. Более того, идентичность нуклеотидных последовательностей ДНК человека и

больших африканских обезьян составляет 98,5%, а в кодирующих областях достигает 99%. Эти цифры мало отличаются от значения 99,9%,

определяющего внутривидовое сходство по нуклеотидным последовательностям ДНК между различными индивидуумами, народами и расами, населяющими нашу планету. Так какие же изменения, составляющие не более 1,5% от всего генома, являются ключевыми для формирования человека? Ответ на этот вопрос, по-видимому, следует искать не только на геномном и протеомном уровнях.

Действительно, наряду с относительной стабильностью протеома, в

процессе эволюции происходит резкое увеличение размеров и сложности организации транскриптома эукариот за счет появления в геноме огромного количества транскрибируемых и не кодирующих ДНК, а также значительного расширения класса РНК-кодирующих генов. РНК, не кодирующие белки, главным источником которых служат интроны,

составляют подавляющую часть транскриптома высших организмов,

достигая 97-98% всех транскрипционных единиц. В настоящее время интенсивно анализируются функции этих молекул.

Таким образом, ключевые эволюционные изменения происходят на фоне увеличения размера генома, достаточно стабильного протеома и резкого увеличения размера транскриптома – рис. 31.

Рисунок 31. Эволюционные изменения, происходящие на трех

информационных уровнях При этом переход от простых форм жизни к более сложным очевидно

коррелирует с возникновением и широким распространением в геноме двух фундаментальных и в некоторой степени взаимосвязанных эволюционных приобретений: некодирующих ДНК и повторяющихся элементов. Прямым следствием этих изменений, происходящих на геномном уровне, является появление в процессе эволюции огромного количества не кодирующих белки РНК.

Какова же структурная основа этих эволюционных преобразований?

Все крупные эволюционные переходы: от прокариот к эукариотам, от простейших к многоклеточным, от первых животных к билатеральным и от примитивных хордовых к позвоночным, сопровождались резким увеличением сложности генома. По-видимому, такие скачки в эволюции являются результатом редких случаев удачного слияния целых геномов различных видов, принадлежащих дивергировавшим на значительное расстояние друг от друга систематическим классам. Так, симбиоз Archaea и Bacteria положил начало переходу от прокариот к эукариотам. Очевидно, что митохондрии, хлоропласты и некоторые другие органеллы клеток также появились в результате эндосимбиоза. Фундаментальное свойство высших эукариот – диплоидия – возникла вследствие хорошо отрегулированной геномной дупликации, которая совершалась около 500 миллионов лет назад.

Геномные дупликации в пределах вида происходили достаточно часто, и

примерами тому служат многочисленные случаи полиплоидии у растений,

грибов и даже иногда у животных. Однако потенциальными механизмами,

ведущими к возникновению в процессе эволюции принципиально новых форм жизни, являются не аутополиплоидии, а гибридизация и горизонтальный перенос или слияние геномов. Примечательно, что наиболее значительные эволюционные преобразования, сопровождающиеся слиянием целых геномов, происходят в экстраординарных условиях, в периоды крупных геологических переходов, таких как изменение концентрации кислорода в атмосфере, оледенение Земли или Кембрийский взрыв.

В относительно спокойных геологических условиях более значимыми для эволюции оказываются дупликации отдельных генов или хромосомных сегментов с их последующей дивергенцией. Сравнение нуклеотидных последовательностей секвенированных геномов показывает, что частота дупликаций генов достаточно высока и, в среднем, составляет 0.01 на ген за миллион лет. Подавляющее большинство из них не проявляют себя на протяжении последующих нескольких миллионов лет, и лишь в редких

случаях дуплицированные гены могут приобрести новые адаптивные функции. Тем не менее, многочисленный класс «молчащих» дупликаций генов служит своеобразным резервным фондом для рождения новых генов и образования новых видов. В геноме человека присутствует от 10 до 20 тысяч копий процессированных генов, возникших путем ретропозиции мРНК.

Большинство из них относятся к классу псевдогенов, то есть они не экспрессируются либо из-за присутствия мутаций, либо из-за инсерции в транскрипционно неактивные районы генома. Однако часть таких генов активна, причем характер их экспрессии и даже функции могут быть иными,

чем у генов-основателей.

Особую роль в эволюции приматов и человека играют сегментные дупликации , относящиеся к классу низкокопийных повторов (LCR) и

возникшие менее 35 миллионов лет назад. Эти последовательности представляют собой высоко идентичные блоки ДНК, варьирующие по величине от одной до нескольких сотен килобаз. Чаще всего сегментные дупликации локализуются в перицентромерных или теломерных районах различных хромосом, и суммарно они занимают около 5% генома человека.

В других секвенированных геномах сегментные дупликации не обнаружены.

Минимальный модуль сегментной дупликации, получивший название дупликон, содержит фрагменты неродственных непроцессированных генов, и

это отличает его других известных типов повторяющихся последовательностей. При определенных условиях дупликоны могут служить источниками создания новых химерных транскрибируемых генов или семейств генов из различных комбинаций представленных в них кодирующих экзонов. По некоторым оценкам от 150 до 350 генов могут различать геномы шимпанзе и человека.

Не умаляя значения для видообразования фактов появления новых и исчезновения старых кодирующих последовательностей, следует подчеркнуть реальную возможность существования иных механизмов,

играющих определяющую роль в эволюции эукариот.

Одним из движущих механизмов эволюции являются мобильные элементы, найденные у всех исследованных в этом отношении видов.

Изменения генома, сопровождающие процесс видообразования, могут включать обширные реорганизации кариотипа, локальные хромосомные перестройки, дупликации семейств генов, модификации отдельных генов,

сопровождающиеся их рождением или утратой, а также различия в экспрессии генов, регулируемые как на уровне транскрипции, так и на уровнях сплайсинга или трансляции. Мобильные элементы имеют непосредственное отношение ко всем этим процессам.

В некоторых случаях мобильные элементы сами несут последовательности, кодирующие ферменты, присутствие которых необходимо для осуществления транспозиции ДНК или ретропозиции РНК.

Подобные последовательности присутствуют в геноме ретровирусов, LTR-

элементов и транспозонов. К числу ретротранспозонов относится и наиболее многочисленный класс мобильных элементов – Alu-повторы. Впервые Alu-

повторы появляются у приматов около 50-60 миллионов лет назад из небольшого РНК-кодирующего гена. В процессе дальнейшей эволюции происходит дивергенция и мощная амплификация этого семейства. Переход от приматов к человеку сопровождается взрывообразным нарастанием числа

Alu-повторов, количество копий которого по некоторым оценкам достигает

1,1 миллиона. Alu-повторы занимают около 10% генома человека, но их распределение неравномерно, так как они в большей степени ассоциированы с генами. Эти элементы редко присутствуют в кодирующих экзонах и достаточно часто обнаруживаются в интронах и в не кодирующих районах мРНК, оказывая влияние на стабильность этих молекул и/или эффективность трансляции. Присутствие Alu-последовательностей в интронных областях генов может сопровождаться изменением характера процессинга преРНК, так как эти последовательности содержат районы, гомологичныедонорным иакцепторным сайтам сплайсинга. При инсерции Alu-элементов в регуляторные районы гена может нарушаться транскрипция, следствием чего

) обнаружили в геноме плодовой мушки (Drosophila ananassae ) полную копию генома бактерии-паразита Wolbachia .

Бактерия вольбахия проживает в цитоплазме клеток хозяина и известна тем, что научилась тонко регулировать размножение, развитие и даже эволюцию своих хозяев. Поэтому её часто называют «микробом-манипулятором» или «повелителем мух» (так как проживает она в клетках насекомых).

Исследование началось с того, что Джули Даннинг-Хотопп (Julie Dunning-Hotopp) из JCVI обнаружила, как некоторые гены вольбахии «кооперируются» с генами дрозофилы, будто они являются частями одного генома.

Майкл Кларк (Michael Clark) – научный сотрудник университета Рочестера — поселил колонию Drosophila ananassae в лаборатории, чтобы вместе с Уэрреном понять, в чём секрет.

Ген вольбахии в геноме дрозофилы (иллюстрация University of Rochester).

«В течение нескольких месяцев, я думал, что в чём-то ошибаюсь, — говорит Кларк, — я даже предположил, что выработалась устойчивость к антибиотику, ведь каждый ген вольбахии я обнаруживал вновь и вновь. Когда же я, наконец, взял ткани, которые оставил в покое несколько месяцев назад, то саму вольбахию не обнаружил».

Сейчас Уэррен и Кларк пытаются понять, в чём преимущество встраивания такого большого куска ДНК для дрозофилы — возможно, «чужие» гены предоставляют хозяину какие-то новые возможности.


А так гены вольбахии переходят в ДНК хозяина (иллюстрация Nicolle Rager Fuller, National Science).

Результаты проведённого исследования опубликованы в статье в журнале Science. В ней авторы предполагают, что горизонтальная передача генов (передача генов между видами, не являющимися родственными) происходит между бактериями и многоклеточными организмами в нашем мире значительно чаще, чем предполагалось ранее.

Расшифровка молекулярно-генетических механизмов манипуляций, осуществляемых вольбахией со своими хозяевами, даст человеку мощные новые средства воздействия на живые организмы и природу в целом.

Впрочем, не все насекомые подвержены плохому влиянию вольбахии. Например, бабочки с островов Самоа "научились" защищать своих самцов. Интересно, научатся ли бороться с нею малярийные комары , которых хотят заразить этой бактерией?

Издательство «БИНОМ. Лаборатория знаний» выпускает книгу воспоминаний ученого-генетика Крейга Вентера «Расшифрованная жизнь». Крейг Вентер известен работами по прочтению и расшифровке генома человека. В 1992 году он основал Институт исследований генома (TIGR). В 2010 году Вентер создал первый в мире искусственный организм – синтетическую бактерию Mycoplasma laboratorium. Мы предлагаем вам ознакомиться с одной из глав книги, в которой Крейг Вентер рассказывает о работе 1999–2000 годов по секвенированию генома мухи дрозофилы.

Вперед, и только вперед

Фундаментальные аспекты наследственности оказались, к нашему удивлению, довольно просты, а потому появилась надежда, что, возможно, природа не так уж непознаваема, а ее не раз провозглашаемая самыми разными людьми непостижимость - просто еще одна иллюзия, плод нашего невежества. Это вселяет в нас оптимизм, поскольку, если бы мир был настолько сложным, как уверяют некоторые наши друзья, у биологии не было бы никакого шанса стать точной наукой.

Томас Хант Морган . Физические основы наследственности

Многие спрашивали меня, почему из всех живых существ на нашей планете я выбрал дрозофилу; других интересовало, почему я сразу не перешел к расшифровке генома человека. Дело в том, что нам нужна была основа для будущих экспериментов, мы хотели быть уверенными в правильности нашего метода, прежде чем потратить почти 100 миллионов долларов на секвенирование генома человека.

Маленькая дрозофила сыграла огромную роль в развитии биологии, особенно генетики. Род дрозофилы включает разных мушек - уксусных, винных, яблочных, виноградных, а также фруктовых, - всего около 26 сотен видов. Но стоит произнести слово «дрозофила», и любой ученый сразу подумает об одном определенном виде - Drosophilamelanogaster. Из-за того, что она быстро и легко размножается, эта крошечная мушка служит для биологов-эволюционистов модельным организмом. Они используют ее, чтобы пролить свет на чудо творения - от момента оплодотворения до становления взрослого организма. Благодаря дрозофилам было сделано немало открытий, в том числе обнаружены гомеобокссодержащие гены, регулирующие общее строение всех живых организмов.

Каждый, изучающий генетику, знаком с опытами на дрозофиле, выполненными Томасом Хантом Морганом, отцом американской генетики. В 1910 году он заметил среди обычных красноглазых мушек мутантов мужского пола с белыми глазами. Он скрестил белоглазую мужскую особь с красноглазой женской особью и обнаружил, что их потомство получилось красноглазым: белоглазость оказалась рецессивным признаком, и теперь мы знаем: чтобы у мушек были белые глаза, нужны две копии гена белоглазости, по одному от каждого родителя. Продолжая скрещивать мутантов, Морган обнаружил, что только у мужских особей проявляется признак белых глаз, и сделал вывод, что этот признак связан с половой хромосомой (Y-хромосомой). Морган и его ученики изучали наследуемые признаки у тысяч плодовых мушек. Сегодня эксперименты с дрозофилой ведутся в лабораториях молекулярной биологии всего мира, где это маленькое насекомое изучают более пяти тысяч человек.

Я на собственном опыте понял всю важность дрозофилы, когда использовал библиотеки ее кДНК генов при исследовании адреналиновых рецепторов и обнаружил у мушки их эквивалент - октопаминовые рецепторы. Это открытие указывало на общность эволюционной наследственности нервной системы мушки и человека. Пытаясь разобраться в библиотеках кДНК мозга человека, я путем компьютерного сопоставления генов человека с генами дрозофилы нашел гены со сходными функциями.

Проект секвенирования гена дрозофилы был запущен в 1991 году, когда Джерри Рубин из Калифорнийского университета в Беркли и Аллен Спредлинг из института Карнеги решили, что настало время приняться за эту задачу. В мае 1998 года 25% секвенирования было уже завершено, и я внес предложение, которое, по словам Рубина, было «слишком хорошим, чтобы от него отказаться». Моя идея была довольно рискованной: тысячам исследователей плодовой мушки из разных стран предстояло пристально изучить каждую букву полученного нами кода, сравнивая ее с высококачественными, эталонными данными самого Джерри, а затем сделать заключение о пригодности моего метода.

Исходный план предполагал завершение секвенирования генома мушки в течение шести месяцев - к апрелю 1999 года, чтобы затем начать атаку на геном человека. Мне казалось, это самый эффектный и всем понятный способ продемонстрировать, что наш новый метод работает. А если у нас ничего не получится, полагал я, то лучше в этом быстро убедиться на примере дрозофилы, чем работая над геномом человека. Но, по правде говоря, полная неудача была бы самым впечатляющим провалом в истории биологии. Джерри тоже рисковал своей репутацией, поэтому все в Celera были полны решимости поддержать его. Я попросил Марка Адамса возглавить нашу часть проекта, и так как у Джерри в Беркли тоже была первоклассная команда, наше сотрудничество шло как по маслу.

Прежде всего встал вопрос о чистоте ДНК, которую нам предстояло секвенировать. Как и люди, мушки различаются на генетическом уровне. Если генетических вариаций в популяции более 2%, и мы имеем 50 различающихся индивидуумов в выбранной группе, то расшифровка оказывается весьма сложной. В первую очередь Джерри пришлось провести инбридинг мушек в максимально возможной степени, чтобы предоставить нам однородный вариант ДНК. Но для обеспечения генной чистоты инбридинга было недостаточно: при извлечении ДНК мушки существовала опасность загрязнения генетическим материалом из клеток бактерий, находящихся в пище мушки или в ее кишечнике. Чтобы избежать этих проблем, Джерри предпочитал извлекать ДНК из мушиных эмбрионов. Но и из клеток эмбрионов приходилось сначала выделять ядра с нужной нам ДНК, чтобы не загрязнять ее внеядерной ДНК митохондрий - «силовых установок» клетки. В результате мы получили пробирку с мутноватым раствором чистой дрозофильной ДНК.

Летом 1998 года команда Хэма, имея такую чистую ДНК мушки, приступила к созданию библиотек ее фрагментов. Сам Хэм больше всего любил разрезать ДНК и соединять внахлест полученные фрагменты, понизив чувствительность своего слухового аппарата, чтобы никакие посторонние звуки не отвлекали его от работы. Создание библиотек должно было положить начало масштабному секвенированию, но пока повсюду раздавались одни только звуки дрели, стук молотков и визжание пил. Рядом постоянно мозолила глаза целая армия строителей, а мы продолжали решать важнейшие проблемы - устранение неполадок в работе секвенаторов, роботов и другого оборудования, пытаясь не за годы, а за считанные месяцы создать с нуля настоящую «фабрику» секвенирования.

Первый секвенатор ДНК модели 3700 был доставлен в Celera 8 декабря 1998 года и встречен c большим восторгом и всеобщим вздохом облегчения. Устройство извлекли из деревянного ящика, поместили в комнату без окон в подвале - его временное пристанище, и сразу приступили к пробным испытаниям. Когда он заработал, мы получили очень качественные результаты. Но эти первые экземпляры секвенаторов работали весьма нестабильно, а некоторые были неисправны с самого начала. С работающими тоже постоянно возникали проблемы, порой чуть ли не ежедневно. Например, в программе управления роботом-манипулятором появилась серьезная ошибка - иногда механическая рука робота на большой скорости выдвигалась над устройством и с размаху врезалась в стену. В результате секвенатор останавливался, и для его починки приходилось вызывать ремонтную бригаду. Некоторые секвенаторы выходили из строя из-за блуждающих лазерных лучей. Для защиты от перегрева использовались ленты из фольги и скотча, поскольку при высокой температуре из последовательностей испарялись окрашенные в желтый цвет фрагменты Gs.

Хотя устройства теперь поставлялись регулярно, около 90% из них с самого начала были неисправны. В некоторые дни секвенаторы вообще не работали. Я твердо верил в Майка Ханкапиллера, однако моя вера сильно поколебалась, когда он стал винить в неудачах наших сотрудников, строительную пыль, малейшие колебания температуры, фазы Луны и так далее. Некоторые из нас от стресса даже поседели.

Не подающие признаков жизни 3700-е, ожидающие отправки обратно в ABI, стояли в кафетерии, и, в конце концов, дошло до того, что нам приходилось обедать практически в «морге» секвенаторов. Я был в отчаянии - ведь мне ежедневно нужно было определенное количество работающих устройств, а именно 230! За примерно 70 миллионов долларов компания ABI обещала предоставить нам или 230 абсолютно исправных устройств, работающих без перебоев целый день, или 460, которые работали хотя бы полдня. Кроме того, Майку следовало удвоить количество квалифицированного технического персонала для незамедлительного ремонта секвенаторов после поломки.

Однако какой интерес заниматься всем этим за те же деньги! К тому же у Майка появился еще один клиент - государственный геномный проект, руководители которого уже начали закупать сотни устройств безо всякого тестирования. Будущее Celera зависело от этих секвенаторов, но Майк, по-видимому, не понимал, что и будущее ABI от них зависело. Конфликт был неизбежен, что и проявилось на важном совещании инженеров ABI и моей команды, состоявшемся в Celera.

После того, как мы сообщили об огромном количестве дефектных приборов и о том, как много времени требуется на исправление поломок секвенаторов, Майк снова попытался свалить всю вину на моих сотрудников, но даже его собственные инженеры с ним не согласились. В конце концов вмешался Тони Уайт. «Мне все равно, сколько это стоит и кого нужно прибить за это», - сказал он. Тогда он в первый и последний раз действительно встал на мою сторону. Он приказал Майку как можно скорее обеспечить поставку новых секвенаторов, даже в ущерб другим клиентам и даже если пока неизвестно, во сколько это обойдется.

Тони также распорядился, чтобы Майк нанял еще двадцать специалистов для оперативного ремонта и определения причин всех проблем. На деле это было легче сказать, чем сделать, потому что опытных работников не хватало. Начать с того, что Эрик Ландер переманил двоих из самых квалифицированных инженеров, и по мнению Майка, тут тоже были виноваты мы. Повернувшись к Марку Адамсу, Майк сказал: «Вы должны были нанять их раньше, чем это сделал кто-то другой». После такого заявления я окончательно потерял к нему всякое уважение. Ведь согласно нашему договору, я не мог нанимать сотрудников ABI, в то время как Ландер и другие руководители государственного проекта генома имели на это право, поэтому очень скоро лучшие инженеры ABI начали работать на наших конкурентов. К концу совещания я понял - проблемы остались, но луч надежды на улучшение все-таки забрезжил.

Так и произошло, хотя и не сразу. Наш арсенал секвенаторов увеличился с 230 до 300 устройств, и если 20–25% из них отказывали, мы все-таки имели около 200 работающих секвенаторов и кое-как справлялись с поставленными задачами. Технические сотрудники работали героически и неуклонно увеличивали темп ремонтных работ, сокращая простои. Все это время я думал об одном: то, что мы делаем, - выполнимо. Неудачи возникали по тысяче причин, но провал не входил в мои планы.

Мы всерьез взялись за секвенирование генома дрозофилы 8 апреля, примерно тогда, когда уже должны были завершить эту работу. Я, конечно, понимал, что Уайт хочет от меня избавиться, но делал все от меня зависящее ради выполнения главной задачи. Напряжение и беспокойство преследовали меня и дома, но с самым своим «доверенным лицом» я эти проблемы обсуждать не мог. Клэр откровенно демонстрировала свое презрение, видя, насколько я поглощен делами Celera. Ей казалось, что я повторяю те же ошибки, которые делал, работая в TIGR/HGS. К 1 июля я чувствовал себя глубоко подавленным, как это уже было во Вьетнаме.

Поскольку конвейерный метод пока у нас не работал, нам предстоял тяжелый изнурительный труд - заново «склеивать» фрагменты генома. Чтобы обнаруживать совпадения и не отвлекаться на повторы, Джин Майерс предложил алгоритм на основе ключевого принципа моего варианта метода дробовика: секвенировать оба конца всех полученных клонов. Поскольку Хэм получал клоны трех точно известных размеров, мы знали, что две концевые последовательности находятся на строго определенном расстоянии друг от друга. Как и прежде, этот способ «нахождения пары» даст нам прекрасную возможность снова собрать геном.

Но поскольку каждый конец последовательности секвенировался отдельно, для обеспечения четкой работы этого метода сборки нужно было вести тщательный учет - для абсолютной уверенности, что мы смогли правильно соединить все пары концевых последовательностей: ведь если хотя бы одна из ста попыток приведет к ошибке и не найдется соответствующая пара для последовательности, все пойдет насмарку и метод не сработает. Один из способов избежать этого - использование штрих-кода и датчиков для отслеживания каждого этапа процесса. Но в начале работы у лаборантов не было необходимого программного обеспечения и оборудования для секвенирования, поэтому приходилось делать все вручную. В Celera небольшая команда, менее двадцати человек, каждый день обрабатывала рекордное количество клонов - 200 тысяч. Мы могли предвидеть некоторые ошибки, например неправильное прочтение данных из 384 лунок, а затем использовать компьютер для нахождения явно ошибочной операции и исправить положение. Конечно, еще оставались отдельные недочеты, но это только подтверждало мастерство команды и уверенность, что мы можем устранять ошибки.

Несмотря на все сложности, мы сумели за четыре месяца прочесть 3156 миллионов последовательностей, всего около 1,76 миллиарда нуклеотидных пар, содержащихся между концами 1,51 миллиона клонов ДНК. Теперь настала очередь Джина Майерса, его команды и нашего компьютера - нужно было сложить все участки вместе в хромосомы дрозофилы. Чем длиннее становились участки, тем менее точным оказывалось секвенирование. В случае дрозофилы последовательности насчитывали в среднем 551 нуклеотидную пару, и средняя точность была 99,5%. Если иметь 500-буквенные последовательности, почти любой может определить места совпадений, передвигая одну последовательность вдоль другой до тех пор, пока не обнаружатся совпадения.

Для секвенирования Haemophilus influenzae у нас было 26 тысяч последовательностей. Для сравнения каждой из них со всеми остальными потребовалось бы проделать 26 тысяч сравнений в квадрате, или 676 миллионов. Геном дрозофилы, с его 3,156 миллиона прочтений потребовал бы около 9,9 триллиона сравнений. В случае человека и мыши, где мы произвели 26 миллионов прочтений последовательности, требовалось около 680 триллионов сравнения. Поэтому не вызывает удивления, что большинство ученых весьма скептически относились к возможному успеху этого метода.

Хотя Майерc и обещал все наладить, у него постоянно возникали сомнения. Теперь он работал дни и ночи напролет, выглядел измученным и как-то посерел. К тому же у него были проблемы в семье, и он стал большую часть свободного времени проводить с журналистом Джеймсом Шривом, который писал о нашем проекте и как тень следил за ходом исследований. Пытаясь как-то отвлечь Джина, я взял его с собой на Карибы - расслабиться и походить под парусом на моей яхте. Но и там он часами сидел, скрючившись над ноутбуком, нахмурив черные брови и щуря свои черные глаза от яркого солнца. И, несмотря на невероятные трудности, Джин и его команда сумели за полгода сгенерировать более полумиллиона строк компьютерного кода для нового ассемблера.

Если бы результаты секвенирования были стопроцентно точными, без повторяющихся ДНК, сборка генома была бы относительно несложной задачей. Но в реальности геномы содержат большое количество повторяющихся ДНК разного типа, разной длины и частоты. С короткими повторами, состоящими из менее пяти сотен пар нуклеотидов, справиться относительно легко, с более длинными повторами - сложнее. Для решения этой проблемы мы использовали метод «нахождения пары», то есть секвенировали оба конца каждого клона и получали клоны разной длины для обеспечения максимального количества совпадений.

Алгоритмы, закодированные в полумиллионе строк компьютерного кода команды Джина, предполагали поэтапный сценарий - от самых «безвредных» действий, например простого перекрывания двух последовательностей, до более сложных, например использования обнаруженных пар для слияния островков перекрывшихся последовательностей. Это было похоже на сложение головоломки, когда небольшие островки собранных участков составляются вместе и образуют большие острова, а затем весь процесс повторяется снова. Только вот в нашей головоломке было 27 миллионов фрагментов. И было очень важно, чтобы участки брались из последовательности высокого качества сборки: представьте себе, что будет, если вы собираете пазл, а цвета или изображения его элементов нечеткие и размытые. Для дальнего порядка последовательности генома значительная доля прочтений должна быть в виде совпадающих пар. Учитывая, что результаты все еще отслеживались вручную, мы с облегчением обнаружили, что 70% имевшихся у нас последовательностей именно такие. Специалисты по компьютерному моделированию объяснили, что при меньшем проценте собрать нашего «шалтая-болтая» было бы невозможно.

И теперь мы смогли использовать ассемблер Celera для секвенирования последовательности: на первом этапе результаты корректировались для достижения самой высокой точности; на втором этапе программа Screener удаляла загрязняющие последовательности из ДНК плазмиды или E. coli. Процесс сборки может быть нарушен всего-навсего какими-то 10 парами оснований «чужой» последовательности. На третьем этапе программа Screener проверяла каждый фрагмент на соответствие известным повторяющимся последовательностям в геноме плодовой мушки - данным Джерри Рубина, который их «любезно» нам предоставил. Местоположение повторов с частично перекрывающимися участками записывалось. На четвертом этапе другая программа (Overlapper) обнаруживала перекрывающиеся участки, сравнивая каждый фрагмент со всеми остальными, - колоссальный эксперимент по обработке огромного объема числовых данных. Ежесекундно мы сравнивали 32 миллиона фрагментов с целью обнаружить по крайней мере 40 перекрывающихся пар оснований с менее 6% различий. При обнаружении двух перекрывающихся участков мы объединяли их в больший фрагмент, так называемый «контиг» - набор перекрывающихся фрагментов.

В идеальном случае этого бы вполне хватило для сборки генома. Но нам приходилось бороться со статтерами и повторами в коде ДНК, а это означало, что один фрагмент ДНК может перекрываться с несколькими различными участками, создавая ложные соединения. Чтобы упростить задачу, мы оставляли только однозначно соединенные фрагменты, так называемые «унитиги». Программа, с помощью которой мы выполняли эту операцию (Unitigger), по существу удаляла всю последовательность ДНК, которую мы не могли с уверенностью определить, оставляя лишь эти унитиги. Этот шаг не только дал нам возможность рассмотреть другие варианты сборки фрагментов, но и существенно упростил задачу. После редукции количество перекрывающихся фрагментов сократилось с 212 миллионов до 3,1 миллиона, и проблема упростилась в 68 раз. Детали головоломки постепенно, но неуклонно вставали на свои места.

А затем мы могли использовать информацию о способе спаривания последовательностей одного и того же клона, используя «каркасный» алгоритм. Все возможные унитиги со взаимно перекрывающимися парами оснований объединялись в специальные каркасы. Для описания этого этапа в своих лекциях я провожу аналогию с детским игрушечным конструктором Tinkertoys. Он состоит из палочек разной длины, которые можно вставлять в отверстия, расположенные на деревянных узловых деталях (шариках и дисках), и составить так объемную конструкцию. В нашем случае узловые детали - это унитиги. Зная, что парные последовательности располагаются на концах клонов длиной в 2 тысячи, 10 тысяч или 50 тысяч пар оснований - то есть как бы находятся на расстоянии определенного количества отверстий друг от друга, - их можно выстроить в одну линию.

В результате тестирования этой методики на последовательности Джерри Рубина, составлявшей примерно одну пятую генома плодовой мушки, мы получили всего лишь 500 пробелов. Проведя в августе испытания на наших собственных данных, мы получили в результате более 800 тысяч небольших фрагментов. Существенно большее количество данных для обработки показало, что методика работала плохо - результат оказался противоположным ожидаемому. В течение нескольких следующих дней паника нарастала, а список возможных ошибок удлинялся. С верхнего этажа корпуса № 2 адреналиновый раж просачивался в комнату, шутливо называемую «Безмятежными покоями». Однако никакого покоя и безмятежности там не ощущалось, особенно в течение по крайней мере пары недель, когда сотрудники буквально кругами слонялись в поисках выхода из создавшегося положения.

В конце концов проблему решил Артур Делчер, работавший с программой Overlapper. Он заметил нечто странное в 678-й строке кода из 150 тысяч строк, в том месте, где пустяковая неточность означала, что важная часть совпадений не записана. Ошибка была исправлена, и 7 сентября у нас было 134 клеточных каркаса, покрывавших действующий (эухроматический) геном плодовой мушки. Мы были в восторге и с облегчением выдохнули. Пришла пора объявить всему миру о нашем успехе.

Конференция по секвенированию генома, которую я начал проводить несколько лет назад, предоставляла для этого прекрасную возможность. Я был уверен, что найдется большое количество жаждущих удостовериться, сдержали ли мы свое обещание. Я решил, что рассказывать о наших достижениях, и прежде всего о процессе секвенирования, сборке генома и значении этого для науки, должны Марк Адамс, Джин Майерс и Джерри Рубин. Из-за наплыва желающих приехать на конференцию мне пришлось перенести ее из Хилтон-Хеда в более вместительный отель «Фонтенбло» в Майами. На конференции присутствовали представители крупных фармацевтических и биотехнических компаний, специалисты по геномным исследованиям со всего мира, довольно много обозревателей, репортеров и представителей инвестиционных компаний - все были в сборе. Наши конкуренты из компании Incyte потратили немалые средства на организацию приема после окончания конференции, корпоративную видеосъемку и прочее - делали все, дабы убедить публику, что именно они предлагают «самую подробную информацию о геноме человека».

Мы собрались в большом конференц-зале. Выдержанный в нейтральных тонах, украшенный настенными светильниками, он был рассчитан на две тысячи человек, но народ все прибывал, и вскоре зал заполнился до отказа. Открытие конференции состоялось 17 сентября 1999 года, и на первом заседании с сообщениями выступили Джерри, Марк и Джин. После небольшого вступления Джерри Рубин объявил, что собравшимся предстоит услышать о лучшем совместном проекте известных компаний, в котором ему когда-либо довелось участвовать. Атмосфера накалялась. Аудитория поняла, что он не стал бы говорить так высокопарно, если бы у нас не было заготовлено что-то действительно сенсационное.

В воцарившейся тишине Марк Адамс начал подробно описывать работу нашего «производственного цеха» в Celera и наши новые методы секвенирования генома. Однако при этом он ни слова не сказал о собранном геноме, словно поддразнивая публику. Затем вышел Джин, поведавший о принципах метода дробовика, о секвенировании Haemophilus, об основных стадиях работы ассемблера. С помощью компьютерной анимации он продемонстрировал весь процесс обратной сборки генома. Отведенное на выступления время заканчивалось, и многие было уже решили, что все ограничится элементарной презентацией с использованием программы PowerPoint, без предъявления конкретных результатов. Но тут Джин c ехидной улыбкой заметил, что аудитория, наверное, захочет все-таки увидеть реальные результаты и не удовольствуется имитацией.

Невозможно было представить наши результаты яснее и выразительнее, чем это сделал Джин Майерс. Он понял, что сами по себе результаты секвенирования не произведут должного впечатления, поэтому для большей убедительности сравнил их с результатами кропотливого исследования Джерри традиционным методом. Они оказались идентичными! Таким образом, Джин сравнил результаты нашей сборки генома со всеми известными маркерами, картированными на геноме плодовой мушки десятки лет назад. Из тысяч маркеров только шесть не совпадали с результатами нашей сборки. Тщательно исследовав все шесть, мы убедились, что секвенирование в Celera было верным и что ошибки содержались в работах, выполненных в других лабораториях старыми методами. Под конец Джин сообщил, что мы только что приступили к секвенированию ДНК человека, и с повторами здесь наверняка будет меньше проблем, чем в случае дрозофилы.

Последовали громкие и продолжительные аплодисменты. Не прекращавшийся и во время перерыва гул означал, что мы своего добились. Кто-то из журналистов заметил участника государственного проекта генома, сокрушенно качающего головой: «Похоже, эти мерзавцы действительно собираются все сделать» 1 . Мы покинули конференцию с новым зарядом энергии.

Оставалось решить две важные проблемы, и обе были нам хорошо знакомы. Первая - как публиковать результаты. Несмотря на подписанный с Джерри Рубином меморандум о взаимопонимании, сотрудники нашего бизнес-отдела не одобряли идею передачи ценных результатов секвенирования дрозофилы в GenBank. Они предлагали разместить результаты секвенирования плодовой мушки в отдельной базе данных в Национальном центре биотехнологической информации, где ими сможет пользоваться каждый при одном условии - не в коммерческих целях. Вспыльчивый, постоянно курящий Майкл Эшбернер из Европейского института биоинформатики был крайне этим недоволен. Он считал, что компания Celera «всех надула» 2 . (Он писал Рубину: «Что, черт подери, происходит в Celera?» 3) Коллинз тоже был недоволен, но что гораздо важнее, недоволен был и Джерри Рубин. В конце концов я все-таки отослал наши результаты в GenBank.

Вторая проблема касалась дрозофилы - у нас были результаты секвенирования ее генома, но мы совершенно не понимали, что они означают. Нужно было проанализировать их, если мы хотели написать статью, - так же, как четыре года назад в случае с Haemophilus. Анализ и описание генома мушки могли занять более года - а у меня такого времени не было, потому что теперь следовало сосредоточиться на геноме человека. Обсудив это с Джерри и Марком, мы решили вовлечь в работу над Drosophila научное сообщество, превратив это в увлекательную научную задачу, и таким образом быстро продвинуть дело, устроить из скучного процесса описания генома веселый праздник - наподобие международного скаутского слета. Мы назвали его «Геномное Джамбори» и пригласили ведущих ученых со всего мира приехать в Роквилл примерно на неделю или дней на десять - проанализировать геном мушки. На основе полученных результатов мы планировали написать серию статей.

Идея всем понравилась. Джерри начал рассылать приглашения на наше мероприятие группам ведущих исследователей, а специалисты по биоинформатике Celera решали, какие компьютеры и программы понадобятся, чтоб сделать работу ученых максимально эффективной. Мы договорились, что Celera оплатит им расходы на проезд и проживание. Среди приглашенных были и самые мои суровые критики, но мы надеялись, что их политические амбиции не повлияют на успех нашей затеи.

В ноябре к нам прибыло около 40 специалистов по дрозофиле, и даже для наших недругов предложение оказалось слишком привлекательным, чтобы от него отказаться. Вначале, когда участники поняли, что им предстоит проанализировать более ста миллионов пар оснований генетического кода в течение нескольких дней, ситуация была довольно напряженной. Пока вновь прибывшие ученые спали, мои сотрудники круглые сутки трудились, разрабатывая программы решения непредвиденных проблем. К концу третьего дня, когда оказалось, что новые программные средства позволяют ученым, как сказал один из наших гостей, «за несколько часов делать потрясающие открытия, на которые раньше уходила чуть ли не вся жизнь», обстановка разрядилась. Ежедневно в середине дня, по сигналу китайского гонга все собирались вместе - обсудить последние результаты, решить текущие проблемы и составить план работы на следующий раунд.

С каждым днем дискуссии становились все увлекательнее. Благодаря Celera, у наших гостей появилась возможность первыми заглянуть в новый мир, и то, что открывалось взору, превосходило ожидания. Скоро оказалось, что нам не хватает времени обсудить все, что хочется, и понять, что все это значит. Марк устроил праздничный ужин, который продолжался очень недолго, так как все быстро устремились обратно в лаборатории. Скоро обеды и ужины поглощались прямо перед экранами компьютеров с выведенными на них данными о геноме дрозофилы. Впервые были обнаружены долгожданные семейства рецепторных генов и одновременно удивительное количество генов плодовой мушки, аналогичных генам болезней человека. Каждое открытие сопровождалось радостными воплями, свистом и дружескими похлопываниями по плечу. Как это ни удивительно, но среди нашего научного пиршества одна пара нашла время для помолвки.

Было, правда, некое опасение: в ходе работы ученые обнаружили всего около 13 тысяч генов вместо ожидаемых 20 тысяч. Поскольку в «непритязательном» черве C. elegans порядка 20 тысяч генов, многие полагали, что у плодовой мушки их должно быть больше, так как у нее в 10 раз больше клеток и даже есть нервная система. Существовал один простой способ удостовериться, что в расчетах нет ошибки: взять 2500 известных генов мушки и посмотреть, сколько их удалось найти в нашей последовательности. После тщательного анализа Майкл Черри из Стэнфордского университета сообщил, что он обнаружил все гены, кроме шести. После обсуждения эти шесть генов были отнесены к артефактам. То, что гены были выявлены без ошибок, воодушевило нас и придало уверенности. Сообщество тысяч ученых, посвятивших себя исследованию дрозофилы, потратили десятки лет, отслеживая эти 2500 генов, а теперь целых 13 600 были перед ними на экране компьютера.

Во время неизбежной фотосессии в конце работы наступил незабываемый момент: после традиционного похлопывания по плечу и дружеских рукопожатий Майк Эшбернер встал на четвереньки, чтобы я увековечил себя на фотографии, поставив ногу на его спине. Так он хотел - несмотря на все свои сомнения и скептицизм - отдать должное нашим достижениям. Известный генетик, исследователь дрозофилы, он даже придумал соответствующую подпись под фотографией: «Стоя на плечах гиганта». (Он отличался довольно тщедушной фигурой.) «Отдадим должное тому, кто этого заслуживает», - написал он позже 4 . Оппоненты наши пытались представить накладки в передаче результатов секвенирования в общедоступную базу данных как отступление от наших обещаний, но и они вынуждены были признать, что слет внес «чрезвычайно ценный вклад в общемировые исследования плодовой мушки» 5 . Испытав, что такое подлинная «научная нирвана», все расстались друзьями.

Мы решили опубликовать три большие статьи: одну по секвенированию всего генома, где Майк будет первым автором, другую - по сборке генома, где первым автором будет Джин, и третью - по сравнительной геномике червя, дрожжей и генома человека с Джерри в качестве первого автора. Статьи были сданы в редакцию Science в феврале 2000 года и опубликованы в специальном выпуске от 24 марта 2000 года, - меньше чем через год после моей беседы с Джерри Рубином в Колд-Спринг-Харборе. 6 Перед публикацией Джерри организовал для меня выступление на ежегодной конференции по исследованиям дрозофилы в Питтсбурге, на которой присутствовали сотни самых видных специалистов в этой области. На каждое кресло в зале мои сотрудники положили компакт-диск, содержащий весь геном дрозофилы, а также оттиски наших статей, опубликованных в Science. Джерри очень тепло представил меня, уверив собравшихся, что я выполнил все взятые на себя обязательства и что мы прекрасно работали вместе. Мое выступление заканчивалось сообщением о некоторых исследованиях, сделанных во время слета, и краткими комментариями к данным на компакт-диске. Аплодисменты после моего выступления вызвали у меня такое же удивление и были так же приятны, как пять лет назад, когда мы с Хэмом впервые представили геном Haemоphilus на съезде микробиологов. Впоследствии статьи по геному дрозофилы стали наиболее часто цитируемыми статьями в истории науки.

Несмотря на то, что тысячи исследователей плодовой мушки всего мира были в восторге от результатов, мои критики быстро перешли в наступление. Джон Салстон назвал попытку секвенирования генома мушки неудачей, хотя полученная нами последовательность была более полной и более точной, чем результат его кропотливой десятилетней работы по секвенированию генома червя, завершение которой потребовало еще четырех лет после публикации чернового варианта в Science. Коллега Салстона Мейнард Олсон назвал последовательность генома дрозофилы «безобразием», в котором «по милости» Celera придется разбираться участникам государственного проекта генома человека. В действительности же команда Джерри Рубина сумела быстро закрыть оставшиеся пробелы в последовательности путем публикации и сравнительного анализа уже расшифрованного генома менее чем через два года. Эти данные подтвердили, что мы допустили 1–2 ошибки на 10 тысяч пар оснований во всем геноме и менее 1 ошибки на 50 тысяч пар оснований работающего (эухроматического) генома.

Однако, несмотря на всеобщее признание проекта Drosophila, летом 1999 года напряженность в наших отношениях с Тони Уайтом достигла апогея. Уайт никак не мог смириться с вниманием, которое пресса уделяла моей персоне. Каждый раз, приезжая в Celera, он проходил мимо развешанных на стенах в коридоре, рядом с моим кабинетом, копий статей о наших достижениях. А тут мы увеличили одну из них - обложку воскресного приложения газеты USA Today. На ней, под заголовком «Удастся ли этому АВАНТЮРИСТУ совершить величайшее научное открытие нашего времени?» 7 был изображен я, в синей клетчатой рубашке, закинув ногу на ногу, а вокруг меня парили в воздухе Коперник, Галилей, Ньютон и Эйнштейн - и никаких признаков Уайта.

Каждый день его пресс-секретарь звонила узнать, нельзя ли Тони принять участие в кажущемся бесконечным потоке интервью, проходящих в Celera. Он немного успокоился - да и то ненадолго, когда на следующий год ей удалось добиться, чтобы его фотографию поместили на обложке журнала Forbes как человека, который смог увеличить капитализацию компании PerkinElmer от 1,5 миллиарда долларов до 24 миллиардов долларов 8 . («Тони Уайт превратил бедолагу PerkinElmer в высокотехнологичного ловца генов».) Тони не давала покоя и моя общественная активность.

Примерно раз в неделю я выступал c докладом, соглашаясь на малую толику из огромного количества приглашений, которые постоянно получал, потому что мир хотел знать о нашей работе. Тони даже жаловался в совет директоров PerkinElmer, переименованную к тому времени в PE Corporation, что мои поездки и выступления нарушают корпоративные правила. Во время двухнедельного отпуска (за свой счет), который я провел в своем доме на Кейп-Код, Тони вместе с финансовым директором Деннисом Уингером и главным юрисконсультом Applera Уильямом Соучем полетел в Celera, чтобы опросить моих ведущих сотрудников насчет «эффективности руководства Вентера». Они надеялись собрать достаточно грязи, чтобы обосновать мое увольнение. Уайт был поражен, когда все сказали, что если я уйду, они тоже уволятся. Это вызвало огромную напряженность в нашей команде, но и одновременно сплотило нас теснее, чем когда-либо. Мы готовы были праздновать каждую победу как последнюю.

После публикации последовательности генома мушки - к тому времени это была самая большая расшифрованная последовательность в истории - Джин, Хэм, Марк и я подняли тост за то, что выдержали Тони Уайта достаточно долго и добились признания наших успехов. Мы доказали, что наш метод будет работать и при секвенировании генома человека. Даже если бы на следующий день Тони Уайт прекратил финансирование, мы знали - наше главное достижение останется с нами. Больше всего на свете я хотел уйти из Celera и не общаться с Тони Уайтом, но поскольку еще больше я хотел секвенировать геном Homo sapiens, мне приходилось идти на компромисс. Я старался, как мог, ублажить Уайта, только бы продолжить работу и завершить задуманное.

Примечания

1. Shreeve J. The Genome War: How Craig Venter Tried to Capture the Code of Life and Save the World (New York: Ballantine, 2005), p. 285.

2. Ashburner M. Won for All: How the Drosophila Genome Was Sequenced (Cold Spring Harbor Laboratory Press, 2006), p. 45.

3. Shreeve J. The Genome War, p. 300.

4. Ashburner M. Won for All, p. 55.

5. Sulston J., Ferry G. The Common Thread (London: Corgi, 2003), p. 232.

6. Adams M. D., Celniker S. E. et al. «The Genome Sequence of Drosophila Melanogaster», Science, № 287, 2185–95, March 24, 2000.

7. Gillis J. «Will this MAVERICK Unlock the Greatest Scientific Discovery of His Age? Copernicus, Newton, Einstein and VENTER?», USA Weekend, January 29–31, 1999.

8. Ross P. E. «Gene Machine», Forbes, February 21, 2000.

Крейг Вентер


Новое на сайте

>

Самое популярное