Где копируется генетическая информация днк

Сергей Лурье 8 ноября Помните ли вы первоначальное значение слова "вирус"? Да, да, я имею в виду тот самый биологический объект, в честь которого получили свое название вредоносные компьютерные программы, помещающие свой код внутрь других файлов с целью размножения и распространения. Вероятно, в обозримом будущем это слово получит свое первоначальное значение в компьютерных данных.

Суть в том, что этим летом исследователи из Microsoft и Университета Вашингтона сделали то, чего никто не делал раньше: хранили мегабайты данных в виде последовательности нуклеотидов в искусственно созданной ДНК. Какое отношение к этому имеют вирусы? Они имеют к этому самое непосредственное отношение. Вирусы вставляют свой генетический код в ДНК клеток зараженных организмов, заставляя их воспроизводить себя вместо полезных белков, как учили классики: жизнь - это форма существования белковых тел.

Особенно агрессивные вирусы настолько мешают нормальному функционированию пораженного организма, что в конечном итоге приводят к его гибели. Аналогично, особенно неприятный вредоносный код может привести к невозможности использования пораженной информационной системы. Поэтому, раз уж человечество начинает активно записывать информацию в виде ДНК, возможно, нам стоит задуматься о защите информации на "аппаратном уровне". Для начала расскажем, как устроено "железо", с которым нам приходится иметь дело.

ДНК, или дезоксирибонуклеиновая кислота, является носителем генетической информации, а также самой большой молекулой в нашем организме. Если использовать аналогию из области информационных технологий, то это загрузочный образ операционной системы. Из ДНК синтезируются

РНК, рибонуклеиновые кислоты, играющие роль программ для синтеза белков, "исполняемых модулей", в компьютерных терминах, из которых состоит все живое и которые отвечают за проведение физиологических процессов на молекулярном уровне.

Все характеристики организма, от цвета волос и глаз до предрасположенности к наследственным заболеваниям, записаны в ДНК. Они записаны в виде последовательности нуклеотидов - молекулярных блоков, содержащих всего четыре типа азотистых оснований: аденин, гуанин, тимин, цитозин.

Это такие биологические кусочки. Как видите, в отличие от человека, мать-природа использовала не двоичную систему счисления, а четверичную. Кстати, природа позаботилась о защите от сбоев - ДНК большинства живых существ состоит не из одной, а из двух нитей нуклеотидов, обернутых друг вокруг друга, как витая пара в двойной спирали. <Эти две цепи связаны между собой водородными связями, которые возникают только в том случае, если с каждой стороны находится определенный нуклеотид, тем самым автоматически обеспечивая соответствие информации в каждой из двух спиралей. На этом основан первый механизм безопасности: при расшифровке или репликации ДНК используется одна из двух спиралей, а вторая играет роль контрольной спирали на случай, если какая-либо из нуклеотидных последовательностей, кодирующих определенный генетический признак, окажется поврежденной в одной из спиралей.

В дополнение к взаимному соответствию двух цепочек нуклеотидов, кодирование наследственных признаков осуществляется по избыточному алгоритму - можно сказать, что каждый наследственный признак, записанный в виде последовательности биологических битов - оснований, дополнительно снабжен контрольной суммой. За полвека, прошедшие с момента открытия ДНК, эти последовательности достаточно хорошо изучены, что позволяет любому желающему заказать расшифровку основных генетических признаков собственной ДНК онлайн, причем не только в ближайшей лаборатории, но и в Интернете - с помощью сервиса 23andme и ему подобных.

Изначально в распоряжении ученых были такие методы, как рентгеноструктурный анализ, семейство спектроскопических методов и масс-спектрометрия. Все эти методы хорошо работают для небольших молекул из двух, трех или четырех атомов, но все становится гораздо сложнее, когда число атомов действительно велико.

Однако ДНК - не единственный метод, который использовался в прошлом. <ДНК не зря считается самой большой молекулой в нашем организме - человеческая ДНК из гаплоидной клетки содержит около 3 миллиардов пар оснований. Ее молекулярный вес на несколько порядков больше, чем у самого большого из известных науке белков. В целом, это невероятно огромная куча атомов, поэтому на расшифровку данных классическими методами чтения, даже сегодня, с использованием суперкомпьютеров, легко могут уйти месяцы и даже годы.

Но ученым удалось придумать метод секвенирования, который значительно ускоряет эту процедуру. Основная идея заключается в том, чтобы разбить одну длинную атомную последовательность на множество более коротких фрагментов, которые можно анализировать параллельно, увеличивая скорость расшифровки в несколько раз. Для секвенирования биологи используют "молекулярные машины" - специальные белки, называемые ферментами полимеразы. Основная функция этих белков - копирование ДНК. Для этого они проводят последовательность вдоль спирали и собирают из нуклеотидов идентичную молекулу. <Но поскольку нам нужна не просто полная копия ДНК, а скорее нарезка на более короткие фрагменты, мы дополнительно используем так называемые праймеры и маркеры - соединения, которые указывают полимеразе, где начать клонирование, а где остановиться. Праймеры - это четко определенная последовательность нуклеотидов, которая присоединяется к цепи только там, где встречает "ответную" комбинацию. Полимераза находит праймер, "садится" на нуклеотидную цепь и начинает строить ее из компонентов, помещенных в раствор.

Она делает это до тех пор, пока не встретит маркер - модифицированный нуклеотид, на котором дальнейшее "достраивание" цепи прекращается. То, что этот метод не позволяет указать точные "адреса" начала и конца клонирования, а только те последовательности "битов", с которых начинается и заканчивается выделение фрагмента, представляет определенную проблему.

Допустим, у нас есть комбинация битов Предположим, что наш праймер - это комбинация из , а наш маркер - комбинация из В результате секвенирования получается следующий набор фрагментов, в порядке убывания их вероятности: , , , , , , Варьируя праймер и маркер, мы в конечном итоге переберем все возможные комбинации битов, подсчитаем их и, прочитав их, восстановим всю последовательность из отдельных фрагментов. Это выглядит немного сложно и не требует пояснений, но это действительно работает и достаточно быстро, поскольку в конечном итоге все необходимые шаги могут быть выполнены параллельно.

Хорошая скорость по меркам биологов - несколько часов. Значительно лучше, чем вышеупомянутые месяцы или даже годы, но по меркам ИТ, скажем так, это многовато.

ДНК и хранение произвольной информации Научившись за полвека неплохо считывать информацию с ДНК, оставалось научиться синтезировать цепочки нуклеотидов. Следует отметить, что исследователи Microsoft не были первыми, кто записал информацию в виде двойной спирали ДНК.

Во-первых, резко возросла емкость записи - до Мбайт. Это уже довольно близко к мегабайтам, содержащимся в ДНК человека. Однако главное новшество заключается в том, что исследователи предложили способ считывать не всю ДНК, а ее часть, порядка базовых бит, за одну операцию. Они добились этого, используя пары праймеров и маркеров, которые обеспечивают копирование полимеразой - а затем считывание - блока данных определенного размера, расположенного по определенному адресу относительно начала "файла" - цепочки нуклеотидов.

Это еще не совсем полный аналог случайного доступа к памяти, но уже довольно близко к чтению по блокам. Пока ученые считают, что основной нишей для такого использования ДНК могут стать модули памяти высокой плотности, предназначенные для длительного хранения информации. Дополнительным преимуществом является то, что молекулы ДНК достаточно стабильны и, учитывая алгоритмы коррекции ошибок, позволяют хранить информацию годами и даже веками. Будут проводиться эксперименты с долгосрочным хранением данных.

А это значит, что целостности информации, записанной на таком видео, угрожают организмы, которые специализируются на повреждении данных уже миллиарды лет: вирусы.

Конечно, не стоит ожидать появления специальных генетически модифицированных вирусов, предназначенных для "охоты" именно на тот тип ДНК, в котором записана та или иная информация. Просто потому, что данные легче модифицировать, внедрив в них вредоносный код, пока они находятся в чисто цифровой форме - еще до того, как они записаны в ДНК.

Но нужно ли будет думать о защите от обычных вирусов при работе с таким устройством хранения данных - вопрос открытый. Ведь если, например, вирус насморка попадет в раствор ДНК, то полимераза, скорее всего, будет реплицировать и его.

В этом случае.

Так что вы не хотите, чтобы вам пришлось читать чип ДНК через десять лет после записи и гадать, чихнул ли лаборант во время записи важного архивного документа.


Навигация

thoughts on “Где копируется генетическая информация днк

  1. Я извиняюсь, но, по-моему, Вы ошибаетесь. Предлагаю это обсудить. Пишите мне в PM, поговорим.

  2. Специально зарегистрировался на форуме, чтобы сказать Вам спасибо за помощь в этом вопросе.

  3. Могу порекомендовать зайти на сайт, с огромным количеством информации по интересующей Вас теме.

Добавить комментарий

Ваш e-mail не будет опубликован. Обязательные поля помечены *