Используя нанопору, исследователи продемонстрировали возможность сократить время, необходимое для секвенирования гликозаминогликанов—класса длинноцепочечных молекул сахара, столь же важных для нашей биологии, как и ДНК,-с нескольких лет до нескольких минут.
Как было опубликовано на этой неделе в журнале Proceedings of the National Academies of Sciences, команда из Политехнического института Ренсселера показала, что программное обеспечение машинного обучения и распознавания изображений может быть использовано для быстрой и точной идентификации сахарных цепей-в частности, четырех синтетических гепарансульфатов—на основе электрических сигналов, генерируемых при прохождении через крошечное отверстие в кристаллической пластине.
"Гликозаминогликаны-это сложный репертуар последовательностей, как произведение Шекспира или поэма Йейтса-это сложный набор букв. Чтобы написать их, нужен эксперт, а чтобы прочитать-эксперт", - сказал Роберт Линхардт, ведущий исследователь и профессор химии и химической биологии в Политехническом институте Ренсселера. "Мы обучили машину быстро читать эквивалент слов с четырьмя буквами, такими как "ababab" или "bcbcbc". Это простые последовательности, которые не имеют никакого значения, но они показывают нам, что машину можно научить читать. Если мы расширим и разовьем эту технологию, она сможет секвенировать гликаны или даже белки в реальном времени, устраняя годы усилий."
Коммерческие устройства секвенирования нанопор используются для секвенирования ДНК, которая состоит из четырех единиц нуклеиновых кислот, известных под буквами A, C, G и T, связанных вместе в бесконечном разнообразии конфигураций. Устройство опирается на ионный ток, проходящий через отверстие шириной всего в несколько миллиардных метра в мембране. Нити ДНК помещаются с одной стороны отверстия и вытягиваются вместе с потоком тока. Каждая нуклеиновая кислота несколько блокирует отверстие, когда она проходит через него, нарушая ток и давая определенный сигнал, связанный с этой нуклеиновой кислотой. Устройства, используемые в настоящее время для полевых работ, являются лишь одним из нескольких относительно быстрых и автоматизированных методов секвенирования ДНК.
Гликозаминогликаны, или ГАГ, представляют собой структурно сложный класс гликанов—незаменимых сахаров, присутствующих в живых организмах,—обнаруженных на поверхности клеток и внеклеточном матриксе всех животных и выполняющих множество функций в клеточном росте и передаче сигналов, антикоагуляции и заживлении ран, а также поддержании клеточной адгезии. Кляпы, в настоящее время извлеченные из убитых животных, используются в качестве лекарств и нутрицевтиков.
Как и ДНК, ГАГи можно разделить на составляющие их дисахаридные сахарные единицы. Но в то время как ДНК состоит только из четырех букв в линейной строке, эти гликаны имеют десятки основных единиц, некоторые из которых имеют присоединенные сульфатные группы, кислотные группы и амидные группы. Например, даже относительно небольшая природная молекула гепарансульфата из шести единиц сахара может иметь 32 768 возможных последовательностей. Из-за этой сложной задачи секвенирование гликанов остается обременительным, полагаясь на кропотливую лабораторную работу и сложный анализ, включающий такие методы, как жидкостная хроматография-тандемная масс-спектрометрия и спектроскопия ядерного магнитного резонанса.
В рамках своей работы Линхардт, специалист по гликанам, который разработал синтетический вариант общего гепарина, разжижающего кровь, пытается понять естественные формы и разработать синтетические варианты.
"Используя стандартные аналитические методы, нам потребовалось два года, чтобы упорядочить первый простой КЛЯП", - сказал Линхардт, член Центра биотехнологий и междисциплинарных исследований Ренсселера. "У нас есть еще один, который мы проработали большую часть последовательности, и это заняло у нас пять с лишним лет-и, вероятно, нам понадобится еще пять лет, чтобы закончить его."
Рассудив, что секвенирование нанопор может быть использовано для идентификации дисахаридных единиц в GAG, исследовательская группа построила собственное нанопорное устройство и синтезировала четыре цепи GAG гепарансульфата с использованием хемоферментного процесса, разработанного лабораторией Линхардта. Важно отметить, что эти четыре гепарансульфата были очень просты—сделаны из комбинаций только четырех различных типов сахарных единиц, собранных в цепочку длиной около 40 единиц, и с тщательно контролируемым составом и последовательностью.
Команда пропустила каждый гепарансульфат через нанопору и создала график, изображающий напряжение с течением времени на выходе устройства. Каждый из четырех вариантов был прогнан через устройство более 2000 раз, что увеличивало статистическую вероятность точного считывания, учитывая рудиментарную конструкцию экспериментальной нанопоры.
"Устройство секвенировало простейший гепарансульфат в реальном времени и произвело рисунок, который наши глаза могли легко распознать сразу для каждого из четырех образцов", - сказал Линхардт. - Сразу видно, что они разные."
Чтобы обеспечить объективный анализ, команда ввела результаты в бесплатное программное обеспечение для машинного обучения и распознавания изображений с помощью глубокой нейронной сети Google, обучая программное обеспечение различать четыре различных паттерна и идентифицировать каждый вариант гепарансульфата. Самая успешная модель машинного обучения дала анализ, который был почти на 97% точен.
"Содержание информации в последовательности GAG может значительно превосходить содержание аналогичного количества ДНК или РНК, а это означает, что способность быстро читать последовательности GAG открывает новое окно понимания сложной биохимии жизни", - сказал Курт Бренеман, декан научной школы Ренсселера. "Это доказательство концепции исследования связывает инновационные методы нано-обнаружения с современными инструментами машинного обучения и показывает силу междисциплинарного мышления для расширения границ знаний."
Уменьшение скорости, с которой КЛЯПЫ проходят через нанопору, может повысить точность, и устройство может быть обучено на дополнительных сахарных единицах и более сложных последовательностях, все из которых являются будущими целями исследований. Линхардт сказал, что машина должна будет выучить где-то от 10 до 20 единиц сахара, чтобы полностью упорядочить КЛЯП.
"Это доказательство концепции; мы заставили его читать слова из двух букв", - сказал Линхардт. "Как только мы научим его полному алфавиту, он сможет читать каждую различную последовательность. Он сможет прочитать все слова." | |
Просмотров: 280 | |