
Международная группа исследователей добилась значительного прогресса в понимании регуляции экспрессии генов в геноме человека. Ученые провели всесторонний анализ цис-регуляторных элементов (CRE) — последовательностей ДНК, контролирующих транскрипцию генов. Это исследование предоставляет ценную информацию о том, как CRE управляют экспрессией генов в конкретных клетках и как мутации в этих областях могут влиять на здоровье человека, сообщает Nature Genetics.
Исследователи использовали передовую технологию под названием lentiMPRA (массовый параллельный репортерный анализ на основе лентивируса), которую команда разработала ранее. Этот подход позволяет одновременно анализировать тысячи CRE путем маркировки их уникальными ДНК-штрихкодами, отслеживающими их активность.
Применяя технологию lentiMPRA, ученые изучили около 680 000 потенциальных CRE в трех широко используемых типах клеток: гепатоцитах (клетках печени), лимфоцитах (типе белых кровяных телец) и индуцированных плюрипотентных стволовых клетках. Исследование показало, что примерно 41,7% проанализированных CRE проявляли активность.
В ходе исследования были разработаны несколько моделей машинного обучения для прогнозирования регуляторной активности CRE на основе масштабных экспериментальных данных. MPRALegNet, модель, обученная на обширном наборе данных lentiMPRA, оказалась наиболее точной и эффективной в прогнозировании регуляторной активности любой последовательности ДНК.
Модель также продемонстрировала способность идентифицировать важные мотивы связывания факторов транскрипции — короткие последовательности ДНК, определяющие активность CRE. Исследование выявило мотивы HNF4 и GATA как ключевые для активности в гепатоцитах и лимфоцитах соответственно.
Это исследование также способствовало созданию общедоступной базы данных активности CRE на портале ENCODE, предоставляя ценный ресурс для исследователей по всему миру. Интеграция масштабных экспериментальных данных с машинным обучением закладывает основу для будущих открытий в геномике и персонализированной медицине.