Ученые из Сколтеха использовали генеративный ИИ для восполнения пробелов в экспериментальных данных. Это достижение, опубликованное в журнале Scientific Reports 4 июня 2025 года, открывает новые перспективы для разработки лекарств и методов диагностики генетических заболеваний. Это решает давнюю проблему неполноты данных в этой области.
Проблема заключалась в том, что традиционные методы, такие как флуоресцентная микроскопия, не позволяли получить полную картину расстояний между генами. Некоторые участки ДНК не поддавались маркировке из-за особенностей их последовательностей, например, множественных повторов одного нуклеотида. Это приводило к фрагментарным данным, что серьезно тормозило прогресс в медицинской генетике и понимании биофизики хроматина – вещества хромосом. Неполные данные считались неизбежной реальностью для исследователей.
Команда Сколтеха под руководством старшего преподавателя Кирилла Половникова впервые успешно применила генеративные ИИ-модели для решения этой задачи. Обычно такие системы используются для творческих целей, вроде создания изображений или текстов. Однако ученые показали, что ИИ способен эффективно решать математическую задачу по восстановлению недостающих расстояний между парами генов на основе имеющихся экспериментальных данных.
Понимание пространственной конфигурации ДНК критически важно, так как от нее зависит активность генов, деление клеток и их специализация. Нарушения в архитектуре ДНК связаны с развитием различных заболеваний, включая рак. Имея полную картину, ученые могут сравнивать структуру ДНК здоровых и больных организмов, находить биомаркеры для диагностики и разрабатывать персонализированные методы лечения.
Это также открывает путь к обнаружению новых мишеней для терапевтического воздействия и созданию лекарств для восстановления нормальной работы генов.