Новости

Ученые создали ИИ-ученого. Он уже начал делать исследования вместо реальных людей

Научные открытия — сложная сфера, требующая от ученых глубокого знания темы, выявления пробелов, формулирования вопросов и анализирования экспериментов. Sakana AI Labs недавно объявила о создании ИИ, способного автоматизировать этот процесс для машинного обучения.

Множество научных исследований проводится публично, и почти все имеющиеся научные знания задокументированы (иначе мы бы не могли их знать). Миллионы научных статей находятся в свободном доступе в онлайн-репозиториях, таких как arXiv и PubMed. Большие языковые модели (LLM), обученные на этих данных, понимают язык науки и его структуры. Это означает, что генеративная языковая модель может создать текст, напоминающий научную статью, так как она обрабатывает множество примеров и может их воспроизвести. Однако возникает вопрос: может ли ИИ создать действительно интересную научную работу? Стоит отметить, что качественная статья требует новизны.

Система Sakana пытается решить вопрос интересности двумя способами. Во-первых, она вычисляет оценку схожести новых идей для статей с уже существующими исследованиями в репозитории Semantic Scholar. Если идея слишком похожа на уже опубликованные работы, она отклоняется. Во-вторых, Sakana использует этап рецензирования с помощью другой крупной языковой модели (LLM), которая оценивает качество и новизну предложенной статьи. Для этого Sakana опирается на многочисленные примеры рецензий, доступные онлайн на таких платформах, как openreview.net, которые помогают установить стандарты оценки научных работ.

Обратная связь по результатам работы Sakana AI является неоднозначной. Некоторые описывают их как «бесконечную научную мешанину». Даже собственная система рецензирования Sakana оценивает созданные статьи как слабые в лучшем случае. Это, вероятно, улучшится по мере эволюции технологии, но остается вопрос, имеют ли автоматизированные научные статьи какую-либо ценность.

Система Sakana автоматизирует открытия в области вычислительных исследований, что гораздо легче, чем в других видах науки, требующих проведения физических экспериментов. Эксперименты Sakana проводятся с использованием кода, который также является структурированным текстом, который LLM можно обучить генерировать.

Ученые в области искусственного интеллекта уже много десятилетий разрабатывают системы для поддержки научных исследований. В условиях огромного количества опубликованных работ поиск публикаций, имеющих отношение к конкретному научному вопросу, может быть весьма затруднительным.

Специализированные поисковые инструменты, использующие ИИ, помогают ученым находить и анализировать уже существующие исследования. К таким инструментам относятся, например, Semantic Scholar, а также более новые системы, такие как Elicit, Research Rabbit, scite и Consensus. Инструменты для анализа текста, например PubTator, работают с научными статьями, чтобы выделить ключевую информацию, такую как специфические генетические мутации и болезни, а также их взаимосвязи. Это особенно важно для систематизации и хранения научных данных.

Методы машинного обучения также применяются для анализа и синтеза медицинских данных, что можно видеть в таких инструментах, как Robot Reviewer. Резюме, в которых сравниваются утверждения в статьях от Scholarcy, помогают при выполнении литературных обзоров. Все эти инструменты созданы, чтобы повысить эффективность работы ученых, а не заменить их.

Sakana AI утверждает, что роль ученых остается значимой, но их концепция «полностью управляемой ИИ научной экосистемы» может кардинально повлиять на науку. Если научная литература будет переполнена статьями, созданными ИИ, будущие системы, обученные на основе данных ИИ, могут привести к снижению инноваций, — вот одно из опасений.

Ранее новое исследование показало, что шутки, сгенерированные ChatGPT, были признаны смешнее человеческих на 70%: ИИ может превзойти человека в юморе. Исследование, включавшее в себя такие задания, как создание новых фраз и сатирических заголовков, продемонстрировало как потенциал ИИ в юморе, так и его последствия для профессиональных писателей.