Проект Theorizer AI, который читает тысячи научных статей и выводит законы

02.03.202602.03.2026

28 января 2026 года Allen Institute for AI («Институт искусственного интеллекта Алена» в США) представил Theorizer, фреймворк на базе нескольких больших языковых моделей, который читает научную литературу и автоматически генерирует структурированные теории. Система получает запрос от пользователя («сделай мне теории о X»), анализирует релевантные исследования и выдает утверждения о закономерностях, которые прослеживаются в этих работах, с указанием области их применения.

Разработчики представляют свой проект в качестве способа сориентироваться в новой научной области за минуты, а не месяцы, а также как шаг к автоматизации одной из самых упорно сопротивляющихся механизации частей науки: построения теорий на основе разрозненных находок. Вместе с Theorizer команда опубликовала датасет примерно из 3000 теорий, сгенерированных на основе широкого среза исследований в области AI и обработки естественного языка; для его создания было использовано 13744 исходные статьи.

Смотрите видео на удобном для вас ресурсе!

YouTube ВК.Видео RuTube ОК

Нейросеть-«теоретик»

Ученые обычно концентрируют свое внимание на разработке или проверке отдельных теорий, и при этом, как правило, на протяжении длительных периодов времени. Allen Institute задался вопросом: что, если тысячи теорий можно синтезировать одновременно, автоматически анализируя весь массив исследований в определенной области?

Существует множество AI-инструментов для суммаризации статей или подготовки детальных обзоров литературы. Theorizer вместо этого идентифицирует закономерности, паттерны, которые последовательно прослеживаются в нескольких исследованиях, и выражает их как проверяемые утверждения с определенной областью применения и подтверждающими доказательствами. При этом каждая теория, которую выдает система, обладает своей структурой – у нее имеются собственные законы и доказательства, область применения и пр.

Закон представляет собой качественное или количественное утверждение, закономерность, которая, по мнению Theorizer, имеет место быть в теории. Качественный закон может выражать направленную связь наподобие «X увеличивает Y» или «A вызывает B». С другой стороны, количественный закон указывает конкретные числовые границы. Большинство работ в области автоматизированных научных открытий сконцентрированы на экспериментальной стороне. Собственный проект Allen Institute под названием CodeScientist, например, может взять исследовательский вопрос, сгенерировать код для экспериментов, выполнить их и представить кандидатов на звание открытий.

В реальной науке эксперименты обычно служат чему-то более высокоуровневому: построению теорий. Теории консолидируют множество результатов в компактные законы, которые объясняют и предсказывают, именно так области знания консолидируют информацию и делают устойчивый прогресс. Законы Кеплера обобщили многолетние астрономические наблюдения в несколько простых правил движения планет.

Как оценивается работа проекта

Система функционирует на основе комбинации больших языковых моделей и способна находить закономерности, которые не очевидны при поверхностном чтении отдельных работ. Разработчики протестировали различные методы генерации теорий, в том числе использование научной литературы против параметрической памяти модели, и обнаружили, что подход с опорой на литературу создает теории, которые значительно лучше как при соответствии существующим доказательствам, так и при предсказании будущих результатов. Для оценки использовались 4600 статей, написанных уже после генерации теорий. Некоторые методы производили теории, которые в среднем на 90% точно предсказывали результаты последующих научных работ. Это впечатляющий показатель для автоматически сгенерированного контента, хотя и не без оговорок.

Между точностью и новизной

Theorizer позволяет исследователям выбирать фокус генерации: можно запросить теории с упором на точность или на новизну. Эти два направления дают разные результаты. Теории, ориентированные на точность, лучше подтверждаются существующими работами; а теории с упором на новизну предлагают более свежие гипотезы, но с меньшей доказательной базой.

Стоимость и время работы Theorizer нетривиальны: примерно 15-30 минут на один запрос, хотя процесс можно распараллелить. Покрытие зависит от статей в открытом доступе, поэтому система сейчас работает лучше всего в таких областях, как AI и обработка естественного языка. Ошибки тоже возможны: Theorizer может производить частично точные или вводящие в заблуждение теории, поэтому разработчики рекомендуют рассматривать его вывод только лишь в качестве отправной точки для своих исследований. Научное знание растет быстрее, чем кто-либо может синтезировать, и построение теорий остается по большей части ручным процессом. Если автоматизированные системы смогут помочь сжать литературу в структурированные, проверяемые теории, они станут полезным инструментом для осмысления того, что мы коллективно знаем.

Выводы

Как отмечают эксперты Креатор Проджект, проект Theorizer является доказательством того, что ИИ может не только анализировать статьи, но и формулировать обобщающие закономерности на их основе. Пока такие системы требуют проверки и аккуратного использования, однако они уже помогают быстрее ориентироваться в растущем массиве научных публикаций. Они способны заметно изменить то, как исследователи работают с литературой и строят новые гипотезы.

Если вы нашли ошибку, пожалуйста, выделите фрагмент текста и нажмите Ctrl+Enter. Можете написать лучше? Мы всегда рады новым авторам.

Разбор и оценка ИИ-моделей и проектов, внимательно отслеживает развитие технологий и тенденции в области искусственного интеллекта. Аналитические обзоры помогают понять принципы работы ИИ, их возможности и ограничения, дает рекомендации по использованию инновационных решений в различных сферах. Делает сложные темы доступными для широкой аудитории.

Интересно? Поделиться:

Добавить комментарий Отменить ответ

Рекомендуем почитать

Логотип приложения ChatGPT на экране смартфона

ChatGPT еженедельно пользуются 900 миллионов пользователей

ChatGPT достиг 900 миллионов еженедельных активных пользователей, сообщила OpenAI в пятницу, приблизив чат-бота на расстояние вытянутой руки к отметке в…

Вывеска ресторана Burger King в городе Эри, штат Пенсильвания, в понедельник, 8 сентября 2025 года

Burger King тестирует ИИ-гарнитуры, которые подсказывают рецепты и контролируют запасы и качество обслуживания

Burger King тестирует гарнитуры на базе искусственного интеллекта, которые могут зачитывать рецепты, предупреждать менеджеров о низких запасах и даже отслеживать,…

Министр обороны США Пит Хегсет стоит перед Пентагоном во время церемонии приветствия министра обороны Японии в Пентагоне в Вашингтоне, 15 января 2026 года

Пентагон пригрозил Anthropic: откройте ИИ для неограниченного военного применения — или лишитесь контракта

Министр обороны США Пит Хегсет на встрече во вторник поставил генеральному директору Anthropic дедлайн до пятницы: открыть технологии искусственного интеллекта…

Искусственный интеллект

Anthropic обвинила DeepSeek, MiniMax и Moonshot в незаконной «дистилляции» модели Claude

Anthropic утверждает, что DeepSeek и ещё две китайские AI-компании неправомерно использовали её модель Claude, пытаясь улучшить собственные продукты. В объявлении,…

Сообщить об опечатке

Текст, который будет отправлен нашим редакторам:

Отправить

Продолжая использовать наш сайт, вы соглашаетесь с использованием файлов cookie. Они помогают нам обеспечивать корректную работу сайта и делать его более удобным.

Принять

Подробнее…

Политика конфиденциальности