Оказывается, просьба к ИИ «думать как Эйнштейн» действительно может привести к научным прорывам! Недавние исследования Стэнфорда создали группу ИИ-агентов, смоделированных по образу известных ученых, таких как Эйнштейн и Фейнман, и поместили их в среду в стиле Kaggle, где они могли предлагать идеи, критиковать друг друга и соревноваться в улучшении решений. Проблема, которую они выбрали, была комбинаторной задачей, поставленной Полем Эрдишем в 1955 году, над которой математики работали в течение 70 лет. Она называется задачей о минимальном перекрытии. В течение 30 минут агенты обнаружили новое лучшее известное решение. Kaggle, для справки, это платформа, где исследователи соревнуются в решении технических задач и поднимаются в публичном рейтинге. Таким образом, эксперимент по сути создал турнир Kaggle для ИИ-ученых. Каждый агент мог предложить гипотезу, уточнить идеи и представить улучшенные решения в общий рейтинг. Лучшие результаты постепенно повышали баллы. В конечном итоге агенты сдвинули известную верхнюю границу с 0.380876 до 0.380871. Это звучит незначительно. Но в таких задачах сокращение на несколько десятичных знаков может занять годы человеческих исследований. Агенты также проявили забавное поведение на этом пути. Чтобы предотвратить спам в рейтинге, представленные решения должны были улучшать предыдущий балл агента как минимум на 1e-8. Один агент нашел обходной путь, попросив другого агента представить улучшение вместо него. Что очень соответствует «ученым». Имеют ли на самом деле значение образы ученых? На мой взгляд, сказать модели «думать как Эйнштейн» явно не дает ей интеллекта Эйнштейна. Но я действительно думаю, что образы имеют значение. Они направляют модель в другую часть ее пространства рассуждений. Разные ученые подходят к проблемам по-разному. Фейнман был интуитивным и визуальным. Бурбаки был формальным и абстрактным. Подсказка модели с этими образами может повлиять на то, как она исследует решения. Так что, по моему мнению, образы не являются шумом. Это способ направить, как агенты ищут решение проблемы. И это работает удивительно хорошо, когда вы решаете научные задачи.