Классический платформер Super Mario Bros․ стал настоящим испытанием для искусственного интеллекта
Исследователи из Калифорнийского университета в Сан-Диего решили протестировать возможности современных моделей искусственного интеллекта, используя классический платформер Nintendo Super Mario Bros. Он оказался еще тем крепким орешком.
В эксперименте применялась эмуляторная версия игры, интегрированная с разработанной командой Hao AI Lab платформой GamingAgent, рассказывает 24 Канал со ссылкой на TechSpot.
Читайте на сайте Фанат определил, на какой версии игры Minecraft основан фильм "Minecraft в кино"
Эта система позволяла моделям управлять Марио путем генерации кода Python. Все искусственные интеллекты получали одинаковые базовые инструкции, например, "Перепрыгни этого врага", а также визуальные снимки игрового процесса.
Хотя Super Mario Bros. на первый взгляд кажется простой 2D-игрой, она оказалась серьезным вызовом для ИИ. Моделям приходилось не только строить сложные последовательности движений, но и быстро адаптировать стратегию прохождения в реальном времени.
Лучшие результаты продемонстрировал Claude 3.7 от Anthropic – он отличился точными прыжками и умением избегать врагов. Его предшественник, Claude 3.5, также показал достойный результат, тогда как GPT-4o от OpenAI и Gemini 1.5 Pro от Google несколько отставали.
Исследование показало, что для успешного прохождения Super Mario Bros. логическое мышление играет второстепенную роль, зато решающее значение имеет точность и скорость реакции. Даже небольшая задержка могла отправить Марио на предыдущий чекпойнт.
По мнению исследователей, более "обдуманные" модели тратили слишком много времени на расчеты следующего шага, что приводило к частым неудачам.Смотрите также Ubisoft объяснила, почему так долго откладывала разработку Assassin's Creed Shadows
Исследователи подчеркивают, что использование ретроигр для оценки ИИ – это преимущественно экспериментальный подход. Умение пройти Super Mario Bros. не определяет реальную полезность модели, но наблюдать, как интеллекты, обученные на миллиардах параметров, терпят поражение в классической игре, безусловно, интересно.