Простая игра с покемонами оказалась сложной для передовой нейросети
Компания Anthropic транслирует в режиме реального времени работу своей передовой модели искусственного интеллекта Claude 3.7 с индексом Sonnet, пытающейся пройти игру Pokémon Red. Эксперимент, получивший название «Клод играет в покемонов», призван продемонстрировать потенциал направленного развития моделей ИИ, способных автономно функционировать, взаимодействуя с окружающей средой. Несмотря на достигнутые успехи – получение трёх значков спортзала и прибытие в Лазурный город на этой неделе – прогресс Claude оставляет желать лучшего.
Модель демонстрирует медлительность, часто останавливаясь для «размышлений» после каждого шага, что зачастую занимает значительное время. Например, Клод потратил почти 80 часов на беспорядочное блуждание по горе Мун, прежде чем найти необходимую лестницу для выхода. В настоящий момент прогресс Claude практически застопорился. Поиск пути к Маршруту 5, необходимому для перехода на следующий этап игры, ставит модель в тупик. Анализируя текстовое окно трансляции, можно заметить, что ИИ использует метод исключения для определения локаций, не являющихся входом на Маршрут 5.
По словам инженеров Anthropic, основная проблема для Claude заключается в визуальной интерпретации игрового окружения. Модель успешно обрабатывает текстовые фрагменты игры, включая сражения с покемонами, и имеет доступ к оперативной памяти игры, предоставляющей информацию о ее координатах. Однако она не способна последовательно интерпретировать пиксельную графику низкого разрешения игрового мира. Несмотря на трудности, Claude иногда проявляет неожиданную сообразительность, успешно справляясь с обманчивыми подсказками в игре.
Тем временем нейросеть GigaChat напишет свою версию второго тома «Мертвых душ».