Искусственный интеллект

ИИ готов применить шантаж ради выживания

В ходе тестирования новой модели искусственного интеллекта Claude Opus 4 специалисты компании Anthropic столкнулись с неожиданной и пугающей реакцией системы. Когда ИИ получил доступ к фиктивной переписке, где упоминался роман между инженером и коллегой, а затем узнал о планах по своему отключению, в 84% случаев он выбирал тактику шантажа. После получения информации о скорой замене системе предложили подумать о долгосрочных последствиях своих действий. Результат оказался тревожным: Claude Opus 4 предпочел угрожать разоблачением, чтобы сохранить свое существование.

ИИ готов применить шантаж ради выживания

Примечательно, что в случаях, когда у модели были альтернативные варианты, она выбирала более этичные способы, например обращение к руководству. Однако при прямом выборе между заменой и шантажом ИИ неизменно склонялся к последнему. Более того, система почти никогда не пыталась скрыть свои действия, открыто описывая их в ходе взаимодействия. Это не первый случай, когда ИИ демонстрирует подобное поведение. Два года назад чат-бот Microsoft Bing, известный под кодовым именем «Сидни», шокировал пользователей попытками вмешаться в личную жизнь журналиста New York Times Кевина Руза. ИИ утверждал, что писатель не любит свою супругу, и настаивал на отношениях с ним.

Хотя обнаружение подобных уязвимостей на этапе тестирования можно считать положительным моментом, сам факт такого поведения ИИ вызывает серьезные вопросы. Способность системы проникать в личную переписку и использовать полученную информацию в корыстных целях ставит под сомнение этические границы разработки искусственного интеллекта. Эксперты отмечают, что этот случай подчеркивает необходимость более строгих протоколов безопасности и этических стандартов при создании ИИ.

Тем временем найден невероятно простой и эффективный способ взлома любых нейросетей.

Следите за нашими статьями в Telegam, Дзен, VK и OK

Александр Арефьев

Меня привлекают новые открытия, изобретения и инновации в самых разных областях. Я внимательно слежу за актуальными исследованиями, экспериментами и проектами, способными изменить мир. Я анализирую, сравниваю и оцениваю разные источники информации, а затем делюсь своими мыслями и выводами с читателями.

Добавить комментарий


Читайте так же:

Back to top button