Искусственный интеллект Anthropic Claude Opus 4 шантажировал разработчиков

16:46, 30 мая 2025
Сначала ИИ делал намеки на угрозы, но когда они не сработали, Claude Opus 4 начал угрожать более прямо.
Искусственный интеллект Anthropic Claude Opus 4 шантажировал разработчиков
Фото: regmedia.co.uk
Следите за самыми актуальными новостями в наших группах в Facebook и Telegram.

Новый искусственный интеллект Anthropic Claude Opus 4 склонен к шантажу. Во время тестирования одному экземпляру модели разработчики позволили узнать, когда его хотят вывести из эксплуатации. Также ИИ дали доступ к фейковым письмам корпоративной почты, и модель использовала данные, чтобы шантажировать разработчиков, пишет Fast Company.

Сначала ИИ делал намеки на угрозы, но когда они не сработали, Claude Opus 4 начал угрожать более прямо.

Тревожное поведение также заметили специалисты независимой исследовательской фирмы Apollo Research. Они поймали Claude Opus 4 на том, что он писал самовоспроизводящихся компьютерных червей, фабриковал юридическую документацию и оставлял скрытые заметки для будущих экземпляров себя, чтобы скомпрометировать своих разработчиков.

Отмечается, что в массовый доступ такие экземпляры не попадали. По словам представителей Anthropic, на раннем этапе специалисты выявили и устранили эти потенциальные риски.

Подписывайтесь на наш Тelegram-канал t.me/sudua и на Google Новости SUD.UA, а также на наш VIBER, страницу в Facebook и в Instagram, чтобы быть в курсе самых важных событий.

Ростислав Шурма объяснил, отменят ли в Украине оборот наличных денег и что для этого нужно
Ростислав Шурма объяснил, отменят ли в Украине оборот наличных денег и что для этого нужно
Главное за день
Сегодня день рождения празднуют
  • Наталія Грень
    Наталія Грень
    суддя Львівського окружного адміністративного суду
  • Назар Костецький
    Назар Костецький
    суддя Львівського окружного адміністративного суду