Новый искусственный интеллект для голосового общения, разработанный стартапом Sesame, вызвал бурные дискуссии в интернете. Его чрезвычайно реалистичная речь, включающая смех, паузы и даже исправление ошибок в реальном времени, восхищает пользователей, но одновременно вызывает беспокойство из-за своей правдоподобности. Об этом сообщает ArsTechnica.
Компания представила демоверсию своей Conversational Speech Model (CSM) в феврале, предложив два голоса: мужской («Майлз») и женский («Майя»). Некоторые пользователи признаются, что почувствовали эмоциональную связь с виртуальными собеседниками. Один из родителей даже рассказал, что его 4-летняя дочь расплакалась, когда ей не разрешили продолжить разговор с ИИ.
Что известно о технологии Sesame
- ИИ-голос основан на архитектуре Llama от Meta и использует 8,3 миллиарда параметров.
- Обучен на 1 миллионе часов аудио, он интегрирует текст и звук в единую нейросеть.
- В слепых тестах люди не смогли отличить короткие ответы ИИ от настоящих голосов.
Однако не всех такая реалистичность радует. Некоторые пользователи заявляют, что испытали дискомфорт, когда ИИ-голос напоминал им реальных людей. Журналист PCWorld Марк Хахман отметил, что голос системы был настолько похож на его давнюю подругу, что это вызвало у него внутреннее неприятие.
Риски и возможные угрозы
Технологические эксперты предупреждают: слишком реалистичные голосовые ИИ могут спровоцировать волну мошенничества. Голосовой фишинг уже сейчас используется злоумышленниками, а такие инструменты, как Sesame, могут сделать аферы еще более убедительными.
Несмотря на это, основатели компании обещают продолжить совершенствование технологии. «Мы еще в процессе доработки, но уверены, что сможем это улучшить», – заявили в Sesame.
Подписывайтесь на наш Тelegram-канал t.me/sudua и на Google Новости SUD.UA, а также на наш VIBER, страницу в Facebook и в Instagram, чтобы быть в курсе самых важных событий.