Новий штучний інтелект для голосового спілкування, розроблений стартапом Sesame, викликав бурхливі дискусії в інтернеті. Його надзвичайно реалістична мова, що включає сміх, паузи та навіть виправлення помилок у реальному часі, захоплює користувачів, але водночас викликає занепокоєння через свою правдоподібність. Про це повідомляє ArsTechnica.
Компанія презентувала демоверсію своєї Conversational Speech Model (CSM) у лютому, запропонувавши два голоси: чоловічий («Майлз») і жіночий («Мая»). Деякі користувачі зізнаються, що відчули емоційний зв’язок із віртуальними співрозмовниками. Один із батьків навіть розповів, що його 4-річна донька розплакалася, коли їй не дозволили продовжити розмову з ШІ.
Що відомо про технологію Sesame
- ШІ-голос базується на архітектурі Llama від Meta та використовує 8,3 мільярда параметрів.
- Навчений на 1 мільйоні годин аудіо, він інтегрує текст і звук в єдину нейромережу.
- В «наосліп» тестах люди не змогли відрізнити короткі відповіді ШІ від справжніх голосів.
Однак не всіх така реалістичність тішить. Деякі користувачі заявляють, що відчули дискомфорт, коли ШІ-голос нагадував їм реальних людей. Журналіст PCWorld Марк Хахман зазначив, що голос системи був настільки схожий на його давню подругу, що це викликало у нього внутрішнє несприйняття.
Ризики та можливі загрози
Технологічні експерти попереджають: надто реалістичні голосові ШІ можуть спровокувати хвилю шахрайства. Голосовий фішинг уже зараз використовується зловмисниками, а такі інструменти, як Sesame, можуть зробити афери ще переконливішими.
Попри це, засновники компанії обіцяють продовжити вдосконалення технології. «Ми ще у процесі вдосконалення, але впевнені, що зможемо це покращити», — заявили у Sesame.
Підписуйтесь на наш Telegram-канал t.me/sudua та на Google Новини SUD.UA, а також на наш VIBER, сторінку у Facebook та в Instagram, щоб бути в курсі найважливіших подій.