Команда образовательной платформы Rumi обнаружила, что новые языковые модели от OpenAI - GPT-o3 и GPT-o4 mini - могут автоматически добавлять в сгенерированный текст специальные символы, которые визуально не отличаются от обычных пробелов, но имеют другой Unicode-код. Об этом говорится в публикации Rumi.
По наблюдениям исследователей, эти так называемые «отметки» появляются только в длинных ответах, в частности когда модель просят написать полноценное эссе. Чаще всего речь идет о символе Narrow No-Break Space (NNBSP, U+202F) - пробел, который не видно, но который имеет отличный цифровой код и может быть использован для выявления текста, созданного ИИ.
Такой практики не обнаружили в более старых версиях, в частности в GPT-4o. Схема размещения символов выглядит системной, а не случайной, что позволяет предположить преднамеренную реализацию функции. Впрочем, маркеры легко убрать - достаточно воспользоваться функцией «Найти и заменить» в текстовом редакторе, заменив специальные символы на обычные пробелы.
Отметки сохраняются при копировании текста в редакторы вроде Google Docs, поэтому их теоретически могут обнаружить преподаватели или работодатели, если текст был полностью сгенерирован в ChatGPT.
В Rumi считают, что такая «водяная метка» вряд ли станет надежным способом проверки авторства в долгосрочной перспективе. Вместо этого они призывают к процесс-ориентированному подходу в образовании: поощрять студентов фиксировать ход работы над заданием, сохранять черновики, демонстрировать развитие идей и сознательное использование ИИ-инструментов. Такой подход, по мнению команды, лучше будет способствовать академической добропорядочности и формированию ИИ-грамотности.
Подписывайтесь на наш Тelegram-канал t.me/sudua и на Google Новости SUD.UA, а также на наш VIBER, страницу в Facebook и в Instagram, чтобы быть в курсе самых важных событий.