Как Антиплагиат.ВУЗ ловит ИИ — разбор маркеров
Категория: ИИ-детектор · Время чтения: 9 минут
Кратко
ИИ-детектор Антиплагиат.ВУЗ работает на основе статистических и машинно-обучаемых методов (по косвенным признакам и публичным комментариям разработчиков), а не на простом поиске шаблонов. Он смотрит на структурные признаки текста, а не на отдельные слова. Поэтому замена «можно сказать» на «следует отметить» не помогает: детектор видит статистику, а не лексику.
7 признаков ИИ по версии Антиплагиат.ВУЗ
1. Burstiness — равномерность длины предложений
Самый главный маркер. У человека предложения разной длины: короткие, средние, длинные. У ИИ — все примерно одинаковые (15–22 слова), как по линейке.
Метрика: CV длины предложений (коэффициент вариации = стандартное отклонение / среднее).
- У человека CV ≈ 0,6–0,9.
- У ИИ CV ≈ 0,2–0,4.
Что делать: разбивайте длинные предложения, добавляйте короткие (5–8 слов) для контраста.
2. Цепочки существительных в родительном падеже
«Совокупность факторов формирования профессиональных компетенций выпускников образовательных организаций» — типичный признак ИИ и канцелярита.
ИИ любит наращивать существительные через родительный падеж — это даёт «академически» звучащую плотность без смысла.
Что делать: разбивайте через предлоги, глаголы, обороты «который». «Факторы, которые формируют компетенции у выпускников вузов».
3. Эхо-эффект между абзацами — повторы идей
ИИ часто говорит одно и то же разными словами в соседних абзацах. Одна мысль переформулируется снова и снова — без нового содержания.
Метрика: Jaccard-сходство между абзацами. Если соседние абзацы пересекаются на 55 %+ по знаменательным словам — это маркер.
Что делать: удалите повторяющиеся абзацы или поверните мысль в новую сторону.
4. Артефакты LLM-диалога
«Как большая языковая модель…», «По состоянию на мои знания на сентябрь 2024…», «Я не могу дать точный ответ, но…».
Если такое попало в работу — это мгновенный приговор.
Что делать: удалить.
5. Тавтологии и бессмысленные обороты
«Совокупность усилий компании», «методы и методологические подходы», «цель и способы достижения цели». Это лексические пустоты, на которых ИИ часто буксует.
Что делать: конкретизируйте. «Усилия компании по продвижению бренда», а не «совокупность усилий».
6. Однородная длина абзацев
Если все абзацы 5–6 строк, без длинных «полотен» и без коротких реплик — это маркер. У человека вариация выше.
Что делать: добавьте абзацы разной длины. Иногда — однострочный «удар».
7. GPT-вводные
«В целом», «В общих чертах», «Обобщая изложенное», «В рамках данного исследования», «Таким образом, можно заключить».
Эти обороты не сами по себе ИИ-маркеры — но их массовое присутствие в начале каждого абзаца — да.
Что делать: разнообразьте вводные. Иногда — без вводной вообще.
Чего детектор НЕ ловит
⚠️ Важно: antiplagiat.ru (другой сервис, не путать с Антиплагиат.ВУЗ) ловит простые шаблоны типа «можно сказать», «стоит отметить». А вот Антиплагиат.ВУЗ их игнорирует — он смотрит на структуру.
В нашей практике был кейс: ДР с 10 «можно сказать» в тексте получила 0 % ИИ в Антиплагиат.ВУЗ. Потому что у неё была хорошая burstiness и не было других структурных маркеров.
Как работают наши редакторы
При редактуре текста (свежий заказ или чистка от ИИ) наша команда работает по чек-листу из 7 признаков, описанных выше: проверяет вариативность длины предложений, цепочки родительных, повторы между абзацами, артефакты LLM-диалога. Это ручная работа, не автоматический «синонимайзер» — поэтому результат стабильно проходит контроль детектора.
Перед сдачей текст прогоняем через доступные сервисы проверки оригинальности и ИИ-детекции (выбираем те, что не публикуют текст в открытых индексах) и при необходимости докручиваем проблемные абзацы.
Если работа уже помечена как ИИ
Не паникуйте. Это решаемо без переписывания работы с нуля. Чистка от ИИ-маркера — отдельная услуга, от 1 500 ₽. Подробнее: Чистка от ИИ-детектора.