Lumen Work
← Все статьи

Как Антиплагиат.ВУЗ ловит ИИ — разбор маркеров

Категория: ИИ-детектор · Время чтения: 9 минут


Кратко

ИИ-детектор Антиплагиат.ВУЗ работает на основе статистических и машинно-обучаемых методов (по косвенным признакам и публичным комментариям разработчиков), а не на простом поиске шаблонов. Он смотрит на структурные признаки текста, а не на отдельные слова. Поэтому замена «можно сказать» на «следует отметить» не помогает: детектор видит статистику, а не лексику.

7 признаков ИИ по версии Антиплагиат.ВУЗ

1. Burstiness — равномерность длины предложений

Самый главный маркер. У человека предложения разной длины: короткие, средние, длинные. У ИИ — все примерно одинаковые (15–22 слова), как по линейке.

Метрика: CV длины предложений (коэффициент вариации = стандартное отклонение / среднее).

  • У человека CV ≈ 0,6–0,9.
  • У ИИ CV ≈ 0,2–0,4.

Что делать: разбивайте длинные предложения, добавляйте короткие (5–8 слов) для контраста.

2. Цепочки существительных в родительном падеже

«Совокупность факторов формирования профессиональных компетенций выпускников образовательных организаций» — типичный признак ИИ и канцелярита.

ИИ любит наращивать существительные через родительный падеж — это даёт «академически» звучащую плотность без смысла.

Что делать: разбивайте через предлоги, глаголы, обороты «который». «Факторы, которые формируют компетенции у выпускников вузов».

3. Эхо-эффект между абзацами — повторы идей

ИИ часто говорит одно и то же разными словами в соседних абзацах. Одна мысль переформулируется снова и снова — без нового содержания.

Метрика: Jaccard-сходство между абзацами. Если соседние абзацы пересекаются на 55 %+ по знаменательным словам — это маркер.

Что делать: удалите повторяющиеся абзацы или поверните мысль в новую сторону.

4. Артефакты LLM-диалога

«Как большая языковая модель…», «По состоянию на мои знания на сентябрь 2024…», «Я не могу дать точный ответ, но…».

Если такое попало в работу — это мгновенный приговор.

Что делать: удалить.

5. Тавтологии и бессмысленные обороты

«Совокупность усилий компании», «методы и методологические подходы», «цель и способы достижения цели». Это лексические пустоты, на которых ИИ часто буксует.

Что делать: конкретизируйте. «Усилия компании по продвижению бренда», а не «совокупность усилий».

6. Однородная длина абзацев

Если все абзацы 5–6 строк, без длинных «полотен» и без коротких реплик — это маркер. У человека вариация выше.

Что делать: добавьте абзацы разной длины. Иногда — однострочный «удар».

7. GPT-вводные

«В целом», «В общих чертах», «Обобщая изложенное», «В рамках данного исследования», «Таким образом, можно заключить».

Эти обороты не сами по себе ИИ-маркеры — но их массовое присутствие в начале каждого абзаца — да.

Что делать: разнообразьте вводные. Иногда — без вводной вообще.

Чего детектор НЕ ловит

⚠️ Важно: antiplagiat.ru (другой сервис, не путать с Антиплагиат.ВУЗ) ловит простые шаблоны типа «можно сказать», «стоит отметить». А вот Антиплагиат.ВУЗ их игнорирует — он смотрит на структуру.

В нашей практике был кейс: ДР с 10 «можно сказать» в тексте получила 0 % ИИ в Антиплагиат.ВУЗ. Потому что у неё была хорошая burstiness и не было других структурных маркеров.

Как работают наши редакторы

При редактуре текста (свежий заказ или чистка от ИИ) наша команда работает по чек-листу из 7 признаков, описанных выше: проверяет вариативность длины предложений, цепочки родительных, повторы между абзацами, артефакты LLM-диалога. Это ручная работа, не автоматический «синонимайзер» — поэтому результат стабильно проходит контроль детектора.

Перед сдачей текст прогоняем через доступные сервисы проверки оригинальности и ИИ-детекции (выбираем те, что не публикуют текст в открытых индексах) и при необходимости докручиваем проблемные абзацы.

Если работа уже помечена как ИИ

Не паникуйте. Это решаемо без переписывания работы с нуля. Чистка от ИИ-маркера — отдельная услуга, от 1 500 ₽. Подробнее: Чистка от ИИ-детектора.

📩 Написать в Telegram → @lumen_work33