Как определить текст, написанный нейросетью

Есть новая офисная забава: взять абзац текста, скопировать его в детектор ИИ и гадать, написал это человек или ChatGPT. Кто-то делает ставки, кто-то паникует — дескать, скоро всех уволят. Но почти никто не спрашивает главное: а вообще зачем нам это распознавание ИИ-контента, и можно ли ему верить?

Почему всем вдруг понадобились детекторы

Сначала генеративный ИИ ворвался в копирайтинг и SEO. За ним — в образование и журналистику. Где текст, там и паранойя: «А вдруг это всё написал бот?» Так появились сервисы вроде Originality.ai, GPTZero, Writer.com и даже встроенные проверки в антиплагиатах.

Формально всё просто: вставил текст, получил проценты. Но за кулисами — статистические модели, которые ищут «неестественные» паттерны, вроде повторяющихся конструкций, ровных ритмов или гиперлогичной структуры.

Пример: преподаватель университета в США проверил эссе студента через GPTZero и получил 92% вероятности, что текст сгенерировал ИИ. Проблема: студент действительно писал сам — просто слишком структурированно.

Или кейс из агентства контент-маркетинга: заказчику не понравилось, что «текст явно написан ИИ». Проверили через Originality.ai — всего 18% вероятности генерации. То есть вывод был субъективным, и инструмент не подтвердил подозрения.

Проблема первая: детекторы ИИ — не детекторы правды

Никакой сервис не может со 100% уверенностью сказать, что текст сгенерировал ИИ. Потому что:

модели обучаются на старых версиях GPT, а новый ChatGPT пишет по-другому
человек может редактировать ИИ-текст так, что он становится «естественным»
наоборот, человек может писать скучно, ровно и предсказуемо — и его заподозрят

Парадокс: чем лучше пишет ИИ, тем сложнее его поймать. И наоборот — чем банальнее автор, тем выше шанс быть обвинённым в «генерации».

Проблема вторая: зачем мы вообще это делаем

Есть два сценария:

Наказать. Студент списал, автор схалтурил, SEOшник нажал на кнопку. Хотим разоблачить и пристыдить. Это понятно, но часто неэффективно: в реальности вместо наказания начинается игра в подгонку под детектор.
Оценить. Можно ли доверять тексту? Насколько он оригинален, интересен, живой? Тут всё сложнее: детектор ИИ не оценивает смысл, ироничность или точность. Он просто ловит шаблоны.

Так что распознавание ИИ-контента — это не детектор этики. Это просто ещё один фильтр, которому не стоит доверять без оглядки.

Проблема третья: ИИ против ИИ — это тупиковая гонка

С одной стороны — генеративный ИИ, который учится писать всё натуральнее. С другой — детектор ИИ, который учится его разоблачать. Кто побеждает? Тот, кто последним обновился.

Но есть и третий игрок — человек, которому нужно принять решение: доверять ли тексту. И вот тут важно не поддаваться фальшивой уверенности.

Проверка оригинальности текста с помощью детектора ИИ — это как оценка книги по весу. Да, есть корреляция. Но она ничего не говорит о содержании.

Какие инструменты вообще существуют

Если всё же хочется поиграть в анти-GPT, вот несколько популярных сервисов:

GPTZero — активно используется в образовании, показывает вероятность генерации и даёт разбивку по предложениям.
Originality.ai — фокус на контент-маркетинге и SEO, часто используется агентствами.
Writer.com AI Content Detector — простой, но поверхностный, подходит для быстрой оценки.
Copyleaks AI Content Detector — визуализация по уровням «человечности» текста.
Sapling.ai AI Detector — встраивается в рабочие процессы, есть API.

Важно: все они иногда ошибаются. У каждого — свой алгоритм и своя методика обучения.

Мини-гайд: как самому понять, кто автор текста

Вот простой чеклист, чтобы проверить текст без всяких сканеров:

Ритм и структура. ИИ часто пишет слишком ровно. Абзацы одного размера, структура предсказуемая. Человеческий текст чаще «прыгает» — где-то сбивчиво, где-то неожиданно.
Ирония и культурные отсылки. Пока что генеративный ИИ слабо держит контекст шутки, играет в универсальность и избегает культурных перекосов. Если в тексте есть внутренняя игра, двойные смыслы, локальные мемы — скорее всего, писал человек.
Ошибки. Парадоксально, но мелкие неточности, «неуклюжие» выражения или смена интонации — знак ручного труда. ИИ старается быть гладким и беспомощно звучит, если специально не «ломать» стиль.
Мета-комментарии. ИИ редко комментирует сам процесс написания. Если в тексте есть отступления вроде «я не уверен, как это объяснить, но…» — это хороший индикатор человечности.
Избыточная вежливость или шаблонные вводные. «В этой статье мы рассмотрим…» — любимое начало ИИ. Человеку это часто скучно и он начинает иначе.

Конечно, есть исключения. Но чем больше галочек в этом чеклисте — тем выше шанс, что перед вами не просто набор токенов, а текст, написанный (или хотя бы прожитый) человеком.

Три вывода, которые полезнее любых сканеров

Контекст важнее происхождения. Неважно, кто написал текст — вопрос в том, зачем он написан и какую задачу решает.
Редактура — лучшее доказательство человечности. Хорошо отредактированный ИИ-текст часто лучше сырого человеческого. И это нормально.
Умение читать важнее умения детектить. Настоящая проверка — это смысл, логика и структура. А не процент «искусственности».