Использует ли live-классификатор на landing-странице Varta реальную AI-модель или pre-computed подделку?

Реальный AI. Каждый paste идёт через Claude Sonnet (primary) с GPT-4.1-mini и Gemini как fallback-ами — тот же model stack, что обрабатывает решения модерации в 48 live Telegram-группах. Без canned responses, без cherry-picked примеров. Verdict который ты видишь — это то что бот сделал бы в твоей группе.

Насколько точен живой классификатор Varta?

По 48-сообщественной сети по состоянию на май 2026, false-positive rate измерен на 2,3% за последние 30 дней, по 10 активным языкам. Internal testing показывает примерно 94-97% точности по типичным категориям спама. Модель калибрована, не overconfident — она знает когда не знает и спрашивает админа в тех случаях.

Почему live-классификатор не показывает confidence-процент?

Потому что confidence-проценты путают non-technical админов. «87% confidence» читается как амбивалентное: удалит ли бот? Может? Вместо этого verdict mapping напрямую к четырём moderation-действиям — delete-and-ban, delete-only, ask-admin, или pass. Видеть verdict — это видеть что произошло бы в твоей группе, без перевода с вероятности в действие.

Проверяет ли live-классификатор сообщения против кросс-групповой базы банов?

Да, когда ты forward-ишь сообщение из другой группы, классификатор фиксирует username оригинального отправителя и cross-check-ает его против банов в 48 Varta-защищённых сообществах. Если этот автор был забанен в 2+ группах за последние 30 дней — увидишь дополнительный сигнал: «Я знаю этого автора — забанен в N моих групп этого месяца». Pure-text paste не имеют отправителя для проверки.

Вставь любой спам на нашу страницу. Мы классифицируем его наживо.

Каждая landing-страница бота модерации говорит одно и то же. «99% точность». «AI-powered». «Context-aware». Ты читаешь, веришь частично, и всё равно не знаешь переживёт ли этот бот контакт с твоей реальной группой.

Причина проста: ты не можешь протестировать бота модерации нормально без установки. А установка означает дать admin-разрешения чему-то что ты не доказал. Это trust gap впечённый в то как эти инструменты доставляются. Каждый админ с которым я говорила имеет ту же историю — пробуют три бота за шесть месяцев, каждый over-bans реального участника один раз, и они возвращаются модерировать руками.

Так что мы сделали что-то чего никто не делает. Мы поставили наш actual production AI-классификатор на нашу landing page. Насколько нам известно, Varta — первый Telegram trust-layer инструмент что позволяет запросить её production-модель без установки. Не recorded демо. Не три hand-picked примера. Тот же model что работает прямо сейчас по 48 live Telegram-сообществам, обрабатывает около 200 спам-сообщений в неделю (~30 в день). Ты вставляешь любое сообщение и получаешь реальный verdict за 3 секунды — плюс cross-community reputation сигналы на forwarded сообщениях, что есть trust-layer инфраструктурой которой не имеет ни один другой Telegram-бот модерации.

Попробуй — вставь что угодно

Прямо сейчас, ниже этого абзаца, есть input box. Вставь что-то. Что угодно. Мошеннический DM что ты получила. Сообщение которое keyword-бот ложно удалил из твоей группы. Обычный разговор. Пограничный случай который сложно оценить. AI скажет тебе что бы он сделал — delete, ban, delete-only, спросить админа, или оставить — и объяснит почему.

🧪 Live AI

Try Varta right here

Paste any suspicious message — I'll classify it in 3 seconds. Same AI running across 48 live Telegram communities.

or just paste (Ctrl+V) an image right here · 0 / 10000

Давай. Мы подождём. Потом вернись и дочитай остальное.

Почему это необычно

Почти каждый B2B-инструмент с AI-компонентом доставляет «демо» что на самом деле pre-computed подделка. Нажимаешь «Try it free», получаешь модал с тремя canned примерами, нажимаешь «Run analysis», и проигрывается результат вшитый в HTML. Выглядит как AI, но это просто маркетинг.

Мы понимаем почему люди так делают. Выставлять real AI endpoint публично страшно:

Стоимость. Каждый paste стоит мелкую долю цента в LLM-вызовах. В масштабе — это реальные деньги.
Злоупотребление. Кто-то может превратить твоё демо в бесплатный classification API — запустить 10,000 запросов и сжечь твой бюджет.
Смущение. Модель иногда ошибается. В production ты логируешь ошибку и итерируешь. На публичном демо — каждый неправильный ответ скриншот который кто-то твитнет.

Так что большинство компаний доставляет подделку. Мы доставили real. Вот как мы справились с каждым concern:

Стоимость: per-IP rate limit (3 классификации в час), request size caps (10 KB текста, 2 MB изображения), и daily budget ceiling с alerting. Worst case мы смоделировали ~$20/месяц даже при 100 unique testers в день. Если Varta конвертирует одного дополнительного клиента в неделю потому что демо его закрыло — демо отобьёт себя в 10 раз.

Злоупотребление: origin allowlist (запросы принимаем только с getvarta.com), Cloudflare Turnstile готовый к включению в момент если увидим что-то странное, и rate limit достаточно strict что scraping endpoint для бесплатной классификации медленнее хостинга собственной модели.

Смущение: мы принимаем это. Если классификатор ошибётся перед prospect — это данные. Альтернатива — прятаться за canned демо — означает что мы никогда не узнаем какие edge cases нас подставляют пока платный клиент не скажет в 2 ночи.

Что на самом деле происходит под капотом

Классификатор работает на Anthropic Claude Sonnet (primary) с OpenAI GPT-4 и Google Gemini как fallback. Тот же LLM stack что обрабатывает real moderation решения в production. System prompt просит structured JSON: verdict (спам / чисто / неуверенно), action (что бот сделал бы — delete, ban, delete-only, ask admin, или none), категория, 2-4 plain-language причин, и один «teaching moment» что объясняет почему keyword-бот вероятно дал бы неправильный ответ.

Если ты forward-ишь сообщение из другой группы вместо paste текста — классификатор также получает username оригинального отправителя. Мы cross-check-аем тот username против нашей базы банов по 48 группам. Если этот автор был забанен в 2+ наших группах за последние 30 дней, ты увидишь дополнительный буллет: «Я знаю этого автора — забанен в X моих групп этого месяца». Это сигнал который ни один другой бот модерации не может дать, потому что ни один не оперирует через shared cross-group intelligence сеть.

Для скриншотов мы используем vision-модель, что может parse-ить несколько сообщений из одного изображения — top-of-chat контекст, спам-сообщение посередине, легитимные ответы ниже — и дать verdict на каждое отдельно.

Почему нет confidence-процента

Большинство AI-демо показывают «87% confidence» рядом с verdict. Мы сначала так делали. Потом мы наблюдали как пять non-technical админов читают это, и каждая из них путалась. «То оно удалит? Или нет? Что значит 87% — модель 87% уверена, или оно удалит 87% времени?»

Мы это выкинули. Вместо того, verdict mapping напрямую к тому что бот реально сделал бы в твоей группе, простым языком:

🚨 СПАМ — я удалил бы и забанил. Confidence достаточно чтобы тригерить autonomous mode.
🗑 Спам — я удалил бы. Delete-only mode; ждать третий strike перед баном.
🤔 Пограничный — я бы спросил тебя. Cautious mode; нужна оценка админа.
✅ Чисто — я пропустил бы. Без действия.

Эти mapping-ятся one-to-one к четырём moderation-режимам которые можно настроить в /settings после добавления Varta. Увидеть verdict — это увидеть что произошло бы. Без перевода с вероятности в действие.

Что стоит тестировать

Большинство людей вставляет очевидный спам. Он flag-ируется. Окей. Но интересные тесты это:

Ложные срабатывания от keyword-ботов. Вставь сообщение которое keyword-бот ложно забанил. «Я видел бесплатную пиццу на офисной кухне». «Гарантированный no-cost семинар на следующей неделе». Реальные сообщения что содержат spam-trigger слова. Context-aware AI должен их пропустить. Если наш ошибочно flag-нет — скажи нам, мы используем твой paste для улучшения модели.

Пограничные ads. Кто-то в твоём dev-сообществе пишет «Я нанимаю senior Go-инженера, remote, $120k». Это спам? Зависит разрешён ли hiring в твоей группе. Вставь, смотри как AI это называет. Вероятно получишь «borderline — ask admin», что является честным ответом.

Твой конкретный язык. Украинский. Турецкий. Арабский. Хинди. Модель не натренирована на «Telegram spam patterns» — она натренирована на языке, и reason-ит о намерении. Вставь что-то на своём языке и смотри как reasoning приходит тоже на твоём языке.

Реальные скам-скриншоты. Загрузи скриншот (coming soon — или forward сообщение через DM бота пока). Vision-модель parse-нёт каждое видимое сообщение и скажет что сделала бы с каждым.

Что значит публично показать это

Две вещи на самом деле.

Первое — мы думаем что модель достаточно хорошая, что watching strangers тестировать её не смущает. По состоянию на май 2026, live сеть видит 2,3% false-positive rate измеренный в 10 активных языках. Не идеально, но калибровано. Модель знает когда не знает.

Второе — мы верим что лучшее что может сделать инструмент модерации — это быть testable прежде чем доверенный. Устанавливать бот в live группу и надеяться что он не nuke-нет твоего лучшего клиента — это ужасная trust-модель. Paste-to-classify заменяет это на: сначала протестируй модель, потом устанавливай только если она тебя впечатлила.

Если вставила 5 сообщений и verdicts плохие — не устанавливай Varta. Лучше скажи нам что мы неправильно поняли, и установи что-то другое. Мы хотим чтобы ты решала на основе evidence, не на основе landing-page заявления которое мы сделали о собственной точности.

И ещё одно

Когда ты кликнешь «Добавить Varta в свою группу» после того как увидела verdict — ссылка включает session hash. Этот hash позволяет нам связать «этот анонимный paste» с «этой bot install» с «этим первым catch спама в их группе» — полную conversion-воронку которую мы можем измерить и улучшить. Это та же философия: мы хотим измерять реальность, не угадывать.

Если вставила что-то и verdict тебя удивил (хорошо или плохо), мы бы хотели услышать об этом. Email [email protected] или DM бота напрямую. Реальный feedback от реальных админов — вот как это становится лучше.

Связанные статьи

Varta — это Telegram-бот модерации что учится правилам твоей группы и запускает тот же AI наживо — на этой странице, в твоей группе, везде. Добавь Varta бесплатно →