Встав будь-який спам на нашу сторінку. Ми класифікуємо його наживо.
Кожна landing-сторінка бота модерації каже одне й те ж. «99% точність». «AI-powered». «Context-aware». Ти читаєш, віриш частково, і все одно не знаєш чи переживе цей бот контакт з твоєю реальною групою.
Причина проста: ти не можеш протестувати бота модерації нормально без встановлення. А встановлення означає дати admin-дозволи чомусь що ти не довів. Це trust gap впечений у те як ці інструменти доставляються. Кожен адмін з ким я говорила має ту саму історію — пробують три боти за шість місяців, кожен over-bans реального учасника один раз, і вони повертаються модерувати руками.
Тож ми зробили щось чого ніхто не робить. Ми поставили наш actual production AI-класифікатор на нашу landing page. Наскільки нам відомо, Varta — перший Telegram trust-layer інструмент що дозволяє запитати її production-модель без встановлення. Не recorded демо. Не три hand-picked прикладів. Той самий model що працює прямо зараз по 48 live Telegram-спільнотах, обробляє близько 200 спам-повідомлень на тиждень (~30 на день). Ти встав будь-яке повідомлення і отримаєш реальний verdict за 3 секунди — плюс cross-community reputation сигнали на forwarded повідомленнях, що є trust-layer інфраструктурою якої не має жоден інший Telegram-бот модерації.
Спробуй — встав що завгодно
Прямо зараз, нижче цього параграфа, є input box. Встав щось. Будь-що. Шахрайський DM що ти отримала. Повідомлення яке keyword-бот хибно видалив з твоєї групи. Звичайна розмова. Граничний випадок який важко оцінити. AI скаже тобі що б він зробив — delete, ban, delete-only, спитати адміна, або залишити — і пояснить чому.
Try Varta right here
Paste any suspicious message — I'll classify it in 3 seconds. Same AI running across 48 live Telegram communities.
Давай. Ми почекаємо. Потім повернись і дочитай решту.
Чому це незвичайно
Майже кожен B2B-інструмент з AI-компонентом доставляє «демо» що насправді pre-computed підробка. Натискаєш «Try it free», отримуєш модал з трьома canned прикладами, натискаєш «Run analysis», і програється результат вшитий у HTML. Виглядає як AI, але це просто маркетинг.
Ми розуміємо чому люди так роблять. Виставляти real AI endpoint публічно страшно:
- Вартість. Кожен paste коштує дрібну частку цента у LLM-викликах. У масштабі — це реальні гроші.
- Зловживання. Хтось може перетворити твоє демо у безкоштовний classification API — запустити 10,000 запитів і спалити твій бюджет.
- Зніяковіння. Модель іноді помиляється. У production ти логуєш помилку та ітеруєш. На публічному демо — кожна неправильна відповідь скріншот який хтось твітне.
Тож більшість компаній доставляє підробку. Ми доставили real. Ось як ми впоралися з кожним concern:
Вартість: per-IP rate limit (3 класифікації на годину), request size caps (10 KB тексту, 2 MB зображення), і daily budget ceiling з alerting. Worst case ми змоделювали ~$20/місяць навіть при 100 unique testers на день. Якщо Varta конвертує одного додаткового клієнта на тиждень бо демо його закрило — демо відіб'є себе у 10 разів.
Зловживання: origin allowlist (запити приймаємо лише з getvarta.com), Cloudflare Turnstile готовий до увімкнення в момент якщо побачимо щось дивне, і rate limit достатньо strict що scraping endpoint для безкоштовної класифікації повільніший за хостинг власної моделі.
Зніяковіння: ми приймаємо це. Якщо класифікатор помилиться перед prospect — це дані. Альтернатива — ховатися за canned демо — означає що ми ніколи не дізнаємось які edge cases нас підставляють поки платний клієнт не скаже о 2 ночі.
Що насправді відбувається під капотом
Класифікатор працює на Anthropic Claude Sonnet (primary) з OpenAI GPT-4 та Google Gemini як fallback. Той самий LLM stack що обробляє real moderation рішення у production. System prompt просить structured JSON: verdict (спам / чисто / невпевнено), action (що бот зробив би — delete, ban, delete-only, ask admin, чи none), категорія, 2-4 plain-language причин, і один «teaching moment» що пояснює чому keyword-бот ймовірно дав би неправильну відповідь.
Якщо ти forward-иш повідомлення з іншої групи замість paste тексту — класифікатор також отримує username оригінального відправника. Ми cross-check-аємо той username проти нашої бази банів по 48 групах. Якщо цей автор був забанений у 2+ наших групах за останні 30 днів, ти побачиш додатковий буллет: «Я знаю цього автора — забанений у X моїх груп цього місяця». Це сигнал який жоден інший бот модерації не може дати, бо жоден не оперує через shared cross-group intelligence мережу.
Для скріншотів ми використовуємо vision-модель, що може parse-ити кілька повідомлень з одного зображення — top-of-chat контекст, спам-повідомлення посередині, легітимні відповіді нижче — і дати verdict на кожне окремо.
Чому немає confidence-процента
Більшість AI-демо показують «87% confidence» поряд з verdict. Ми спочатку так робили. Потім ми спостерігали як п'ять non-technical адмінів читають це, і кожна з них плуталася. «То воно видалить? Чи ні? Що означає 87% — модель 87% впевнена, чи воно видалить 87% часу?»
Ми це викинули. Замість того, verdict mapping напряму до того що бот реально зробив би у твоїй групі, простою мовою:
- 🚨 СПАМ — я видалив би і забанив. Confidence достатньо щоб тригерити autonomous mode.
- 🗑 Спам — я видалив би. Delete-only mode; чекати третій strike перед баном.
- 🤔 Граничний — я б спитав тебе. Cautious mode; потрібна оцінка адміна.
- ✅ Чисто — я пропустив би. Без дії.
Ці mapping-ються one-to-one до чотирьох moderation-режимів які можна налаштувати у /settings після додавання Varta. Побачити verdict — це побачити що відбулось би. Без перекладу з ймовірності у дію.
Що варто тестувати
Більшість людей встромляє очевидний спам. Він flag-ується. Окей. Але цікаві тести це:
Хибні спрацювання від keyword-ботів. Встав повідомлення яке keyword-бот хибно забанив. «Я бачив безкоштовну піцу на офісній кухні». «Гарантований no-cost семінар наступного вівторка». Реальні повідомлення що містять spam-trigger слова. Context-aware AI має їх пропустити. Якщо наш hibno flag-не — скажи нам, ми використаємо твій paste для покращення моделі.
Граничні ads. Хтось у твоєму dev-ком'юніті пише «Я наймаю senior Go-інженера, remote, $120k». Це спам? Залежить чи hiring дозволено у твоїй групі. Встав, дивись як AI це називає. Ймовірно отримаєш «borderline — ask admin», що є чесною відповіддю.
Твоя конкретна мова. Українська. Турецька. Арабська. Хінді. Модель не натренована на «Telegram spam patterns» — вона натренована на мові, і reason-ить про намір. Встав щось своєю мовою і дивись як reasoning приходить теж твоєю мовою.
Реальні скам-скріншоти. Завантаж скріншот (coming soon — або forward повідомлення через DM бота для зараз). Vision-модель parse-не кожне видиме повідомлення і скаже що зробила б з кожним.
Що значить публічно показати це
Дві речі насправді.
Перше — ми думаємо що модель достатньо хороша, що watching strangers тестувати її не зніяковілив. Станом на травень 2026, live мережа бачить 2,3% false-positive rate виміряний у 10 активних мовах. Не ідеально, але калібровано. Модель знає коли не знає.
Друге — ми віримо що найкраще що може зробити інструмент модерації — це бути testable перш ніж довірений. Встановлювати бот у live групу та сподіватися що він не nuke-не твого найкращого клієнта — це жахлива trust-модель. Paste-to-classify замінює це на: спочатку протестуй модель, потім встановлюй лише якщо вона тебе вразила.
Якщо встав 5 повідомлень і verdicts погані — не встановлюй Varta. Краще скажи нам що ми не так зрозуміли, і встанови щось інше. Ми хочемо щоб ти вирішувала на основі evidence, не на основі landing-page заяви яку ми зробили про власну точність.
І ще одне
Коли ти клацнеш «Додати Varta у свою групу» після того як побачила verdict — посилання включає session hash. Цей hash дозволяє нам зв'язати «цей анонімний paste» з «цим bot install» з «цим першим catch спаму у їх групі» — повну conversion-воронку яку ми можемо виміряти і покращити. Це та сама філософія: ми хочемо вимірювати реальність, не вгадувати.
Якщо встав щось і verdict тебе здивував (добре чи погано), ми б хотіли почути про це. Email [email protected] або DM бота напряму. Реальний feedback від реальних адмінів — ось як це стає кращим.
Пов'язані статті
Varta — це Telegram-бот модерації що вчиться правилам твоєї групи і запускає той самий AI наживо — на цій сторінці, у твоїй групі, всюди. Додай Varta безкоштовно →