Чи використовує live-класифікатор на landing-сторінці Varta реальну AI-модель чи pre-computed підробку?

Реальний AI. Кожен paste йде через Claude Sonnet (primary) з GPT-4.1-mini та Gemini як fallback-ами — той самий model stack, що обробляє рішення модерації у 48 live Telegram-групах. Без canned responses, без cherry-picked прикладів. Verdict який ти бачиш — це те що бот зробив би у твоїй групі.

Наскільки точний живий класифікатор Varta?

По 48-спільнотній мережі станом на травень 2026, false-positive rate виміряний на 2,3% за останні 30 днів, по 10 активних мовах. Internal testing показує приблизно 94-97% точності по типових категоріях спаму. Модель калібрована, не overconfident — вона знає коли не знає і питає адміна у тих випадках.

Чому live-класифікатор не показує confidence-процент?

Бо confidence-проценти плутають non-technical адмінів. «87% confidence» читається як амбівалентне: чи бот видалить? Може? Натомість verdict mapping напряму до чотирьох moderation-дій — delete-and-ban, delete-only, ask-admin, або pass. Бачити verdict — це бачити що відбулося б у твоїй групі, без перекладу з ймовірності у дію.

Чи перевіряє live-класифікатор повідомлення проти крос-групової бази банів?

Так, коли ти forward-иш повідомлення з іншої групи, класифікатор фіксує username оригінального відправника і cross-check-ає його проти банів у 48 Varta-захищених спільнотах. Якщо цей автор був забанений у 2+ групах за останні 30 днів — побачиш додатковий сигнал: «Я знаю цього автора — забанений у N моїх груп цього місяця». Pure-text paste не мають відправника для перевірки.

Встав будь-який спам на нашу сторінку. Ми класифікуємо його наживо.

Кожна landing-сторінка бота модерації каже одне й те ж. «99% точність». «AI-powered». «Context-aware». Ти читаєш, віриш частково, і все одно не знаєш чи переживе цей бот контакт з твоєю реальною групою.

Причина проста: ти не можеш протестувати бота модерації нормально без встановлення. А встановлення означає дати admin-дозволи чомусь що ти не довів. Це trust gap впечений у те як ці інструменти доставляються. Кожен адмін з ким я говорила має ту саму історію — пробують три боти за шість місяців, кожен over-bans реального учасника один раз, і вони повертаються модерувати руками.

Тож ми зробили щось чого ніхто не робить. Ми поставили наш actual production AI-класифікатор на нашу landing page. Наскільки нам відомо, Varta — перший Telegram trust-layer інструмент що дозволяє запитати її production-модель без встановлення. Не recorded демо. Не три hand-picked прикладів. Той самий model що працює прямо зараз по 48 live Telegram-спільнотах, обробляє близько 200 спам-повідомлень на тиждень (~30 на день). Ти встав будь-яке повідомлення і отримаєш реальний verdict за 3 секунди — плюс cross-community reputation сигнали на forwarded повідомленнях, що є trust-layer інфраструктурою якої не має жоден інший Telegram-бот модерації.

Спробуй — встав що завгодно

Прямо зараз, нижче цього параграфа, є input box. Встав щось. Будь-що. Шахрайський DM що ти отримала. Повідомлення яке keyword-бот хибно видалив з твоєї групи. Звичайна розмова. Граничний випадок який важко оцінити. AI скаже тобі що б він зробив — delete, ban, delete-only, спитати адміна, або залишити — і пояснить чому.

🧪 Live AI

Try Varta right here

Paste any suspicious message — I'll classify it in 3 seconds. Same AI running across 48 live Telegram communities.

or just paste (Ctrl+V) an image right here · 0 / 10000

Давай. Ми почекаємо. Потім повернись і дочитай решту.

Чому це незвичайно

Майже кожен B2B-інструмент з AI-компонентом доставляє «демо» що насправді pre-computed підробка. Натискаєш «Try it free», отримуєш модал з трьома canned прикладами, натискаєш «Run analysis», і програється результат вшитий у HTML. Виглядає як AI, але це просто маркетинг.

Ми розуміємо чому люди так роблять. Виставляти real AI endpoint публічно страшно:

Вартість. Кожен paste коштує дрібну частку цента у LLM-викликах. У масштабі — це реальні гроші.
Зловживання. Хтось може перетворити твоє демо у безкоштовний classification API — запустити 10,000 запитів і спалити твій бюджет.
Зніяковіння. Модель іноді помиляється. У production ти логуєш помилку та ітеруєш. На публічному демо — кожна неправильна відповідь скріншот який хтось твітне.

Тож більшість компаній доставляє підробку. Ми доставили real. Ось як ми впоралися з кожним concern:

Вартість: per-IP rate limit (3 класифікації на годину), request size caps (10 KB тексту, 2 MB зображення), і daily budget ceiling з alerting. Worst case ми змоделювали ~$20/місяць навіть при 100 unique testers на день. Якщо Varta конвертує одного додаткового клієнта на тиждень бо демо його закрило — демо відіб'є себе у 10 разів.

Зловживання: origin allowlist (запити приймаємо лише з getvarta.com), Cloudflare Turnstile готовий до увімкнення в момент якщо побачимо щось дивне, і rate limit достатньо strict що scraping endpoint для безкоштовної класифікації повільніший за хостинг власної моделі.

Зніяковіння: ми приймаємо це. Якщо класифікатор помилиться перед prospect — це дані. Альтернатива — ховатися за canned демо — означає що ми ніколи не дізнаємось які edge cases нас підставляють поки платний клієнт не скаже о 2 ночі.

Що насправді відбувається під капотом

Класифікатор працює на Anthropic Claude Sonnet (primary) з OpenAI GPT-4 та Google Gemini як fallback. Той самий LLM stack що обробляє real moderation рішення у production. System prompt просить structured JSON: verdict (спам / чисто / невпевнено), action (що бот зробив би — delete, ban, delete-only, ask admin, чи none), категорія, 2-4 plain-language причин, і один «teaching moment» що пояснює чому keyword-бот ймовірно дав би неправильну відповідь.

Якщо ти forward-иш повідомлення з іншої групи замість paste тексту — класифікатор також отримує username оригінального відправника. Ми cross-check-аємо той username проти нашої бази банів по 48 групах. Якщо цей автор був забанений у 2+ наших групах за останні 30 днів, ти побачиш додатковий буллет: «Я знаю цього автора — забанений у X моїх груп цього місяця». Це сигнал який жоден інший бот модерації не може дати, бо жоден не оперує через shared cross-group intelligence мережу.

Для скріншотів ми використовуємо vision-модель, що може parse-ити кілька повідомлень з одного зображення — top-of-chat контекст, спам-повідомлення посередині, легітимні відповіді нижче — і дати verdict на кожне окремо.

Чому немає confidence-процента

Більшість AI-демо показують «87% confidence» поряд з verdict. Ми спочатку так робили. Потім ми спостерігали як п'ять non-technical адмінів читають це, і кожна з них плуталася. «То воно видалить? Чи ні? Що означає 87% — модель 87% впевнена, чи воно видалить 87% часу?»

Ми це викинули. Замість того, verdict mapping напряму до того що бот реально зробив би у твоїй групі, простою мовою:

🚨 СПАМ — я видалив би і забанив. Confidence достатньо щоб тригерити autonomous mode.
🗑 Спам — я видалив би. Delete-only mode; чекати третій strike перед баном.
🤔 Граничний — я б спитав тебе. Cautious mode; потрібна оцінка адміна.
✅ Чисто — я пропустив би. Без дії.

Ці mapping-ються one-to-one до чотирьох moderation-режимів які можна налаштувати у /settings після додавання Varta. Побачити verdict — це побачити що відбулось би. Без перекладу з ймовірності у дію.

Що варто тестувати

Більшість людей встромляє очевидний спам. Він flag-ується. Окей. Але цікаві тести це:

Хибні спрацювання від keyword-ботів. Встав повідомлення яке keyword-бот хибно забанив. «Я бачив безкоштовну піцу на офісній кухні». «Гарантований no-cost семінар наступного вівторка». Реальні повідомлення що містять spam-trigger слова. Context-aware AI має їх пропустити. Якщо наш hibno flag-не — скажи нам, ми використаємо твій paste для покращення моделі.

Граничні ads. Хтось у твоєму dev-ком'юніті пише «Я наймаю senior Go-інженера, remote, $120k». Це спам? Залежить чи hiring дозволено у твоїй групі. Встав, дивись як AI це називає. Ймовірно отримаєш «borderline — ask admin», що є чесною відповіддю.

Твоя конкретна мова. Українська. Турецька. Арабська. Хінді. Модель не натренована на «Telegram spam patterns» — вона натренована на мові, і reason-ить про намір. Встав щось своєю мовою і дивись як reasoning приходить теж твоєю мовою.

Реальні скам-скріншоти. Завантаж скріншот (coming soon — або forward повідомлення через DM бота для зараз). Vision-модель parse-не кожне видиме повідомлення і скаже що зробила б з кожним.

Що значить публічно показати це

Дві речі насправді.

Перше — ми думаємо що модель достатньо хороша, що watching strangers тестувати її не зніяковілив. Станом на травень 2026, live мережа бачить 2,3% false-positive rate виміряний у 10 активних мовах. Не ідеально, але калібровано. Модель знає коли не знає.

Друге — ми віримо що найкраще що може зробити інструмент модерації — це бути testable перш ніж довірений. Встановлювати бот у live групу та сподіватися що він не nuke-не твого найкращого клієнта — це жахлива trust-модель. Paste-to-classify замінює це на: спочатку протестуй модель, потім встановлюй лише якщо вона тебе вразила.

Якщо встав 5 повідомлень і verdicts погані — не встановлюй Varta. Краще скажи нам що ми не так зрозуміли, і встанови щось інше. Ми хочемо щоб ти вирішувала на основі evidence, не на основі landing-page заяви яку ми зробили про власну точність.

І ще одне

Коли ти клацнеш «Додати Varta у свою групу» після того як побачила verdict — посилання включає session hash. Цей hash дозволяє нам зв'язати «цей анонімний paste» з «цим bot install» з «цим першим catch спаму у їх групі» — повну conversion-воронку яку ми можемо виміряти і покращити. Це та сама філософія: ми хочемо вимірювати реальність, не вгадувати.

Якщо встав щось і verdict тебе здивував (добре чи погано), ми б хотіли почути про це. Email [email protected] або DM бота напряму. Реальний feedback від реальних адмінів — ось як це стає кращим.

Пов'язані статті

Varta — це Telegram-бот модерації що вчиться правилам твоєї групи і запускає той самий AI наживо — на цій сторінці, у твоїй групі, всюди. Додай Varta безкоштовно →