Чи варто використовувати Claude Fable 5 для модерації Telegram?
Anthropic випустив Claude Fable 5 і Claude Mythos 5 сьогодні — next generation інтелекту для найскладніших задач знань і кодінгу.
Якщо ти будуєш з LLM-ами — ймовірно вже почала читати release notes. Якщо будуєш AI-модерацію для Telegram-груп — у найближчі тижні зіткнешся зі спокусою: просто маршрутизуй кожне повідомлення через Fable 5. Модель більш capable. Класифікації будуть кращі. Готово.
Не роби цього. Ось математика і архітектура яку ми збудували натомість.
Claude Fable 5 і спокуса модерації
Спокуса structural. Кожен раз коли виходить більш capable frontier-модель, команди зі школи «кинь найкращу LLM на кожну задачу» отримують безкоштовний апгрейд — їхній існуючий pipeline викликає розумнішу модель і видає кращі класифікації. Виглядає як прогрес.
Для модерації спокуса гостріша. Спам у 2026 genuinely sophisticated — Cyrillic-Latin підміна, image-embedded URL, slow-funnel розмови через кілька повідомлень, admin-impersonator profile clones. Більш capable модель краще справляється з edge cases. Аргумент пише сам себе.
Проблема в тому що аргумент правильний щодо якості і неправильний щодо економіки. У масштабі Telegram-спільнот «кинь найкращу LLM на кожну задачу» стає per-month bill який ламає unit economics free-tier модерації.
Математика frontier на кожному повідомленні
Давай конкретно у production-realistic числах.
Типова Telegram-спільнота яку захищає Varta обробляє ~30-100 повідомлень на день у активні періоди. 48-спільнотна мережа обробляє ~2,000-5,000 повідомлень на день сумарно. Кожне повідомлення у середньому ~50-200 токенів після стрипу metadata.
Якщо запустити кожне повідомлення через frontier-модель — скажемо $15 за мільйон output-токенів за поточним Sonnet-class pricing, більше за справді top-tier — per-message вартість виходить ~$0.005-0.03. При 5,000 повідомлень на день — це $750-4,500 на місяць. По 48 захищених спільнотах.
Для free-tier moderation-інструменту ці числа не працюють. Або пасуєш cost на користувачів (зруйнувавши сенс «free until first spam catch»), або з'їдаєш сам (зруйнувавши сенс sustainable business). Економіка moderation-as-product вимагає щоб більшість повідомлень класифікувалися за частки цента кожне.
Тим часом — і це що naive-підхід пропускає — більшість повідомлень не потребують frontier-моделі для правильної класифікації. Чисті — очевидно чисті. Crude-спам — очевидно crude. Frontier видає той самий verdict як deterministic-правило, за orders of magnitude більше cost. Capability differential має значення лише на genuinely ambiguous cases.
Multi-stage pipeline
Що ми збудували натомість: чотири tier-и, escalating у capability і вартості. Кожен обробляє що може впевнено обробити і передає решту вгору.
| Tier | Що обробляє | Cost / повідом. | Частка трафіку |
|---|---|---|---|
| 1 | Deterministic-фільтри + account signals | ~$0 | 60–70% |
| 2 | Sender history + cross-group reputation | < $0.0001 | 15–20% |
| 3 | Small LLM triage (дешева модель) | ~$0.0005 | 10–15% |
| 4 | Frontier-модель (Claude Fable 5) | $0.01–0.05 | 3–7% |
| Середньозважено по всіх рівнях | < $0.001 | 100% | |
Tier 1 — Deterministic-фільтри і account signals. Ловить: blatant promotional content, known-bad URL patterns, акаунти що fail-ять platform-level checks. Confidence: high на cases де діє. Не намагається обробляти ambiguity — передає unclear-cases Tier 2.
Tier 2 — Sender history і cross-group reputation lookup. Ловить: known spammers по мережі, повторних offenders, акаунти flagged в інших Varta-захищених спільнотах. Confident classifications act, ambiguous ones escalate.
Tier 3 — Small-model triage. Ловить: routine spam patterns що потребують linguistic context але не heavy reasoning. Cyrillic-Latin підміна, basic phishing, low-effort cross-language scams. Confidence threshold калібрований — borderline outputs йдуть до Tier 4.
Tier 4 — Frontier-модель на hard cases. Ловить: genuinely ambiguous cases. Slow-funnel scams через кілька повідомлень. Sophisticated admin-impersonators. Borderline marketplace listings. Image-content що потребує vision + reasoning.
Для ~5,000 щоденних повідомлень мережі total LLM-bill у низьких сотнях доларів на місяць — не тисячах.
Якість moderation-рішень не падає бо escalation-логіка калібрована. Кожен tier знає коли невпевнений. 3-7% повідомлень що доходять до Tier 4 отримують ту саму frontier-capability що отримали б у naive «route everything to Fable 5» setup-і. 93-97% що resolve-аться на lower tiers — отримують ту саму правильну класифікацію за частку cost.
Де Claude Fable 5 реально належить у стеку
Сильні сторони Fable 5 — frontier-reasoning, складне contextual судження, multi-step inference — це саме те що Tier 4 потребує. Поставити її там — не downgrade; це правильне розміщення.
Конкретно ось де Fable 5 починається у Varta-стеку:
- Slow-funnel conversation detection через 3-7 повідомлень від одного sender (потребує reasoning через context-windows які малі моделі погано тримають).
- Admin-impersonator pattern detection де поведінка subtle (legitimate-seeming перші повідомлення, payment-script лише у DM після building rapport).
- Marketplace borderline listings де питання «це legitimate seller чи scam funnel» — потребує оцінки фото, цін, описів і account-context разом.
- Multilingual edge cases де повідомлення мішає мови, idiom-и не translate-яться чисто, intent треба inferr-ити з cultural context.
- Verdict-level reasoning для live-classifier demo на нашій landing-page — коли хтось paste-ить повідомлення щоб побачити як Varta обробила б, ми хочемо frontier-reasoning бо пояснення — це продукт.
Frontier-модель заробляє свій cost у тих випадках. Заробила б той самий cost у cases які малі tier-и теж класифікують правильно — і не заробила б нічого для користувача бо verdict не змінився б.
Ширший принцип для AI builders
Урок генералізується за межі модерації.
Інженерне питання не «яка найкраща модель для цієї задачі?». Це «яка найдешевша стадія може відповісти з достатньою впевненістю?»
Плюс corollary: «як я знатиму коли ця стадія невпевнена?»
Перше питання про capability matching. Друге про calibration. Більшість команд пропускають calibration-крок — обирають модель, запускають усе через неї, ship — і закінчують або burning runway на токенах що не покращують outcome, або capping AI usage у способи що шкодять продукту. Команди що будують routing-layer отримують обидва: ту саму якість, частку cost.
Для модерації конкретно ось приблизний паттерн якщо будуєш з нуля:
- Старт з deterministic filters для obvious cases — дешеві і обробляють більшість volume.
- Додай sender history layer що дозволяє known patterns short-circuit. Cross-group reputation, account-age signals, behavior history.
- Використовуй дешеву LLM як default classifier для ambiguous cases. Calibrate її знати коли невпевнена.
- Резервуй frontier-модель для найскладніших cases — тих де small-модель explicit сказала «не знаю» або повернула low confidence.
- Логуй усе. Спостерігай які повідомлення кожен tier обробляє. Adjust threshold-и коли бачиш misrouting.
Архітектура не новаторська. Це як production-системи будувалися десятиліттями — escalation з cheap heuristics до expensive computation. Що нове у 2026 — це що «expensive computation» tier — це frontier LLM, і cost asymmetry між tier-ами enormous.
Claude Fable 5 — інструмент. Sharp один. Використаний у правильному місці стека, робить hard cases tractable. Використаний у кожному місці — спалює гроші на cases які не потребували.
Якщо будуєш щось AI-driven у масштабі — multi-stage pipeline вартий твого engineering-часу. Заощадження compound month over month. Якість не падає. І коли Fable 6 вийде наступного року, твій стек absorb-не апгрейд на Tier 4 без balooning cost на Tier 1-3.
Це і є engineering-реальність за модерацією що коштує $0.001/повідомлення замість $0.01. Та сама інтелігентність. Маршрутизована туди де інтелігентність реально потрібна.
Пов'язані статті
Varta — це Trust Layer для Telegram: AI-модерація у 33 мовах, побудована на multi-stage pipeline що залишає frontier-моделі для hard cases. Безкоштовний forever тариф з базовим keyword-захистом; 5-денний full-AI тріал починається лише коли Varta зловить твій перший спам. Додай Varta безкоштовно →