Как работает tgadsspy: технический разбор классификатора и пайплайна
Техническая документация по пайплайну tgadsspy — интеграция API gramesh, архитектура нишевой классификации (regex + веса), трёхступенчатый гео-классификатор, SHA256 контент-адресуемое хранилище медиа и агрегационное кэширование. Для разработчиков, исследователей и compliance-команд.
Назначение и аудитория#
Этот документ — технический разбор того, как Telegram Ads Spy собирает, классифицирует и предоставляет данные рекламы Telegram. Дополняет обзор на /about деталями уровня реализации.
Основная аудитория: разработчики, строящие на публичном API; исследователи, которым нужно понять провенанс данных для цитирования; compliance-команды, оценивающие OSINT-методологию системы.
1. Источник данных: gramesh API#
Все рекламные данные в Telegram Ads Spy поступают из единственного источника: gramesh HTTP API по адресу api.wall.systems/gramesh. gramesh — это прокси/агрегационный слой над MTProto-протоколом Telegram.
Используемые эндпойнты#
POST /channels.getSponsored— получение спонсированных сообщений для каналаPOST /channels.getInfo— резолвинг метаданных каналаPOST /channels.getSimilar— BFS-спайдер по графу схожих каналовPOST /contacts.search— обнаружение новых каналов по поисковому запросу
2. Нишевая классификация#
Каждый AdCreative получает одну из ~25 ниш: sports-betting, crypto-exchange, defi, forex-trading, p2p-crypto, gambling, edtech, real-estate и другие. Классификация выполняется в lib/niche.ts через regex-правила по заголовку + тексту + CTA-URL.
Архитектура: система весов — сильные попадания (например, «1xBet» → sports-betting) дают 3–5 очков; слабые — 1–2. Побеждает ниша с наибольшим суммарным счётом.
3. Гео-классификация#
Трёхступенчатый пайплайн:
- Язык канала → маппинг
langToGeo()(ru → RU/UA/KZ/BY, ar → SA/EG/AE/…) - CTA URL → извлечение TLD (.de → DE, .com.br → BR)
- Текст креатива → паттерны валют, названия городов, регуляторные ссылки
4. Зеркалирование медиа#
gramesh возвращает подписанные URL с TTL 1 час. Mirror-cron (Telegram Ads Spy-media-mirror, каждые 5 мин):
- Скачивает медиафайл
- Вычисляет SHA256-хэш
- Сохраняет в
/var/www/tgadsspy-media/<префикс>/<хэш>.<расш.> - Обновляет
AdCreative.mediaUrl→ постоянный URL/m/<хэш>.<расш.>
Справочник методологии#
Полная документация методологии: tgadsspy.com · API: /api/v1/ads. CC-BY-4.0.
Данные в реальном времени через Telegram Ads Spy
Telegram Ads Spy индексирует все спонсируемые объявления Telegram в реальном времени. Найденные креативы можно просматривать на tgadsspy.com/ads или экспортировать через открытый API /api/v1/ads.
Доступ к данным: tgadsspy.com · CC-BY-4.0.
Also available in:
Cite this article
tgadsspy research (2026). Как работает tgadsspy: технический разбор классификатора и пайплайна. tgadsspy.com. Retrieved from https://tgadsspy.com/blog/ru-tgadsspy-metodologiya-klassifikator-2026
Licensed CC-BY-4.0 — reuse allowed including commercial, attribution required.