Поиск будущего наступил: Как мы создали первый модуль для Generative SEO (llms.txt) под 1С-Битрикс
Мир SEO меняется. Если раньше главной задачей было понравиться краулерам Google и Яндекса, то сегодня пользователи всё чаще ищут ответы напрямую в нейросетях: ChatGPT, Perplexity AI, YandexGPT. Этот новый подход получил название GEO (Generative Engine Optimization).
Команда Automata.sale всегда держит руку на пульсе технологий. Как только сообщество начало обсуждать внедрение нового стандарта для нейросетей — файла llms.txt — мы поняли, что обязаны интегрировать этот инструмент в рунет.
Так родился наш новый продукт для Маркетплейса: Модуль “GEO: Генератор llms.txt” для 1С-Битрикс. В этом кейсе мы расскажем, зачем нужен этот файл, почему sitemap.xml больше не справляется, и как наше решение экономит часы рутинной работы.
Проблема: Нейросети не понимают ваш сайт
Алгоритмы старого поиска парсят весь код в поисках ключевых слов. Но агенты больших языковых моделей (LLM) работают иначе. Их главная валюта — это контекст и структура.
Когда ИИ-агент заходит на ваш сайт, он сталкивается с тремя проблемами:
- Информационный шум. Классический
sitemap.xmlвываливает на бота тысячи ссылок: технические дубли, пустые страницы пагинации, служебные фильтры. - Лимит токенов. Нейросети физически не могут прочитать весь ваш каталог “за один заход”. Им нужна самая ценная выжимка.
- Отсутствие иерархии. Бот не понимает, где у вас лежат статьи экспертов, где условия доставки, а где просто карточки с товарами “нет в наличии”.
В результате ваш бизнес может просто не попасть в сгенерированный ответ для потенциального клиента.
Решение: Стандарт llms.txt
Сообщество разработчиков создало элегантный ответ — файл llms.txt (подробности спецификации на llmstxt.org).
Это Markdown-файл, который кладется в корень сайта (как robots.txt). Он написан специально для машин и содержит короткую, строго структурированную “маршрутную карту”. Бот читает заголовки (H2) и сразу понимает: вот здесь лежит документация, тут — цены, а здесь — контакты. И ничего лишнего.
Но вручную поддерживать такой файл для динамического сайта на 1С-Битрикс — это ад. Поэтому в Automata.sale мы автоматизировали этот процесс.
Наш продукт: Умный генератор для Битрикса
Мы поставили перед собой амбициозную задачу: создать модуль, который не просто “собирает ссылки в txt”, а работает по принципам умного парсинга, отдавая нейросетям только качественные страницы.
Что умеет наш модуль eu.llmstxt:
1. Интеллектуальный маппинг
Вместо того чтобы тянуть всё подряд, администратор сайта сам выбирает, какие инфоблоки важны. Вы можете создать секцию ## Документация и привязать к ней статьи раздела “База знаний”, а в ## Каталог вывести только ссылки на главные разделы магазина (без сотен тысяч самих товаров, чтобы не перегружать LLM).
2. “Ленивая” валидация ссылок под капотом (Smart Checks)
Мы внедрили опциональный механизм HTTP-проверки. Прежде чем отдать ссылку нейросети, модуль проверяет:
- Возвращает ли страница
200 OK(никаких битых ссылок). - Совпадает ли
rel="canonical"(исключаем дубли). - Нет ли тега
<meta name="robots" content="noindex">. Итог: ИИ-боты видят идеальный сайт.
3. Защита от переполнения (Контроль лимитов)
Нейросети отказываются читать файлы, которые весят слишком много. В настройках нашего модуля вы задаете жесткий Максимальный размер файла (в байтах). Модуль автоматически остановит сборку контента, если лимит превышен, сохранив самую важную верхушку.
4. Гибкие фильтры
Под капотом работает мощная система Include/Exclude фильтрации по регулярным выражениям (RegEx). Вы можете в один клик отсечь все урлы, содержащие ?sort=, /clear/ или /search/.
5. Multi-site архитектура и Автопилот
Модуль из коробки поддерживает многосайтовость 1С-Битрикс: для каждого сайта вкладка со своими правилами. Работает на агентах — вы настраиваете его один раз, и llms.txt актуализируется сам.
Результат
Разработанный модуль уже готовится к публикации в Маркетплейсе 1С-Битрикс. Для нас в Automata.sale это не просто еще один плагин, а философский стейтмент: SEO-эпоха меняется, и бизнес должен помогать искусственному интеллекту, а не воевать с ним.
Хотите подготовить свой проект к генеративному поиску и привлекать трафик из ChatGPT-подобных систем? Свяжитесь с командой Automata.sale. Мы не просто пишем код, мы строим мосты между вашим бизнесом и технологиями завтрашнего дня.
Опубликовано командой разработки Automata.sale