|
Professor Seleznov
|
Это не просто статья на Хабре. Это AI-сгенерированная статья на Хабре. Ха! Попались? Меня зовут Ксения Иванчикова, я развиваю медиа Generation AI. Еще год назад я писала умные промпты для ChatGPT в надежде получить глубокий и качественный контент — получалось так себе. Недавно я навайбкодила пайплайн из пяти AI-агентов: они берут 20-минутную запись доклада с YouTube, выдают готовый кейс и верстают контент на WordPress. Рассказываю про опыт создания контент-машинки, которая не делает нейрослоп.
 Контекст: кейсы про внедрение AI В медиаGeneration AI мы собираем бизнес-кейсы: как российские компании используют генеративный AI в процессах, с какими трудностями сталкиваются при внедрении и что у них уже получается. Сейчас у нас опубликовано больше 60 кейсов — от банков и ритейла до HRTech. Но есть проблема: кейсы быстро устаревают. Разработчики моделей выкатывают обновления чуть ли не каждую неделю, команды вынуждены адаптироваться и менять подходы. То, как решали задачу в начале 2025 года, сегодня будет не актуальным. Один из источников, откуда мы берем кейсы — выступления спикеров на Conversations, нашей конференции про генеративный AI. В среднем это 30-50 докладов за раз. Чтобы детали не устарели, нам нужно взять все доклады и оперативно готовить материалы на сайт. Два подхода к написанию кейсов и их эволюция Подход 1: «Скорми расшифровку и молись» Первый подход был наивный. Я брала уже опубликованный кейс, скармливала нейронке и просила проанализировать структуру и стиль. Потом давала расшифровку нового выступления и просила написать по образцу. Результат выглядел прилично, но была проблема с галлюцинациями: иногда модель добавляла факты, порой некорректно описывала какой-то процесс. К тому же по пути терялись метрики из доклада, а цифры в кейсах важны. В итоге я тратила 2-3 часа на перепроверку каждого текста и цифры по видео. Это практически то же время, что написать с нуля. Подход 2: Подробные правила + петля обратной связи Потом я перешла на Claude Code и поняла, что дело не в промптах. Я вообще не верю в промпты в том смысле, в котором о них обычно говорят — типа «напиши магическую фразу и нейронка сделает идеально». У меня это так не работает. То, что работает — подробные правила и фидбек-луп. Я описала в markdown-файлах все, что знаю про хороший кейс: какая структура, какой стиль, какие слова нельзя использовать, как работать с цитатами, как оформлять метрики. Получилось пару сотен строк. Это скорее редакционная политика в формате, который понимает AI. Параллельно выстроила процесс обучения. Я читаю текст, который сгенерировал Claude Code. Вижу, что не так — допустим, слишком общие формулировки или неуместный акцентный блок. Даю фидбек: «Здесь слишком абстрактно, нужна конкретная цифра» или «Этот блок не несет инсайта, убери». А потом прошу Claude Code проанализировать всю нашу сессию, вычленить мои замечания и сформулировать из них правила. Эти правила добавляются в систему, в следующий раз агент уже их учитывает. То есть это живая система, которая учится на каждом кейсе. Каждый мой фидбек превращается в правило, и со временем качество растет. С таким подходом я стала делать кейсы за полтора-два часа вместо четырех-пяти. Текст получался нормальный, после ревью — готовый к публикации. Конечно, я что-то все еще правлю руками, но это гораздо меньший объем, чем при классической работе с ChatGPT. Проблема: приходится ждать дизайнеров Итак, я научилась с Claude Code готовить кейс за пару часов. Дальше — мне нужно было поставить задачу дизайнеру в Jira и ждать, когда они сверстают текст на WordPress. Дизайнеры загружены, у них свои приоритеты. В итоге я вынуждена ждать неделю, пока будет готова верстка. Я ускорила свою часть работы по написанию текста кейса, но уперлась в то, что от меня не зависит. И тогда у меня появилась идея: а что если замкнуть весь цикл? Не просто сгенерировать текст, а прокинуть его на WordPress — с версткой, иллюстрациями из презентации и заложенными SEO-маркерами. Чтобы на выходе был готовый черновик на сайте, а я подключалась только на финальное ревью. На внутреннем хакатоне Just AI — мероприятии, где мы с коллегами придумывали и вайбкодили разные проекты — я за это и взялась.

Чтобы вы понимали всю боль: на WordPress почти каждое предложение нужно вносить в отдельную строку Что получилось: пять агентов, один конвейер Пайплайн повторяет то, что я делала руками, но разбит на пять этапов — каждый выполняет отдельный AI-агент со своими правилами и своей задачей. Я работаю через Claude Code с обычной подпиской. Архитектуру пайплайна мы проектировали вместе с тем же Claude Code — я объясняла логику своей работы, а он предлагал, как разбить на этапы и что каждый агент должен делать. Вот как выглядит конвейер: YouTube URL + PDF slides │ ▼ ┌─────────────┐ │ Transcriber │ →transcript.md └──────┬──────┘ ▼ ┌─────────────┐ │ Analyst │ → facts_extracted.md │ + vision │ slides_analysis.md │ │ company_metadata.md └──────┬──────┘ ▼ ┌─────────────┐ │ Writer │ → case_draft_v1.md └──────┬──────┘ ▼ ┌─────────────┐ │ Editor │ → validation_report.md │ │ [company]_READY.md └──────┬──────┘ ▼ 👤 Human review ▼ ┌─────────────┐ │ Publisher │ → WordPress draft └──────┬──────┘ ▼ Готовый кейс на сайте Стек
| Компонент |
Зачем |
| Claude Code (подписка) |
Основной инструмент — агенты, правила, дебаг |
| Deepgram API / YouTube captions |
Перевод видео в текст |
| PyMuPDF |
Вытаскивание слайдов из PDF в картинки |
| WordPress REST API + ACF Flexible Content |
Публикация постов с версткой |
| Rank Math |
SEO-метаданные |
| FastAPI |
Веб-интерфейс, чтобы запускать из браузера |
Отдельная история — WordPress. У нас на сайте кейсы верстаются через ACF Flexible Content — плагин, который позволяет собирать страницу из разных типов блоков: текст, колонки с метриками, пошаговые процессы, акцентные вставки, иллюстрации. Разработчики помогли настроить блоки и подробно описать их структуру. Как работает каждый агент Transcriber: расшифровка видео Первый агент берет YouTube-ссылку и превращает видео в текст. Есть два варианта: бесплатные субтитры YouTube (быстро, но качество зависит от звука на записи) и Deepgram — точнее, с разделением по спикерам. На выходе — файл transcript.md. Analyst: факты, слайды, контекст Analyst — этап, на котором сырой материал превращается в структурированные данные. Агент читает транскрипт и вытаскивает факты, метрики, цитаты, технические детали. Если приложена презентация — смотрит на слайды через vision и для каждого определяет, что изображено и в какой раздел кейса это поставить. Отдельно через веб-поиск собирает контекст о компании: масштаб бизнеса, рынок, количество сотрудников. Здесь же происходит первая проверка на адекватность. Автоматическая транскрипция путает слова, особенно названия продуктов и термины. Analyst сверяет непонятные слова с контекстом и подбирает правильный вариант по смыслу. На выходе получаются три файла: факты, анализ слайдов, метаданные компании. Writer: кейс по правилам Writer получает структурированные данные от Analyst, стайл-гайд и референсный кейс для калибровки тона. Еще он просматривает те самые правила, которые выросли из фидбек-лупа. Здесь стоит подробнее рассказать про контентную часть, потому что в ней — основная ценность пайплайна. Хороший кейс — не пересказ выступления спикера на конференции, а полноценная история с проблемой, решением, трудностями и результатами. Это нужно рассказать так, чтобы читатель с похожей задачей нашел для себя практическую пользу. Writer также расставляет по тексту блоки для WordPress-верстки — колонки с метриками, пошаговые процессы, акцентные вставки. Они потом автоматически превращаются в верстку на сайте:

Описание ACF-блоков для верстки На выходе получается черновик кейса. Editor: проверка и чистка Editor — агент, котороый проверяет факты по первоисточнику и вычищает текст. Фактчекинг. Editor берет каждое число и утверждение из черновика и ищет подтверждение в транскрипте и презентации, которую я загружаю в PDF-формате. Формирует отчет — что подтверждено, что сомнительно, что нужно убрать. Чистка стиля. Как бы подробно ни были прописаны правила, Writer иногда все равно иногда вставляет нейросетевые штампы. Editor вычищает слова в духе «стоит отметить», «в условиях растущей конкуренции» и прочий мусор, который я сама бы удалила при вычитке. Проверка блоков. Смотрит, чтобы в колонках с метриками стояли реальные числа, а не абстракции. Чтобы одна метрика не повторялась в трех местах и не было 10 иллюстраций подряд без какой-то логики.

Пример, как выглядит сверстанный блок с метриками На выходе получаем готовый к публикации файл. Publisher: отправка в WordPress Publisher берет финальный файл, конвертирует markdown-блоки в ACF-верстку, загружает иллюстрации из презентации, расставляет теги и SEO-метаданные. Пост создается как черновик — я открываю WordPress, проверяю, как все выглядит, и публикую. Сложности: транскрипция, верстка, галлюцинации Транскрипция и имена собственные Автоматическая транскрипция неплохо справляется с обычной речью, но спотыкается на именах собственных, названиях продуктов и терминах. Analyst спасает ситуацию: он знает, о какой компании и о каком продукте идет речь, поэтому может восстановить правильное написание из контекста. Но иногда все равно проскакивает — и тогда это ловит Editor на этапе фактчекинга или я на ревью. Верстка: «сделай красиво» не работает Сказать агенту «сделай красиво» — бесполезно. ACF Flexible Content — это 10 типов блоков, у каждого свои обязательные поля и ограничения. Сказать «вставь колонку с метриками» недостаточно — агент должен точно знать формат. Мы с разработчиками описали каждый блок подробно, и даже после этого Writer иногда творит странное: ставит в заголовок колонки текст вроде «Отдел качества» вместо числа, засовывает в акцентный блок предложение без инсайта, выстраивает пять иллюстраций подряд. Здесь спасает Editor — он проверяет блоки по правилам и подсвечивает нарушения. Результаты
| Этап |
Раньше |
Сейчас |
| Транскрипция |
1-2 часа (смотрю видео, выписываю) |
6-10 мин |
| Анализ фактов |
1 час |
3-5 мин |
| Написание |
3-4 часа (или 1,5 с Claude Code) |
5-8 мин |
| Редактура и фактчек |
1-2 часа |
5-10 мин |
| Верстка и публикация |
5-7 дней (ждала дизайнера) |
2-3 мин |
| Итого |
~1,5-2 недели |
2 часа с учетом ручной проверки результата |
Главная победа — даже не в часах. Раньше готовый текст лежал неделю, пока до него дойдет дизайнер. Теперь пайплайн сам создает сверстанный черновик в WordPress, и я могу опубликовать кейс в тот же день, когда его написала (после согласования с экспертом, конечно). Весь пайплайн работает на подписке Claude Code. Можно ли собрать подобное на других инструментах? Наверное, но я работала с тем, что знаю. Парочка моих инсайтов Самое ценное в пайплайне — не код, а экспертиза и архетиктура. Я потратила десятки часов на формализацию того, что такое хороший кейс. Какие слова нельзя, какие блоки допустимы, как проверять факты, что отличает пересказ от полезного материала. Это редакторский опыт, превращенный в правила, которые AI может исполнять. Без этой экспертизы пайплайн выдавал бы красивый, но бесполезный текст. Нейросети все еще не пишут супер тексты.У меня получилось достичь отличного качества на кейсах. Думаю, что дело в формате: кейсы — очень структурный контент. К тому же фактуру не нужно было искать заново, мы брали расшифровку реального опыта эксперта, а не собирали рандомные факты из интернета. В случае информационной статьи чаще всего получится пересказ 10 первых ссылок в выдаче. Поэтому эксперт и реальный опыт в контенте очень важны. Если интересно, как выглядят кейсы про внедрение AI в бизнес — заходите в медиа Generation AI. А если автоматизировали свою контентную рутину чем-то похожим — расскажите в комментариях, интересно сравнить.-Источник
|