С 25% до 86% за шесть недель: OpenAI запустила самообучающегося налогового агента на Codex

Страницы:  1

Ответить
 

Professor Seleznov


pic
OpenAI совместно с инвесткомпанией Thrive Holdings выпустила Tax AI — ИИ-агента для составления налоговых деклараций, который применяют бухгалтеры сети Crete. За шесть недель пилота доля корректно заполненных деклараций выросла с 25% до 86%, всего агент обработал 7000 деклараций. Главное в новости не сам факт ИИ-бухгалтера, а то, что вместо человека агента улучшает другой ИИ-агент — Codex.
Раньше после запуска ИИ-агента в работу инженеры неделями копались в логах, выискивали повторяющиеся ошибки, правили промпты и переводили жалобы пользователей в код. Цикл медленный и упирался в человека на каждом шаге. В Tax AI его замкнули через Codex: записи реальной работы агента с правками бухгалтеров становятся сигналами об ошибках, Codex смотрит их вместе с кодом, тестами и инструкциями агента, а потом предлагает новые проверки и правки. Неоднозначные случаи уходят на ревью инженеру.
Разработчики сразу целились не в простые декларации с одним работодателем, а в сложные случаи с формой K-1 (доходы от партнерств и инвестиций), проблемными документами и нестандартными источниками дохода — это самая трудоемкая часть работы. Заявленная финальная точность — до 97%.
Это уже не первый случай самоулучшения у OpenAI. В сентябре компания выпустила GPT-5.3-Codex и заявляла, что раняя версия модели участвовала в собственной разработке — помогала отлаживать обучение, управлять развертыванием и разбирать результаты тестов. Теперь тот же прием перенесли с внутренней инфраструктуры на прикладного агента в чужой отрасли — налоговую отчетность.
Один из старших бухгалтеров Tax AI утверждает, что потратил на налоговый сезон 15 часов вместо 180 годом ранее — освободившееся время он пустил на личные звонки клиентам и взял новых заказчиков. В среднем бухгалтеры экономят около трети времени на подготовке деклараций. Сам подход OpenAI продвигает как переиспользуемый: если паттерн воспроизводится в других отраслях, меняется сам способ строить агентов — не инженер вручную ловит ошибки месяцами, а второй агент анализирует работу первого и сам пишет правки.
P.S. Поддержать меня можно подпиской на канал "сбежавшая нейросеть ", где я рассказываю про ИИ с творческой стороны.-Источник
 
Loading...
Error