Save the date: 20 мая встретимся на Inside AI Meetup от Wildberries & Russ

Страницы:  1

Ответить
 

Professor Seleznov


Что происходит, когда AI выходит за пределы прототипа и попадает в прод? На митапе обсудим реальные кейсы: от высоконагруженной модерации с векторным поиском и AIOps-подходов к управлению ML-сервисами до практики построения RAG-систем, тонкостей реранкинга и реальных этапов запуска LLM-продуктов. Среди спикеров эксперты Wildberries & Russ, MWS, МФТИ, Avito, VK, M2, Сбера, Альфа-Банка, red_mad_robot.
Когда: 20 мая, старт в 15:00
Где: Москва + онлайн-трансляция
Регистрация открыта —>здесь

Inside AI: Main Track. Доклады на 30 минут от Wildberries & Russ, MWS, МФТИ

  • «Векторный поиск в модерации контента: как поместить более 200 моделей в 1 ансамбль»
    Лев Нечаев, Руководитель команды «Автоматическая модерация методами ИИ» Wildberries & Russ
    Векторный поиск — элемент 2-stage модерационных моделей, позволяющий снизить Time to market модерации без дополнительного обучения моделей. Расскажем весь пайплайн: от первых моделей до появления универсальных детекторов на основе векторного поиска, о технических сложностях сбора данных, реализации высоконагруженных детекторов. На практических примерах покажем преимущества векторных детекторов по сравнению с обычными one-stage детекторами.
  • «Внедрение AIOps-практик для контроля и повышения общей утилизации ресурсов для тысяч продуктовых сервисов»
    Даниил Понизов, Team Lead MLOps, Wildberries & Russ
    Роман Лазовский, MLOps Engineer, Wildberries & Russ
    Расскажем кто такой ваш этот AIOps и как он помогает решать проблемы, возникающие при промышленной эксплуатации ML и GenAI сервисов требующих большого количества дорогостоящих ресурсов.
    В докладе будет наш опыт внедрения AIOps платформы KeepHQ, как она помогла нам повысить утилизацию ресурсов нашего ресерч кластера и сотни продовых ML сервисов в 1.5 раза, а также автоматизировать процесс реагирования и контроля разрешения поступающих алертов.
  • «RAG, который не галлюцинирует (почти)»
    Артем Каледин, Tech Lead CVM B2B, MWS
    Александр Швайко, Junior MLE CVM B2, MWS
    Но может полностью сломаться из-за одного ранжировщика.
    Мы разработали RAG-ассистента — чат-бота на базе LLM, который помогает клиентским менеджерам корпоративного сегмента мгновенно находить точную информацию о 100+ продуктах компании (в рамках mvp = 3) с учётом региональной специфики, цен и нюансов подключения. Сегодня более 1 000 менеджеров готовятся к сотням звонков и встреч вручную, без единого инструмента, что приводит к неточным ответам клиентам и потерям в десятках и сотнях миллионов рублей. Решение построено на архитектуре RAG с использованием модели QWEN3-8B, эмбеддингов BGE-M3 и гибридного поиска (Vector + BM25 через RRF), а ключевым элементом качества стал реранкер — в докладе мы подробно сравним две его версии (на основе FlagEmbedding и metadata-эвристик), покажем метрики, разберём ошибки на конкретных примерах и продемонстрируем живое демо системы.
  • «Что на самом деле представляет запуск продуктов на базе LLM» 
    Юрий Софронов, руководитель направления «Модели и сервисы для ИИ-Ассистентов», Wildberries & Russ
    Расскажу про то, что разработка и интеграция в продукт ИИ решений на самом деле из себя представляет.
    Часто все представляют это так (и сильно ошибаются): скачал пару open-source библиотек, настроил промпты, прокинул API до LLM. Расскажу, что в реальности кроется за тем, чтобы вывести в прод LLM-based сервисы, какие этапы предстоит пройти, что точно делать не стоит, про что точно стоит не забыть.
  • «Автоматические гардрейлы» 
    Владимир Солодкин, ведущий исследователь Института ИИ МФТИ
    Модели защиты (guardrails) являются важным дополнением к основной большой языковой модели (LLM), решающей бизнес задачи. Guardrails защищают от попыток вытащить из LLM запрещенную, конфеденциальная, некорреткную, компрометирующая информацию. Спектр угроз и их изощренность растет с каждым днем. В докладе рассмотрим мультиагентное решение, которое в режиме реального времени анализирует текущие способы атак, например, возникающие в Интернете (в научной литературе, блогпостах и тд), и автоматически дообучает модели защиты. Обсудим и возможность эволюционной модификации не только модели защиты, но и создание новых концепций атак также в автоматическом режиме с помощью мультиагентной системы.

Inside AI: Fast Track. Доклады на 15 минут от Wildberries & Russ, Avito, VK, M2

  • «Text is All You Need. Отекстовка потока видеоклипов в платформе Wibes»Антон Костин, ML Lead, Wildberries & Russ
    Виталий Подобедов, ML-разработчик, Wildberries & Russ

    В Wibes авторские описания видео часто субъективны. Расскажем про сервис, который генерирует тексты и теги напрямую из аудио-визуального контента: как это устроено и как используется для поиска, модерации и определения тематик каналов.
  • «Эволюция поиска вакансий на Avito: ML-оптимизации в Avito Работе»Вадим Вахрушев, старший DS-инженер, Avito
    В докладе я расскажу о поиске в Авито Работе: от отбора кандидатов до переранжирования выдачи для баерского ассистента; какие модели у нас используются; кратко расскажу про наиболее удачные эксперименты в поиске.
  • «Как мы за перевели более 10 продуктов на единую Discovery-платформу»
    Денис Самохвалов, Руководитель отдела рекомендаций социальных сервисов AI VK
    Discovery-платформа — единая инфраструктура для рекомендаций, поиска и рекламы. Её ядро: шардированный рантайм, стриминговая платформа Profile Stream и Feature Flow. Расскажу про путь эволюции платформы от катбустов к нейроранку, как мы перевели 10+ продуктов и сократили внедрение новых рекомендаций в продуктах до 3 месяцев. Покажу на примерах преимущества платформизации рекомендаций: снижение time-to-market, codless-подход и переиспользование готовых пайплайнов.
  • «Vibe Driven Development»
    Петр Маслак, Product Manager (ML & Data Science), Wildberries & Russ
    Разберем, как мы пришли от машинного кода к разработке «разговором» с моделью, и почему в этой новой реальности старый data-driven подход часто ломается: кода больше, ясности меньше. Покажу практику Vibe-Driven Development: как превращать интуицию и живой опыт использования продукта в проверяемые решения через цикл «вайб → гипотеза → доказательство».
  • «ИИ для среднего размера компании»
    Дмитрий Лахвич, Руководитель Управления по развитию платформы данных, M2
    Расскажу про ИИ-платформу внутри М2: как выбирали, как разворачивали и от чего пришлось отказаться. Поделюсь опытом того, как не потратить миллиарды на это и как пилотировали продукты, искали точки роста и где уже приносит пользу.

Inside AI: Panel Discussion

Поговорим о том, где проходят границы между LLM, ML и классической автоматизацией, и какие решения действительно работают. Разберём инженерные аспекты AI-продуктов — от агентов и пайплайнов до оценки качества и эксплуатации. 
Обсудим реальные кейсы, экономику и масштабирование, а также трансформацию ролей ML/AI-команд: от обучения моделей к платформам, интеграции и управлению качеством. Не пропустите!
Спикеры:
  • Михаил Дьячков, руководитель направления Supply and Demand Balance (DS & ML), Wildberries & Russ
  • Алексей Медошин, директор департамента защиты от DDoS-атак Wildberries & Russ
  • Александр Гирев, Android Team Lead WB Partners, Wildberries &Russ
  • Алексей Жданов, Co-founder & CPO NDT by r_m_r
  • Ксения Михайлова, Руководитель команды ГенИИ пилотов в Альфа-Банке
  • Артем Айупов, Product lead платформы моделей омнимодальности в блоке развития генеративного ИИ Сбера
Кому будет полезно: senior ML/AI инженерам, MLE, DS, инженерам платформ и всем, кто строит или масштабирует AI-системы в продакшене.
Приходите на митап и приглашайте коллег!-Источник
 
Loading...
Error