Главная· Трекер· Новое· Поиск· Правила· FAQ· Группы

Save the date: 20 мая встретимся на Inside AI Meetup от Wildberries & Russ

Страницы: 1

Professor Seleznov

Что происходит, когда AI выходит за пределы прототипа и попадает в прод? На митапе обсудим реальные кейсы: от высоконагруженной модерации с векторным поиском и AIOps-подходов к управлению ML-сервисами до практики построения RAG-систем, тонкостей реранкинга и реальных этапов запуска LLM-продуктов. Среди спикеров эксперты Wildberries & Russ, MWS, МФТИ, Avito, VK, M2, Сбера, Альфа-Банка, red_mad_robot.
Когда: 20 мая, старт в 15:00
Где: Москва + онлайн-трансляция
Регистрация открыта —>здесь

Inside AI: Main Track. Доклады на 30 минут от Wildberries & Russ, MWS, МФТИ

«Векторный поиск в модерации контента: как поместить более 200 моделей в 1 ансамбль»
Лев Нечаев, Руководитель команды «Автоматическая модерация методами ИИ» Wildberries & Russ
Векторный поиск — элемент 2-stage модерационных моделей, позволяющий снизить Time to market модерации без дополнительного обучения моделей. Расскажем весь пайплайн: от первых моделей до появления универсальных детекторов на основе векторного поиска, о технических сложностях сбора данных, реализации высоконагруженных детекторов. На практических примерах покажем преимущества векторных детекторов по сравнению с обычными one-stage детекторами.
«Внедрение AIOps-практик для контроля и повышения общей утилизации ресурсов для тысяч продуктовых сервисов»
Даниил Понизов, Team Lead MLOps, Wildberries & Russ
Роман Лазовский, MLOps Engineer, Wildberries & Russ
Расскажем кто такой ваш этот AIOps и как он помогает решать проблемы, возникающие при промышленной эксплуатации ML и GenAI сервисов требующих большого количества дорогостоящих ресурсов.
В докладе будет наш опыт внедрения AIOps платформы KeepHQ, как она помогла нам повысить утилизацию ресурсов нашего ресерч кластера и сотни продовых ML сервисов в 1.5 раза, а также автоматизировать процесс реагирования и контроля разрешения поступающих алертов.
«RAG, который не галлюцинирует (почти)»
Артем Каледин, Tech Lead CVM B2B, MWS
Александр Швайко, Junior MLE CVM B2, MWS
Но может полностью сломаться из-за одного ранжировщика.
Мы разработали RAG-ассистента — чат-бота на базе LLM, который помогает клиентским менеджерам корпоративного сегмента мгновенно находить точную информацию о 100+ продуктах компании (в рамках mvp = 3) с учётом региональной специфики, цен и нюансов подключения. Сегодня более 1 000 менеджеров готовятся к сотням звонков и встреч вручную, без единого инструмента, что приводит к неточным ответам клиентам и потерям в десятках и сотнях миллионов рублей. Решение построено на архитектуре RAG с использованием модели QWEN3-8B, эмбеддингов BGE-M3 и гибридного поиска (Vector + BM25 через RRF), а ключевым элементом качества стал реранкер — в докладе мы подробно сравним две его версии (на основе FlagEmbedding и metadata-эвристик), покажем метрики, разберём ошибки на конкретных примерах и продемонстрируем живое демо системы.
«Что на самом деле представляет запуск продуктов на базе LLM»
Юрий Софронов, руководитель направления «Модели и сервисы для ИИ-Ассистентов», Wildberries & Russ
Расскажу про то, что разработка и интеграция в продукт ИИ решений на самом деле из себя представляет.
Часто все представляют это так (и сильно ошибаются): скачал пару open-source библиотек, настроил промпты, прокинул API до LLM. Расскажу, что в реальности кроется за тем, чтобы вывести в прод LLM-based сервисы, какие этапы предстоит пройти, что точно делать не стоит, про что точно стоит не забыть.
«Автоматические гардрейлы»
Владимир Солодкин, ведущий исследователь Института ИИ МФТИ
Модели защиты (guardrails) являются важным дополнением к основной большой языковой модели (LLM), решающей бизнес задачи. Guardrails защищают от попыток вытащить из LLM запрещенную, конфеденциальная, некорреткную, компрометирующая информацию. Спектр угроз и их изощренность растет с каждым днем. В докладе рассмотрим мультиагентное решение, которое в режиме реального времени анализирует текущие способы атак, например, возникающие в Интернете (в научной литературе, блогпостах и тд), и автоматически дообучает модели защиты. Обсудим и возможность эволюционной модификации не только модели защиты, но и создание новых концепций атак также в автоматическом режиме с помощью мультиагентной системы.

Inside AI: Fast Track. Доклады на 15 минут от Wildberries & Russ, Avito, VK, M2

«Text is All You Need. Отекстовка потока видеоклипов в платформе Wibes»Антон Костин, ML Lead, Wildberries & Russ
Виталий Подобедов, ML-разработчик, Wildberries & Russ
В Wibes авторские описания видео часто субъективны. Расскажем про сервис, который генерирует тексты и теги напрямую из аудио-визуального контента: как это устроено и как используется для поиска, модерации и определения тематик каналов.
«Эволюция поиска вакансий на Avito: ML-оптимизации в Avito Работе»Вадим Вахрушев, старший DS-инженер, Avito
В докладе я расскажу о поиске в Авито Работе: от отбора кандидатов до переранжирования выдачи для баерского ассистента; какие модели у нас используются; кратко расскажу про наиболее удачные эксперименты в поиске.
«Как мы за перевели более 10 продуктов на единую Discovery-платформу»
Денис Самохвалов, Руководитель отдела рекомендаций социальных сервисов AI VK
Discovery-платформа — единая инфраструктура для рекомендаций, поиска и рекламы. Её ядро: шардированный рантайм, стриминговая платформа Profile Stream и Feature Flow. Расскажу про путь эволюции платформы от катбустов к нейроранку, как мы перевели 10+ продуктов и сократили внедрение новых рекомендаций в продуктах до 3 месяцев. Покажу на примерах преимущества платформизации рекомендаций: снижение time-to-market, codless-подход и переиспользование готовых пайплайнов.
«Vibe Driven Development»
Петр Маслак, Product Manager (ML & Data Science), Wildberries & Russ
Разберем, как мы пришли от машинного кода к разработке «разговором» с моделью, и почему в этой новой реальности старый data-driven подход часто ломается: кода больше, ясности меньше. Покажу практику Vibe-Driven Development: как превращать интуицию и живой опыт использования продукта в проверяемые решения через цикл «вайб → гипотеза → доказательство».
«ИИ для среднего размера компании»
Дмитрий Лахвич, Руководитель Управления по развитию платформы данных, M2
Расскажу про ИИ-платформу внутри М2: как выбирали, как разворачивали и от чего пришлось отказаться. Поделюсь опытом того, как не потратить миллиарды на это и как пилотировали продукты, искали точки роста и где уже приносит пользу.

Inside AI: Panel Discussion

Поговорим о том, где проходят границы между LLM, ML и классической автоматизацией, и какие решения действительно работают. Разберём инженерные аспекты AI-продуктов — от агентов и пайплайнов до оценки качества и эксплуатации.
Обсудим реальные кейсы, экономику и масштабирование, а также трансформацию ролей ML/AI-команд: от обучения моделей к платформам, интеграции и управлению качеством. Не пропустите!
Спикеры:

Михаил Дьячков, руководитель направления Supply and Demand Balance (DS & ML), Wildberries & Russ
Алексей Медошин, директор департамента защиты от DDoS-атак Wildberries & Russ
Александр Гирев, Android Team Lead WB Partners, Wildberries &Russ
Алексей Жданов, Co-founder & CPO NDT by r_m_r
Ксения Михайлова, Руководитель команды ГенИИ пилотов в Альфа-Банке
Артем Айупов, Product lead платформы моделей омнимодальности в блоке развития генеративного ИИ Сбера

Кому будет полезно: senior ML/AI инженерам, MLE, DS, инженерам платформ и всем, кто строит или масштабирует AI-системы в продакшене.
Приходите на митап и приглашайте коллег!-Источник

Пользовательское Соглашение | Связь с администрацией

SysAdmin.Guru · Telegram-канал

Loading...

Error

Save the date: 20 мая встретимся на Inside AI Meetup от Wildberries & Russ

Inside AI&#58; Main Track. Доклады на 30 минут от Wildberries &amp; Russ, MWS, МФТИ

Inside AI&#58; Fast Track. Доклады на 15 минут от Wildberries &amp; Russ, Avito, VK, M2

Inside AI&#58; Panel Discussion

Inside AI: Main Track. Доклады на 30 минут от Wildberries & Russ, MWS, МФТИ

Inside AI: Fast Track. Доклады на 15 минут от Wildberries & Russ, Avito, VK, M2

Inside AI: Panel Discussion