Mozg Labs — Наши проекты

Наши проекты

Мы работаем со многими известными брендами

Soundstream Logo
Soundstream

Сайт: https://soundstream.media/

Приложение для прослушивания подкастов от Русских Медиа, которые являются одними из ведущих игроков на этом рынке.

Задача

Разработать систему для рекомендаций подкастов в зависимости от предпочтений пользователя.

Результат

Система обучилась рекомендовать подкасты для пользователей с учётом их интересов. Также система умеет находить похожие на заданный подкаст ролики и рекомендовать их во время прослушивания.

Описание

В качестве основы для системы рекомендаций был выбран word2vec. На основе истории прослушиваний каждому клипу присваивается определённый вектор, который максимально точно описывает его на основе того, какие композиции чаще слушают вместе с ним.

Система потребовала серьёзной оптимизации, т.к. сервис является крайне высоконагруженным.

Также были разработаны алгоритмы для холодного старта как для клипов (если он только появился в системе), так и для новых пользователей, которые ещё не прослушали ни одного клипа.

Вектор интересов пользователя на основе прослушанных клипов создаётся динамически, что позволяет обновлять рекомендации после каждого прослушивания клипов.

Были добавлены фильтры для рекомендаций, чтобы соблюсти баланс между exploration и exploitation.

Также, в качестве бонуса, был создан алгоритм неперсонализированных рекомендаций, который позволяет ранжировать новые ролики в зависимости от их прослушиваний/лайков/скачиваний и их возрастом, чтобы улучшить раскрываемость нового контента.

Вся система обладает удобным интерфейсом, позволяющим контролировать и настраивать любые аспекты её работы.

Система поставляется в виде образов Docker что позволяет её легко масштабировать на любое количество серверов.

OTR Logo

OTR

Сайт: http://otr.ru/

Российский разработчик ПО и один из крупнейших системных интеграторов на рынке. В активе ОТР – более десяти лет реализации масштабных проектов для заказчиков из госсектора, среди которых: Министерство финансов РФ, Министерство экономического развития РФ, Федеральное казначейство (Казначейство России), Счетная палата РФ, Министерство государственного управления, информационных технологий и связи МО, Департамент информационных технологий города Москвы и другие.

Задача

Разработать систему для автоматической категоризации текстовых заявок техподдержки (более 60 категорий) и поиска дубликатов заявок.

Результат

Система успешно категоризирует около 80% поступающих заявок и ищет среди них дубликаты.

Описание

Были испробованы множество моделей, прежде чем нашлась подходящая архитектура на основе свёрточных нейронных сетей (CNN), дающая хороший результат с отличной производительностью.

Система может обработать до полутора миллионов оригинальных заявок в один день на одном сервере с пиковой пропускной способностью в 40 заявок в секунду, что более чем достаточно для задачи.

Из-за крайней специфичности текста пришлось тренировать собственные словари на основе уже имеющихся у компании текстов.

Для увеличения точности были разработаны алгоритмы по чистке и фильтрации текстов, а также для его нормализации.

Вся система обладает удобным интерфейсом, позволяющим контролировать и настраивать любые аспекты её работы.

Система поставляется в виде образов Docker что позволяет её легко масштабировать на любое количество серверов.

И это не всё

В ближайшее время мы добавим ещё интересных проектов!