All Projects → data-mining-in-action → DMIA_ProductionML_2021_Spring

data-mining-in-action / DMIA_ProductionML_2021_Spring

Licence: other
Репозиторий направления Production ML, весна 2021

Projects that are alternatives of or similar to DMIA ProductionML 2021 Spring

Torchlambda
Lightweight tool to deploy PyTorch models to AWS Lambda
Stars: ✭ 83 (+97.62%)
Mutual labels:  deployment, production
Ml Dl Scripts
The repository provides usefull python scripts for ML and data analysis
Stars: ✭ 119 (+183.33%)
Mutual labels:  deployment, ml
Bert In Production
A collection of resources on using BERT (https://arxiv.org/abs/1810.04805 ) and related Language Models in production environments.
Stars: ✭ 58 (+38.1%)
Mutual labels:  deployment, production
Kubectl Plugins
A Collection of Plugins for kubectl Integration (exec as any user, context switching, etc).
Stars: ✭ 340 (+709.52%)
Mutual labels:  deployment, ci-cd
Deep Learning In Production
Develop production ready deep learning code, deploy it and scale it
Stars: ✭ 216 (+414.29%)
Mutual labels:  deployment, production
Cartoonify
Deploy and scale serverless machine learning app - in 4 steps.
Stars: ✭ 157 (+273.81%)
Mutual labels:  deployment, production
Gaucho
A Python CLI tool for Rancher's API
Stars: ✭ 96 (+128.57%)
Mutual labels:  deployment, ci-cd
pmml4s
PMML scoring library for Scala
Stars: ✭ 49 (+16.67%)
Mutual labels:  deployment, ml
Helloworld Msa
Main repository with documentation and support files
Stars: ✭ 218 (+419.05%)
Mutual labels:  deployment, ci-cd
Procsd
Manage your application processes in production hassle-free like Heroku CLI with Procfile and Systemd
Stars: ✭ 181 (+330.95%)
Mutual labels:  deployment, production
pmml4s-spark
PMML scoring library for Spark as SparkML Transformer
Stars: ✭ 16 (-61.9%)
Mutual labels:  deployment, ml
Django-on-Docker-with-Heroku-and-OpenCV
Deploy Django on Docker to Heroku and include OpenCV
Stars: ✭ 24 (-42.86%)
Mutual labels:  deployment, production
ByteTrack
ByteTrack: Multi-Object Tracking by Associating Every Detection Box
Stars: ✭ 1,991 (+4640.48%)
Mutual labels:  deployment
elixir cluster
Distributed Elixir Cluster on Render with libcluster and Mix Releases
Stars: ✭ 15 (-64.29%)
Mutual labels:  deployment
go-gin-web-server
Deploy Go Gin on Render
Stars: ✭ 23 (-45.24%)
Mutual labels:  deployment
b2-sdk-python
Python library to access B2 cloud storage.
Stars: ✭ 124 (+195.24%)
Mutual labels:  production
tensorflow flask
tensorflow model deployment in flask REST API
Stars: ✭ 26 (-38.1%)
Mutual labels:  deployment
readme-to-dockerhub
Small hack to push the readme to docker hub
Stars: ✭ 16 (-61.9%)
Mutual labels:  ci-cd
gosane
A sane and simple Go REST API template.
Stars: ✭ 81 (+92.86%)
Mutual labels:  production
kuzgun
simple, ssh based deployment tool
Stars: ✭ 16 (-61.9%)
Mutual labels:  deployment

DMIA 2021 Spring - Направление Production ML

Описание направления

На направлении мы будем учиться тому, чем обычно занимаются ML Engineers или ML Developers - превращают обученную модель в работающий сервис. Затронем то, как версионировать код, данные и эксперименты, превращать модели в веб-сервисы, работать с контейнерами, деплоить и тестировать модели, писать пайплайны для переобучения, и, наконец, собирать CI/CD, который будет делать эту работу за нас.

Входные требования

  • Базовые практические знания ML
  • Знание Python на уровне младшего Python-разработчика
  • Свободное время: 3 часа вебинаров и 5-15 часов самостоятельных занятий в неделю (15 - если вы сомневаетесь в своих силах, 5 - если вы преподаватель курса :)
  • Будет легче, если у вас есть опыт работы с *nix-системами, вы знаете Docker, сети, web-сервисы (Flask, REST API)

Отбор

Чтобы пройти на курс, нужно выполнить общее для всех направлений задание в анкете слушателя и побить несложный бейзлайн в соревновании по предсказанию сложности пароля - его видно на лидерборде. Если вам будет не слишком сложно это сделать, то будем считать, что обладаете достаточным уровнем по первым двум навыкам в списке. Внимательно смотрите время окончания соревнования на kaggle inclass.

Ссылка, по которой можно присоединиться к соревнованию https://www.kaggle.com/t/4b03db9d284240efb8c337d11c91dd30

Что будет являться результатом прохождения

  • Познакомимся с основными принципами DevOps и узнаем о специфике MLOps
  • Поработаем с актуальными продакшн-инструментами, используемыми в ML
  • Обсудим выбор подходящих инструментов в рамках конкретной задачи
  • Выполним курсовой проект, о котором можно рассказать на собеседовании

Структура курса по неделям

  1. Обзор отрасли. Введение в MLOps. Практики написания кода.
  2. Системное администрирование. Менеджеры пакетов и виртуальных окружений Python. REST API и Flask.
  3. Git, версионирование кода и артефактов. Docker и контейнеризация сервисов. Деплой ML моделей.
  4. Основы хранения и версионирования данных. Сервера в интернете и облачные вычисления. Тестирование ML моделей и сервисов.
  5. Архитектура ML-систем. Создание ML пайплайнов.
  6. Воспроизводимость экспериментов. Мониторинг сервисов и ML моделей.
  7. Построение CI/CD, автоматизация тестирования, сборки и деплоя пайплайнов и сервисов.
  8. Подведение итогов курса. Обзор дальнейшего развития, задач и целей для ML Engineer.
  9. Боевая проверка реализаций курсового проекта.

Более подробный план доступен здесь

Грейдинг

Рейтингом будет служить результат работы над курсовым проектом - ботом для игры в Шляпу. Мы будем учитывать как количество отгаданных и загаданных слов, так и технические метрики, включая доступность, надежность и скорость ответов ваших сервисов.

Авторы курса

  • Александр Гущин, ML Engineer в Iterative.ai
  • Михаил Трофимов, ML Product Owner в Praxis
  • Глеб Ерофеев, Lead ML Engineer в Сбермаркет
  • Виталий Белов, DS в Сбермаркет
  • Ольга Филиппова, DS Team Lead в банке Открытие
  • Илья Ирхин, Chief DS Yandex.Taxi
Note that the project description data, including the texts, logos, images, and/or trademarks, for each open source project belongs to its rightful owner. If you wish to add or remove any projects, please contact us at [email protected].