Текущие вакансии

ML инженер

Требуемый опыт работы: от 2х лет
Полная занятость, полный день, работа по гибриду/удаленно в РФ или в г. Алматы

Наш стек:

  • Микросервисная архитектура. Общая разработка на Go, PHP;
  • ML-разработка ведется на Python и уже представлена несколькими сервисами;
  • DevOps и SRE практики;
  • Self Managed Kubernetes on Bare Metal, MetalLB + Ingress Nginx, Helm;
  • Kafka, Redis, MySQL, ClickHouse;
  • ELK stack, Prometheus, Grafana;
  • Github, Argo CD, Ansible, GitOPS, IaC.

Зоны ответственности:

  • Разработка и оптимизация ML-моделей для работы с различными видами; данных, включая изображения и тексты;
  • Улучшение и поддержка существующих ML-сервисов;
  • Разработка и реализация тестовых сценариев для оценки; производительности и качества ML-моделей;
  • Настройка сбора данных и визуализации метрик для ML-сервисов;
  • Выполнение код-ревью.

Нам важно увидеть:

  • Знание математического анализа, линейной алгебры и статистики применительно к data science
  • Опыт разработки на Python не менее 2 лет;
  • Уверенное владение SQL, включая написание сложных запросов;
  • Понимание основных этапов работы с данными и разработки ML-модели;
  • Знание сильных и слабых сторон классических алгоритмов ML для решения различных задач обучения с учителем и без учителя;
  • Опыт полного цикла разработки ML-продуктов — от EDA в Юпитер-ноутбуках до вывода ML-сервисов в прод;
  • Понимание устройства микросервисной архитектуры;
  • Опыт создания приложений на основе REST API;
  • Опыт реализации очереди (например, с помощью Kafka) для обработки запросов ML-моделью в асинхронном потоковом режиме;
  • Опыт работы с различными источниками сырых данных в рамках ML-пайплайна (примеры: PostgreSQL, ClickHouse, MongoDB, Redis, s3);
  • Отличное знание git;
  • Уверенное владение Docker.

Опыт в Deep Learning:

  • Понимание принципов работы и опыт реализации нейронных сетей для различных CV-задач: классификация, обнаружение объектов, сегментация
  • Либо знание различных методов предобработки текстовых данных и опыт применения классических ML-алгоритмов и нейронных сетей (включая трансформеры) для различных NLP-задач

Будет большим плюсом:

  • Понимание принципов практики CI/CD;
  • Опыт деплоя ML-сервисов с использованием Kubernetes;
  • Опыт настройки мониторинга с использованием Prometheus и Grafana (или аналогичных инструментов);
  • Участие в соревнованиях по data science.