DevOps Engineer (Middle+/Senior)
Работа / Вакансии / IT, интернет, телеком
<strong>Адрес работы:</strong> Москва<br><br><strong>Вакансии компании:</strong> ООО "КОМБЛОК"<br><br>О проекте:<br><br>Разработка экосистемы ИИ-сервисов для автоматизированного анализа контента и аудитории в мессенджерах. Продукт включает в себя модули real-time парсинга данных, семантического анализа, генерации ИИ-отчетов, а также высоконагруженные ML-модели (LLM, RAG).<br><br>Мы предлагаем:<br><br> Стабильный доход: конкурентоспособная заработная плата. Выплаты 2 раза в месяц по 50% или 1 раз в месяц (согласовывается с сотрудником).<br> Гибкий формат: график 5/2. На старте (первые 2 месяца) - работа в офисе для глубокого погружения в инфраструктуру, далее возможен переход на гибридный формат.<br> Сложные задачи: реальный опыт построения AI-инфраструктуры с нуля на собственном железе без ограничений облачных вендоров.<br> Профессиональную среду: мотивированная команда, отсутствие бюрократии, возможность самостоятельно принимать архитектурные решения.<br><br><strong>Обязанности</strong>:<br><br> Миграция и развертывание: перенос существующих сервисов проекта из облачной инфраструктуры Docker во внутренний контур Bare Metal.<br> Управление GPU: развертывание, конфигурация и обеспечение доступности видеокарт NVIDIA для контейнеров (CUDA, NVIDIA Container Toolkit).<br> Автоматизация: написание комплексных скриптов автоматизации, пайплайнов и внутренних тулингов на Python и Bash.<br> Администрирование платформ: оркестрация контейнеров в Kubernetes/Docker Swarm, управление дисковыми хранилищами, базами данных и очередями.<br> Эксплуатация: плановое обновление, масштабирование, мониторинг (метрики, логи, алерты) и быстрое реагирование на инциденты.<br> Архитектурное планирование: сайзинг железа, проектирование отказоустойчивости bare-metal кластеров и документирование процессов.<br><br>Обязательные требования:<br><br> Опыт миграции : успешный практический опыт переноса production-окружения из облаков на собственные сервера.<br> Контейнеризация и оркестрация: глубокие знания Docker, Docker Compose и Kubernetes (архитектура, сеть, bare-metal ингрессы).<br> GPU-инфраструктура: опыт проброса и оркестрации видеокарт NVIDIA в контейнеры, знание NVIDIA Container Runtime, мониторинг VRAM и Compute нагрузки.<br> Работа с хранилищами (Диски/Storage): понимание работы дисковых подсистем на физических серверах (RAID, LVM, монтирование, оптимизация IOPS для БД и ML-моделей, Ceph/NFS как плюс).<br> Продвинутая автоматизация: уверенное владение Python для написания системных скриптов, интеграций по API и автоматизации рутины (+ Bash).<br> Инфраструктура как код и CI/CD: опыт работы с Ansible (управление конфигурациями серверов) и GitLab CI (построение пайплайнов деплоя).<br> Системный уровень: понимание Linux, сетевой модели OSI, маршрутизации и безопасности закрытого контура.<br> Базы данных: опыт эксплуатации и тюнинга PostgreSQL, Redis.<br><br>Желательные навыки:<br><br> MLOps стеки: знакомство с инструментами оркестрации ML-пайплайнов (MLflow, Kubeflow) и реестрами моделей.<br> Настройка мониторинга: опыт самостоятельного развертывания и настройки Prometheus, Grafana, VictoriaMetrics, Loki / ELK с нуля под задачи проекта.<br> Резервное копирование: проектирование и автоматизация стратегий бэкапов.<br><br>Требуемый опыт:<br><br> Не менее 3 лет в роли DevOps.<br> Опыт работы с bare-metal серверами и поддержкой инфраструктуры в закрытых/собственных контурах.<br> Способность самостоятельно принимать технические решения и доводить миграцию сервисов до production-статуса
- 200000 руб