Команда и параметры
5 чел.
2 MLOps + ML-инженер + DevOps + аналитик — типичный минимум для продакшна
4 модели
Каждая модель — отдельный контур деплоя, мониторинга, обновлений
35%
Замена одного ML-инженера = 4–6 мес. его зарплаты (рекрутинг + онбординг)
GPU-инфраструктура
A100 80G
Llama 3 70B
Qwen 72B (4-bit)
≤ 70B
Qwen 72B (4-bit)
≤ 70B
~5–8 млн/год
H100 / H800
Qwen 110B
DeepSeek R1 70B
до ~130B
DeepSeek R1 70B
до ~130B
~12–25 млн/год
H200 / GB200
DeepSeek V3 685B
Kimi K2, Qwen 235B
MoE 1T+
Kimi K2, Qwen 235B
MoE 1T+
~35–70 млн/год
H100 — стандарт для 72–110B моделей. Минимум 4–8 карт на кластер для надёжного инференса.
Даунтайм → потери бизнеса
ИБ, compliance, аудит
Обновление моделей / дообучение
24/7 дежурство и инциденты
Сравнение TCO
// Своя команда + инфра
—
млн ₽ / год (полный TCO)
// Готовая платформа
—
млн ₽ / год (всё включено)
// Экономия в год
—
млн ₽
Собственное решение — статьи
ФОТ команды (с налогами ~43%)
—
GPU-кластер (аренда / амортизация)
—
Сеть, хранилище, бэкапы
—
MLOps-стек (мониторинг, CI/CD...)
—
Рекрутинг и замена при текучке
—
Даунтайм, ИБ, обновления, дежурство
—
Итого TCO / год
—
Готовая платформа — что входит
Лицензия платформы (включая инфру)
—
Интеграция и первичный онбординг
—
SLA-поддержка (24/7 включена)
—
Внутренний владелец продукта (0.5 FTE)
—
Обучение команды разработчиков
—
––
Итого / год
—
// Стоимость платформы
75 млн
Настройте параметры выше.