LLMOps TCO Калькулятор

Команда и параметры

Регион / уровень зарплат

5 чел.

Размер LLMOps-команды

2 MLOps + ML-инженер + DevOps + аналитик — типичный минимум для продакшна

4 модели

Моделей в продакшне

Каждая модель — отдельный контур деплоя, мониторинга, обновлений

35%

Текучесть ML-кадров в год

Замена одного ML-инженера = 4–6 мес. его зарплаты (рекрутинг + онбординг)

GPU-инфраструктура

Тир GPU под ваши модели

A100 80G

Llama 3 70B
Qwen 72B (4-bit)
≤ 70B

~5–8 млн/год

H100 / H800

Qwen 110B
DeepSeek R1 70B
до ~130B

~12–25 млн/год

H200 / GB200

DeepSeek V3 685B
Kimi K2, Qwen 235B
MoE 1T+

~35–70 млн/год

H100 — стандарт для 72–110B моделей. Минимум 4–8 карт на кластер для надёжного инференса.

Модель владения железом

Учитывать скрытые расходы

Даунтайм → потери бизнеса

ИБ, compliance, аудит

Обновление моделей / дообучение

24/7 дежурство и инциденты

Сравнение TCO

// Своя команда + инфра

—

млн ₽ / год (полный TCO)

// Готовая платформа
—
млн ₽ / год (всё включено)

// Экономия в год

—

млн ₽

🔴 Самостоятельно —

СОБСТВЕННАЯ ИНФРА

🟢 Платформа —

ГОТОВОЕ РЕШЕНИЕ

Собственное решение — статьи

ФОТ команды (с налогами ~43%) —

GPU-кластер (аренда / амортизация) —

Сеть, хранилище, бэкапы —

MLOps-стек (мониторинг, CI/CD...) —

Рекрутинг и замена при текучке —

Даунтайм, ИБ, обновления, дежурство —

Итого TCO / год —

Готовая платформа — что входит

Лицензия платформы (включая инфру) —

Интеграция и первичный онбординг —

SLA-поддержка (24/7 включена) —

Внутренний владелец продукта (0.5 FTE) —

Обучение команды разработчиков —

––

Итого / год —

// Стоимость платформы

75 млн

млн ₽ / год

💡

Настройте параметры выше.