Сортировать:
- по релевантности
- по дате
- по зарплате
... и оптимизация LLM моделей на multi-GPU установках с tensor/pipeline/data parallelism Организация MLOps-процессов и системная оценка качества моделей Обеспечение production latency <2s и uptime >95% для инфраструктуры inference Профилирование и оптимизация ...
23.12.2025; Источник: hh.ru
от
78 000 Р
... компонентов системы Мы ждём, что вы Умеете работать с Docker, занимались поддержкой технически сложных продуктов или системным администрированием Работали с платформой Kubernetes будет плюсом Знакомы с языками скриптинга (Bash или Python) для автоматизации ...
18.12.2025; Источник: hh.ru
... и оптимизация LLM моделей на multi-GPU установках с tensor/pipeline/data parallelism организация MLOps-процессов и системная оценка качества моделей обеспечение production latency <2s и uptime >95% для инфраструктуры inference профилирование и оптимизация ...
26.12.2025; Источник: hh.ru
- 1
- 2