Сортировать:
- по релевантности
- по дате
- по зарплате
... бизнес-описанию. Обязанности развертывание и оптимизация LLM моделей на multi-GPU ... для инфраструктуры inference профилирование и оптимизация использования VRAM (CUDA OOM prevention ... снижения требований к VRAM знание оптимизаций Flash Attention и Paged ...
26.12.2025; Источник: hh.ru