Сортировать:
- по релевантности
- по дате
- по зарплате
... проект финтех. Задачи: Развертывание и оптимизация LLM моделей на multi-GPU ... % для инфраструктуры inference Профилирование и оптимизация использования VRAM (CUDA OOM prevention ... снижения требований к VRAM Знание оптимизаций Flash Attention и Paged Attention ...
23.12.2025; Источник: hh.ru
... бизнес-описанию. Обязанности развертывание и оптимизация LLM моделей на multi-GPU ... для инфраструктуры inference профилирование и оптимизация использования VRAM (CUDA OOM prevention ... снижения требований к VRAM знание оптимизаций Flash Attention и Paged ...
26.12.2025; Источник: hh.ru
ИТ инженер сопровождения и прикладного администрирования систем (Mission critical/Business critical)
... ; Rabbit MQ; Docer; Nginx; Postgresql; Jenkins; CI/CD Чем предстоит заниматься: Ввод в эксплуатацию и оптимизация работы информационных систем построенных на микросервисной архитектуре Сопровождение контуров ПРОМ и ПСИ Планирование и установка изменений ...
17.12.2025; Источник: hh.ru