Сортировать:
- по релевантности
- по дате
- по зарплате
... на multi-GPU установках с tensor/pipeline/data parallelism ... для автоматизации развертывания Практический опыт с vLLM, TensorRT-LLM, ... memory и понимание CUDA (Intermediate C++/CUDA) Будет плюсом: ... production-средах Опыт работы с моделями 480B+ параметров на ...
23.12.2025; Источник: hh.ru