Сортировать:
- по релевантности
- по дате
- по зарплате
... -GPU установках с tensor/pipeline/ ... развертывания Практический опыт с vLLM, TensorRT-LLM ... моделей Опыт работы с квантизацией (AWQ, ... Attention Навыки работы с PyTorch, JAX, ... понимание CUDA (Intermediate C++/CUDA) Будет плюсом ... средах Опыт работы с моделями 480B+ ...
23.12.2025; Источник: hh.ru