💼 Full-Time Position

Junior ML Infrastructure Engineer

🏢
GPU Solutions
📍 madrid, madrid, Spain
📍
Location
madrid, Spain
📅
Posted
June 09, 2026
Type
Full-Time
🎯

Full-Time Opportunity: This is a permanent, full-time position with a competitive package and real career growth potential.

Job Description

Sobre nosotros

En GPU Solutions operamos infraestructura de cómputo de última generación, incluyendo NVIDIA B200, para servir modelos de IA en producción. Somos un equipo pequeño donde cada persona tiene impacto directo sobre el producto y las decisiones técnicas.

El puesto

Buscamos a alguien al inicio de su carrera con ganas de especializarse en

inference serving

sobre hardware top de gama. Vas a trabajar mano a mano con modelos de lenguaje y visión grandes, desplegándolos, optimizándolos y midiendo su rendimiento sobre B200. No te vamos a pedir que llegues sabiéndolo todo: te vamos a pedir que aprendas rápido y traigas iniciativa.

Qué harás

Desplegar y servir modelos (LLMs, VLMs, modelos de difusión) usando frameworks como vLLM, TensorRT-LLM, SGLang o Triton Inference Server. Optimizar latencia y throughput mediante cuantización (FP8, INT4), batching dinámico y paralelismo de tensores. Monitorizar GPUs, diagnosticar cuell...