Tu misión

Nuestro agente de IA ya gestiona una parte significativa de las conversaciones entre revendedores y compradores. Nuestro pipeline de generación de anuncios funciona con un coste controlado. Pero todavía estamos lejos de lo que queremos.

Tu misión: coger esta base, llevarla a una tasa de automatización superior al 90 % en las conversaciones y al 90 % en los listings autogenerados aceptados tal cual. En paralelo, construyes los agentes internos que hacen a cada equipo más rápido y eres el motor de la innovación IA en la empresa, probando los últimos avances e integrándolos rápidamente.

Lo que habrás hecho en 12 meses

Pipeline LLM de producto que mejora de forma continua, con reentrenamiento sobre nuestros datos al menos una vez por trimestre.
Coste IA medido y trackeado semana tras semana.
Eval continua en marcha: datasets de test, detección de regresiones, observability LLM (Langfuse o equivalente) en todos los flujos críticos.
Agentes autónomos shippeados para cada equipo (sales, soporte, ops, dev).
Soporte al cliente gestionado mayoritariamente sin humanos, en los temas recurrentes.
Base de conocimiento RAG sobre nuestra documentación, conversaciones y código disponible en interno.

Tus primeros 90 días

Mes 1. Cartografías los pipelines de IA existentes. Sacas un dataset de 1.000 errores y shippeas una primera mejora medible.

Mes 3. Has puesto en marcha la eval continua. Has shippeado un primer agente interno (probablemente para el soporte). Ya has hecho dos reentrenamientos dirigidos.

Mes 6. Eres owner de todo el stack de IA de forma autónoma. Pilotas las decisiones de modelo, infra, coste y observability.

A quién buscamos

4 o 5 años de experiencia mínimo, con LLM y ML shippeado en producción (no solo notebooks, no solo hackathons). Métricas precisas en tus proyectos, con pruebas.
Puedes hablarnos de cuatro o cinco papers, posts o vídeos de IA que te hayan marcado recientemente y explicarnos por qué. Concreto, no name-dropping.
Sabes optimizar un pipeline LLM en producción: context caching, prompt compression, routing de modelos según la dificultad, fine-tuning dirigido, batch processing.
Dominas la observability LLM (Langfuse o equivalente), los datasets de test, la eval continua, la detección de regresiones.
Eres capaz de explicar un concepto LLM complejo a alguien no técnico en dos minutos sin jerga.
Usas Claude Code o Cursor a fondo pero revisas los outputs.

Nice to have. Fine-tuning DPO o RLHF ya hecho. RAG en producción. Modelo entrenado from scratch sobre datos propietarios. ML Vision.

Este puesto no es para ti si

Buscas un puesto de Research Scientist: no hacemos R&D blue sky.
Trabajas únicamente en notebooks de Jupyter y nunca has shippeado en producción.
Te niegas a compartir código o proyectos concretos.
No estás al día de los últimos avances en LLM y no puedes hablar de ellos de forma concreta.
No sabes explicar un concepto LLM a alguien no técnico en dos minutos.
No dominas la observability LLM, los datasets de test, la eval continua, la detección de regresiones.

Ventajas

Salario 110–140 K€ bruto/año
BSPCE 0,5 a 1,5 %, vesting 4 años, cliff 1 año
Casa ControlResell a 30 min de Paris en RER
Cocinero a mediodía y por la noche los días de presencia
Vacaciones ilimitadas
MacBook Pro M-series y 2.000 € de presupuesto de hardware
Suscripción Claude Code Max y herramientas premium para tu stack
3 meses en EE. UU. en Silicon Valley antes de 18 meses
Presupuesto para conferencias y formaciones
Presupuesto de compute/API LLM y ML
20 % de tu tiempo en side projects, R&D, artículos, etc. que eliges en línea con nuestra misión.

El proceso

Call 1 con Lyes (30 min). Visión, misión.
Call 2 con Nathan (60 min). Test técnico sobre un dataset real: durante el call analizas, sacas las tipologías, propones una estrategia.
Call 3 con Lyes y Nathan (45 min). Debrief, paquete, preguntas.
Cena en la casa CR.
Oferta en menos de 24h.

Founding AI Engineer