A tua missão

O nosso agente de IA já gere uma parte significativa das conversas entre revendedores e compradores. A nossa pipeline de geração de anúncios corre com o custo controlado. Mas ainda estamos longe do que queremos.

A tua missão: pegar nesta base, levá-la a uma taxa de automação superior a 90 % nas conversas e a 90 % nos listings autogerados aceites tal como estão. Em paralelo, constróis os agentes internos que tornam cada equipa mais rápida e és o motor da inovação em IA na empresa, testando os últimos avanços e integrando-os rapidamente.

O que terás feito em 12 meses

Pipeline LLM no produto que melhora continuamente, com re-treino sobre os nossos dados pelo menos uma vez por trimestre.
Custo de IA medido e seguido semana a semana.
Eval contínua em produção: datasets de teste, deteção de regressão, observability LLM (Langfuse ou equivalente) em todos os flows críticos.
Agentes autónomos shippados para cada equipa (sales, support, ops, dev).
Suporte ao cliente gerido maioritariamente sem humano, nos temas recorrentes.
Base de conhecimento RAG sobre a nossa documentação, conversas e código disponível internamente.

Os teus primeiros 90 dias

Mês 1. Mapeias as pipelines de IA existentes. Produzes um dataset de 1 000 erros e shippas uma primeira melhoria mensurável.

Mês 3. Implementaste a eval contínua. Shippaste um primeiro agente interno (provavelmente para o support). Já fizeste dois re-treinos direcionados.

Mês 6. És owner de toda a stack de IA em autonomia. Conduzes as escolhas de modelo, infra, custo e observability.

Quem procuramos

4 a 5 anos de experiência no mínimo, com LLM e ML shippados em produção (não só notebooks, não só hackathons). Métricas precisas nos teus projetos, com provas.
Consegues falar-nos de quatro ou cinco papers, posts ou vídeos sobre IA que te marcaram recentemente e porquê. Concreto, não name-dropping.
Sabes otimizar uma pipeline LLM em produção: context caching, prompt compression, routing de modelos consoante a dificuldade, fine-tuning direcionado, batch processing.
Dominas a observability LLM (Langfuse ou equivalente), os datasets de teste, a eval contínua e a deteção de regressão.
Explicas um conceito complexo de LLM a alguém non-tech em dois minutos sem jargão.
Usas Claude Code ou Cursor a fundo, mas fazes review dos outputs.

Nice to have. Fine-tuning DPO ou RLHF já feito. RAG em produção. Modelo treinado from scratch sobre dados proprietários. ML Vision.

Este cargo não é para ti se

Procuras um cargo de Research Scientist — não fazemos R&D blue sky.
Trabalhas apenas em notebooks Jupyter e nunca shippaste em produção.
Recusas partilhar código ou projetos concretos.
Não estás a par dos últimos avanços em LLM e não consegues discuti-los de forma concreta.
Não consegues explicar um conceito de LLM a alguém non-tech em dois minutos.
Não dominas a observability LLM, os datasets de teste, a eval contínua, a deteção de regressão.

Vantagens

Salário 110–140 K€ brutos/ano
BSPCE 0,5 a 1,5 %, vesting 4 anos, cliff 1 ano
Casa ControlResell a 30 min de Paris de RER
Cozinheiro ao almoço e ao jantar nos dias presenciais
Férias ilimitadas
MacBook Pro M-series e 2 000 € de orçamento de hardware
Subscrição Claude Code Max e ferramentas premium para a tua stack
3 meses nos EUA em Silicon Valley dentro de 18 meses
Orçamento para conferências e formações
Orçamento para compute/API LLM e ML
20 % do teu tempo em side projects, R&D, artigos, etc., que escolhes em linha com a nossa missão.

O processo

Call 1 com o Lyes (30 min). Visão, missão.
Call 2 com o Nathan (60 min). Teste técnico sobre um dataset real: durante o call analisas, retiras as tipologias e propões uma estratégia.
Call 3 com o Lyes e o Nathan (45 min). Debrief, package, perguntas.
Jantar na casa CR.
Oferta em 24h.

Founding AI Engineer