A tua missão
O nosso agente de IA já gere uma parte significativa das conversas entre revendedores e compradores. A nossa pipeline de geração de anúncios corre com o custo controlado. Mas ainda estamos longe do que queremos.
A tua missão: pegar nesta base, levá-la a uma taxa de automação superior a 90 % nas conversas e a 90 % nos listings autogerados aceites tal como estão. Em paralelo, constróis os agentes internos que tornam cada equipa mais rápida e és o motor da inovação em IA na empresa, testando os últimos avanços e integrando-os rapidamente.
O que terás feito em 12 meses
- Pipeline LLM no produto que melhora continuamente, com re-treino sobre os nossos dados pelo menos uma vez por trimestre.
- Custo de IA medido e seguido semana a semana.
- Eval contínua em produção: datasets de teste, deteção de regressão, observability LLM (Langfuse ou equivalente) em todos os flows críticos.
- Agentes autónomos shippados para cada equipa (sales, support, ops, dev).
- Suporte ao cliente gerido maioritariamente sem humano, nos temas recorrentes.
- Base de conhecimento RAG sobre a nossa documentação, conversas e código disponível internamente.
Os teus primeiros 90 dias
Mês 1. Mapeias as pipelines de IA existentes. Produzes um dataset de 1 000 erros e shippas uma primeira melhoria mensurável.
Mês 3. Implementaste a eval contínua. Shippaste um primeiro agente interno (provavelmente para o support). Já fizeste dois re-treinos direcionados.
Mês 6. És owner de toda a stack de IA em autonomia. Conduzes as escolhas de modelo, infra, custo e observability.
Quem procuramos
- 4 a 5 anos de experiência no mínimo, com LLM e ML shippados em produção (não só notebooks, não só hackathons). Métricas precisas nos teus projetos, com provas.
- Consegues falar-nos de quatro ou cinco papers, posts ou vídeos sobre IA que te marcaram recentemente e porquê. Concreto, não name-dropping.
- Sabes otimizar uma pipeline LLM em produção: context caching, prompt compression, routing de modelos consoante a dificuldade, fine-tuning direcionado, batch processing.
- Dominas a observability LLM (Langfuse ou equivalente), os datasets de teste, a eval contínua e a deteção de regressão.
- Explicas um conceito complexo de LLM a alguém non-tech em dois minutos sem jargão.
- Usas Claude Code ou Cursor a fundo, mas fazes review dos outputs.
Nice to have. Fine-tuning DPO ou RLHF já feito. RAG em produção. Modelo treinado from scratch sobre dados proprietários. ML Vision.
Este cargo não é para ti se
- Procuras um cargo de Research Scientist — não fazemos R&D blue sky.
- Trabalhas apenas em notebooks Jupyter e nunca shippaste em produção.
- Recusas partilhar código ou projetos concretos.
- Não estás a par dos últimos avanços em LLM e não consegues discuti-los de forma concreta.
- Não consegues explicar um conceito de LLM a alguém non-tech em dois minutos.
- Não dominas a observability LLM, os datasets de teste, a eval contínua, a deteção de regressão.
Vantagens
- Salário 110–140 K€ brutos/ano
- BSPCE 0,5 a 1,5 %, vesting 4 anos, cliff 1 ano
- Casa ControlResell a 30 min de Paris de RER
- Cozinheiro ao almoço e ao jantar nos dias presenciais
- Férias ilimitadas
- MacBook Pro M-series e 2 000 € de orçamento de hardware
- Subscrição Claude Code Max e ferramentas premium para a tua stack
- 3 meses nos EUA em Silicon Valley dentro de 18 meses
- Orçamento para conferências e formações
- Orçamento para compute/API LLM e ML
- 20 % do teu tempo em side projects, R&D, artigos, etc., que escolhes em linha com a nossa missão.
O processo
- Call 1 com o Lyes (30 min). Visão, missão.
- Call 2 com o Nathan (60 min). Teste técnico sobre um dataset real: durante o call analisas, retiras as tipologias e propões uma estratégia.
- Call 3 com o Lyes e o Nathan (45 min). Debrief, package, perguntas.
- Jantar na casa CR.
- Oferta em 24h.