| descrizione |
Realtà focalizzata sull’Intelligenza Artificiale, che nasce come spin-off del Politecnico di Milano e che si occupa di sviluppare soluzioni custom – con l’utilizzo tecnologie di Machine Learning, Natural Language Processing, e Computer vision – per startup, medie e grandi aziende. L'azienda fa parte di un gruppo composto da altre due realtà complementari: una specializzata nello sviluppo di una piattaforma innovativa di AI per l’ambito pubblicitario, con l’obiettivo di ottimizzare le campagne e migliorare l’esperienza dei clienti attraverso soluzioni tecnologiche avanzate. L'altra è specializzata nello sviluppo di soluzioni software basate su tecnologie avanzate, con l’obiettivo di rendere il processo di sviluppo più veloce, efficiente e adattabile. Inserita in un ecosistema sinergico con forte impronta scientifica e attenzione alla formazione, opera su tutti i principali trend tecnologici – tra cui sviluppo software, AI e cloud – e partecipa a progetti europei, con una chiara vocazione internazionale.
Descrizione del ruolo Stiamo cercando un Generative AI Engineer, capace di operare a stretto contatto con i team di sviluppo software e di gestire in autonomia tutte le fasi di progettazione, delivery e governance. La persona ideale proviene dal mondo della consulenza, ha un approccio tecnico e orientato al cliente, e possiede solide competenze nella gestione di attività pre-sales e nella governance progettuale di soluzioni data-driven e AI. Model Development & Research- Progettare, addestrare e ottimizzare modelli di IA generativa (LLM, diffusion models, multimodal models).
- Eseguire fine-tuning, prompt engineering, RAG, e tecniche avanzate di alignment.
- Sperimentare nuove architetture, metodi di training e tecniche di ottimizzazione.
Engineering & Implementation- Integrare modelli di IA in applicazioni e servizi scalabili (API, microservizi).
- Costruire pipeline di preprocessing e data engineering per dataset su larga scala.
- Implementare sistemi di inferenza efficienti, con attenzione a latenza e costi.
Optimization & MLOps- Utilizzare tecniche di compressione e accelerazione (quantization, distillation).
- Monitorare performance dei modelli in produzione e gestire versioning, rollout e fallback.
- Collaborare con il team DevOps per deployment in ambienti cloud (AWS/GCP/Azure).
Safety, Quality & Compliance- Sviluppare guardrails, filtri e meccanismi di sicurezza per evitare output non conformi.
- Assicurare che le soluzioni rispettino standard etici, legali e di tutela dei dati.
Cross-functional Collaboration- Collaborare con product manager, designer e stakeholder per definire i requisiti del prodotto.
- Semplificare concetti complessi e presentare soluzioni a team non tecnici.
- Laurea in Informatica, Ingegneria o discipline affini.
- Esperienza con modelli generativi (LLM, diffusion models, Transformers).
- Ottima conoscenza di Python e framework ML (PyTorch, TensorFlow).
- Esperienza con strumenti e ambienti cloud (AWS, GCP, Azure).
- Conoscenza di pipeline MLOps (Docker, Kubernetes, MLflow, Weights & Biases).
- Familiarità con tecniche di ottimizzazione dei modelli su GPU.
- Competenze in data engineering per dataset complessi.
- Capacità di lavorare in team multidisciplinari e orientamento ai risultati.
- Background in consulenza IT e comprovata autonomia nella gestione di clienti e progetti complessi.
Nice to Have - Esperienza con modelli multimodali (testo-immagine-audio).
- Conoscenze di NLP avanzato, RLHF o Reinforcement Learning.
- Pubblicazioni, progetti open-source o contributi a modelli generativi.
Sede di lavoro: Milano Smart working: 2 giorni a settimana Range di RAL: tra i 35 e i 55.000 €, in base alla seniority del profilo
|