Leonardo DRS

HPC & AI Cloud Architect

Roma, IT Genova, IT
AI Machine Learning Kubernetes Docker Terraform Ansible Prometheus Grafana Linux Python Bash SQL
Description

HPC & AI Cloud Architect

Location: IT - Roma - Via Laurentina, IT - Genova - Fiumara

Time Type: Full time

Job Description

Job Description:

All’interno dell’Area Hypercomputing Continuum siamo alla ricerca di un/una HPC & AI Cloud Architect appassionato di infrastrutture innovative per l’addestramento e l’inferenza di modelli AI. Il candidato ideale ha esperienza concreta nella progettazione, implementazione e ottimizzazione di ambienti HPC e AI cloud-native su OpenStack, integrando le migliori soluzioni open source.

La persona si occuperà delle seguenti attività:

  • Progettazione dell’architettura di infrastrutture HPC e AI per supportare carichi di lavoro complessi, training e inferenza modelli AI/ML e simulazioni avanzate, in ambienti OpenStack;

  • Definizione di strategie per l’adozione di tecnologie emergenti (acceleratori, XPUs, GPU/TPU, high performance fabrics, storage NVMe, file system paralleli tipo Lustre/GPFS/BeeGFS);

  • Implementazione di cluster computazionali (CPU/GPU), orchestrazione container e VM (Kubernetes, Docker, Slurm, OpenStack), e ottimizzazione delle risorse per AI e HPC;

  • Integrazione con ambienti DevOps/MLOps per workflow CI/CD di modelli AI, automazione e monitoraggio;

  • Seguire la standardizzazione delle infrastrutture tramite Infrastructure-as-Code (Terraform, Ansible, Kolla);

  • Gestione e tuning di networking ad alta velocità (Infiniband, 200/400GbE), storage avanzato e data pipeline per big data e machine learning;

  • Implementare best practice per la sicurezza, monitoraggio, reliability (monitoraggio, logging, observability, SLO/SLAs) e business continuity;

  • Coordinamento di progetti di business continuity, disaster recovery e backup in ambienti HPC/AI;

  • Collaborare con data scientist, DevOps, ingegneri software e stakeholder di ricerca per costruire soluzioni AI/HPC altamente performanti e customizzate;

  • Stesura della documentazione tecnica e supporto alle attività di compliance, sicurezza e auditing.

Titolo di studio
Laurea magistrale in Informatica, Ingegneria Informatica o discipline STEM affini.

Seniority
Expert: 3–5 anni di esperienza.

Conoscenze e competenze tecniche

  • Esperienza di almeno 3 anni nella progettazione e gestione di infrastrutture HPC e AI, preferibilmente in ambienti cloud ibridi e multi-tenant,e almeno uno sulle principali distribuzioni OpenStack;

  • Esperienza nella progettazione e configurazione di tecnologie HPC (cluster, scheduler, file system paralleli), architetture GPU/XPU e strumenti di orchestrazione (Kubernetes, Slurm, Docker);

  • Esperienza con acceleratori (GPU, CUDA) per AI/ML e pipeline di deployment di modelli di machine learning su cloud.;

  • Conoscenza di sistemi operativi Linux/Unix, scripting, networking avanzato (SDN, InfiniBand, RDMA) e soluzioni per il trasferimento dati ad alta velocità;

  • Esperienza nell’implementazione di workflow CI/CD e MLOps per training ed inferenza distributed;

  • Capacità di benchmarking, tuning, troubleshooting di ambienti HPC/AI e ottimizzazione delle risorse;

  • Conoscenza di strumenti Infrastructure-as-Code, tecniche di tuning prestazionale e monitoraggio (Prometheus, Grafana);

  • Competenze in storage ad alte prestazioni, interfacce NVMe-oF, SAN/NAS, data management.

Soft Skills

  • Collaborazione cross-funzionale e orientamento al risultato;

  • Proattività, autonomia e attenzione alla qualità;

  • Esperienza in metodologie Agile (Scrum) e pratiche Lean/Kanban;

  • Flessibilità, problem solving e spirito di innovazione.

Competenze linguistiche
Buona conoscenza dell’inglese, scritto e parlato (B2).

Altro
Disponibilità a trasferte nazionali e internazionali.

Seniority:

Expert

Primary Location:

IT - Roma - Via Laurentina

Additional Locations:

IT - Genova - Fiumara

Contract Type:

Permanent

Hybrid Working:

Hybrid
Leonardo DRS
Leonardo DRS

0 applies

0 views

There are more than 50,000 engineering jobs:

Subscribe to membership and unlock all jobs

Engineering Jobs

60,000+ jobs from 4,500+ well-funded companies

Updated Daily

New jobs are added every day as companies post them

Refined Search

Use filters like skill, location, etc to narrow results

Become a member

🥳🥳🥳 452 happy customers and counting...

Overall, over 80% of customers chose to renew their subscriptions after the initial sign-up.

To try it out

For active job seekers

For those who are passive looking

Cancel anytime

Frequently Asked Questions

  • We prioritize job seekers as our customers, unlike bigger job sites, by charging a small fee to provide them with curated access to the best companies and up-to-date jobs. This focus allows us to deliver a more personalized and effective job search experience.
  • We've got over 200,000 jobs from 15,000+ vetted companies. No fake or sleazy jobs here!
  • We aggregate jobs from 15,000+ companies' career pages, so you can be sure that you're getting the most up-to-date and relevant jobs.
  • We're the only job board *for* software engineers, *by* software engineers… in case you needed a reminder! We add thousands of new jobs daily and offer powerful search filters just for you. 🛠️
  • Every single hour! We add 2,000-3,000 new jobs daily, so you'll always have fresh opportunities. 🚀
  • Typically, job searches take 3-6 months. EchoJobs helps you spend more time applying and less time hunting. 🎯
  • Check daily! We're always updating with new jobs. Set up job alerts for even quicker access. 📅

What Fellow Engineers Say