Evento 15 maggio 2026 · 6 min di lettura

Uno sguardo a Devoxx France: basta notti insonni — come l'IA trasforma le nostre reperibilità DevOps

nAIghts Watch presentato a Devoxx France

Sono le 3:00 di notte. Scatta l'allarme. Non è un'interruzione critica — solo un disco pieno, un picco di carico della CPU o un microservizio capriccioso. Eppure un ingegnere reperibile deve svegliarsi, collegarsi all'infrastruttura e analizzare le metriche. Il risultato: un'ora di sonno persa per un'azione banale e decine di minuti di downtime per il cliente.

E se un'intelligenza artificiale sovrana potesse diagnosticare, intervenire e documentare questo incidente prima ancora che il vostro ingegnere apra gli occhi?

È esattamente la rivoluzione tecnologica che abbiamo presentato a Devoxx France, la più grande conferenza indipendente per sviluppatori d'Europa. Davanti a un pubblico di esperti tecnici, Jean-Philippe Fourès, il nostro VP Product di Iguana Solutions, ha presentato nAIghts Watch: la nostra soluzione AIOps progettata per trasformare radicalmente le reperibilità DevOps.

Il vero costo di un incidente IT: il tempo di indagine

Come fornitore di hosting e servizi gestiti che opera un gran numero di server eterogenei per clienti critici, affrontiamo la stessa sfida di qualsiasi team SRE: la gestione, dispendiosa in termini di tempo, degli allarmi di «livello 1».

In genere, il ciclo di vita di questo tipo di incidente dura tra i 45 minuti e 1 ora. Il vero collo di bottiglia non risiede nella complessità tecnica del guasto, ma nei primi 25-30 minuti di latenza incomprimibile:

  • svegliare l'ingegnere reperibile,
  • prendere in carico l'allarme,
  • collegarsi in modo sicuro ai server,
  • raccogliere e analizzare manualmente log e metriche.

Durante questa mezz'ora, il servizio resta indisponibile, con un impatto diretto sul business. È stato per eliminare questo tempo morto — e per risparmiare ai nostri team l'esaurimento — che abbiamo sviluppato nAIghts Watch.

nAIghts Watch: l'AIOps al servizio dell'indagine

Per risolvere questo problema, i nostri team hanno sviluppato un sistema AIOps basato su un'architettura multi-agente all'avanguardia. Anziché annegare una singola IA in un contesto troppo ampio rischiando le allucinazioni, abbiamo suddiviso il carico di lavoro:

  • L'Agente Metriche: raccoglie e analizza l'ultima ora di dati dai nostri sistemi (Prometheus, VictoriaMetrics).
  • L'Agente Log: lavora in parallelo per estrarre e analizzare i flussi di log tramite Fluentd o Loki.
  • Il Giudice (Super Agente): unisce i due report, prende una decisione, stabilisce una diagnosi e genera un report completo di analisi delle cause profonde (RCA).

Non appena viene aperto un ticket di incidente nel nostro Jira, l'IA si attiva automaticamente. Il risultato: quando il nostro ingegnere reperibile si collega, l'indagine è già conclusa e un report chiaro lo attende su Slack.

Sicurezza assoluta e IA di infrastruttura sovrana

In Iguana Solutions, la riservatezza dei dati dei nostri clienti è una linea rossa. Affidare le chiavi della produzione a un'intelligenza artificiale richiede garanzie che le API di cloud pubblico semplicemente non potevano offrirci.

Il nostro impegno: i vostri dati restano da noi. Abbiamo fatto la scelta strategica di implementare un'IA di infrastruttura sovrana. Ci affidiamo ai nostri modelli a pesi aperti (come Qwen) ospitati direttamente sui nostri cluster GPU H200 privati. Inoltre, nAIghts Watch opera entro un quadro rigorosamente definito dai nostri SRE:

  • nessun accesso SSH diretto né esecuzione di comandi shell arbitrari,
  • l'IA interagisce con i server tramite un server MCP (Model Context Protocol) interno,
  • vengono esposte solo funzioni pre-validate e altamente mirate (per lo più in sola lettura, con rarissime azioni di remediation consentite, come il riavvio di un servizio specifico).

L'alleanza tra i nostri SRE e l'intelligenza artificiale opera sotto totale controllo umano.

Risultati misurabili per i nostri team e clienti

L'implementazione di nAIghts Watch ha avuto un impatto spettacolare sulle nostre operazioni di reperibilità:

Tipologia di incidente Tempo di gestione iniziale Tempo con nAIghts Watch
Risoluzione autonoma (Livello 1) 60 minuti da 3 a 7 minuti
Risoluzione assistita (Umano + IA) 60 minuti 23 minuti

I benefici osservati in Iguana Solutions:

  • 80% di riduzione degli allarmi notturni inutili.
  • 350 ore risparmiate al mese nella gestione degli allarmi ripetitivi.
  • Documentazione premium: ogni incidente, anche quelli minori, genera ora un report completo per i nostri clienti.

Contrariamente a quanto si crede, l'obiettivo di Iguana Solutions non è assolutamente eliminare posti di lavoro (anzi, stiamo assumendo attivamente!). Il nostro obiettivo è eliminare il lavoro tedioso. Invece di essere sfiniti dagli allarmi delle 3 di notte, i nostri ingegneri dedicano le loro energie all'innovazione, all'architettura e al supporto dei nostri clienti.

Andare oltre con Iguana Solutions

Curiosi di scoprire come l'IA può ridefinire i vostri standard di produzione?

  • 📺 Rivivi l'intera conferenza di Devoxx France: scopri i dettagli tecnici della nostra implementazione e i nostri benchmark esclusivi guardando il video della presentazione su YouTube. Guarda su YouTube →
  • ⚙️ Scopri la soluzione tecnica: approfondisci le nostre capacità AIOps nella pagina dedicata a nAIghts Watch. Esplora nAIghts Watch →
  • 🚀 Trasforma le tue reperibilità: vuoi sapere come questa IA sovrana può integrarsi nel tuo sistema informativo, o cerchi di entrare in un team tecnico all'avanguardia? Contatta i nostri esperti Iguana Solutions →

Pronto a Trasformare le Tue Reperibilità?

Contatta il nostro team per scoprire come nAIghts Watch e l'AIOps sovrano possono trasformare le tue operazioni.

Contattaci