Generazione di dati di rete sintetici e privacy-preserving con AI per NIDS

di Lorenzo De Santis matricedigitale.it Pubblicato: 1 anno fa

scritto da Lorenzo De Santis matricedigitale.it Pubblicato: 1 anno fa 0 commenti 2 minuti di lettura

Sommario

La ricerca a cura di Giuseppe Aceto, Fabio Giampaolo, Ciro Guida, Stefano Izzo, Antonio Pescapè, Francesco Piccialli, Edoardo Prezioso, intitolata “Synthetic and Privacy-Preserving Traffic Trace Generation Using Generative AI Models for Training Network Intrusion Detection Systems” presenta un modello innovativo per generare tracce di traffico di rete sintetiche preservando la privacy, utilizzando modelli di intelligenza artificiale. Questo approccio risponde alle sfide di ottenere grandi quantità di dati etichettati necessari per l’addestramento efficace dei Sistemi di Rilevamento delle Intrusioni di Rete (NIDS).

Introduzione e Motivazioni

Generazione di dati di rete sintetici e privacy-preserving con AI per NIDS 8

Con la crescente interconnessione di dispositivi eterogenei e l’uso pervasivo dei servizi Internet, i NIDS sono diventati fondamentali per proteggere le reti dai cyberattacchi. Tuttavia, l’addestramento efficace dei NIDS richiede grandi quantità di dati di traffico etichettati, che sono difficili da ottenere a causa dei costi e delle preoccupazioni sulla privacy.

Modello Proposto

L’approccio presentato utilizza un Conditional Variational Autoencoder (CVAE) per generare tracce di traffico sintetiche a partire da dati reali. Il CVAE è progettato per preservare la privacy introducendo rumore non reversibile nei dati durante la fase di pre-processing, eliminando indirizzi IP e porte di trasporto dai dati di addestramento.

Valutazione

Generazione di dati di rete sintetici e privacy-preserving con AI per NIDS 9

La validità del modello è stata testata utilizzando tre dataset pubblicamente disponibili: Aposemat IoT-23, CSE-CIC-IDS2018 e Kitsune Network Attack Dataset. I risultati mostrano che i dati sintetici generati dal CVAE sono rappresentativi dei dati reali e che l’addestramento dei NIDS con questi dati preserva la privacy senza compromettere significativamente le prestazioni di classificazione.

Risultati

Il modello CVAE ha dimostrato di essere efficace nel generare dati sintetici che mantengono la qualità e la variabilità dei dati reali. Le metriche di valutazione, tra cui la Jensen-Shannon Divergence e lo score di overlapping, indicano che i dati sintetici sono simili ai dati reali senza ripetere pattern di dati originali.

L’approccio descritto nell’articolo rappresenta un avanzamento significativo nella generazione di dataset sintetici per l’addestramento dei NIDS, risolvendo problemi di privacy e scarsità di dati. La generazione di dati sintetici tramite CVAE offre un’alternativa efficace ai metodi tradizionali, garantendo una formazione robusta dei NIDS in modo privacy-preserving.

cybersecurity deep learning

Lorenzo De Santis matricedigitale.it

Sono uno psicologo clinico specializzando in psicoterapia sistemica familiare. Mi occupo di attività di orientamento scuola-università, mentoring scolastico e terapie individuali/coppia/familiari. Appassionato di intelligenza artificiale e reti neurali.

Generazione di dati di rete sintetici e privacy-preserving con AI per NIDS

Introduzione e Motivazioni

Modello Proposto

Valutazione

Risultati

Lorenzo De Santis matricedigitale.it

Articoli correlati

OpenAI, Google e Anthropic: l’intelligenza artificiale riscrive l’istruzione...

Grok 4 conquista il podio nella sfida tra...

OpenAI innova ChatGPT con stili AI e browser...

xAI ambisce a valutazione record con Grok 4

Grok 4 rivoluziona xAI e Linda Yaccarino si...

OpenAI, acquisizione di io e progetto browser AI:...