Generazione di dati di rete sintetici e privacy-preserving con AI per NIDS

da Lorenzo De Santis matricedigitale.it
0 commenti 2 minuti leggi

La ricerca a cura di Giuseppe Aceto, Fabio Giampaolo, Ciro Guida, Stefano Izzo, Antonio Pescapè, Francesco Piccialli, Edoardo Prezioso, intitolata “Synthetic and Privacy-Preserving Traffic Trace Generation Using Generative AI Models for Training Network Intrusion Detection Systems” presenta un modello innovativo per generare tracce di traffico di rete sintetiche preservando la privacy, utilizzando modelli di intelligenza artificiale. Questo approccio risponde alle sfide di ottenere grandi quantità di dati etichettati necessari per l’addestramento efficace dei Sistemi di Rilevamento delle Intrusioni di Rete (NIDS).

Introduzione e Motivazioni

image 212
Generazione di dati di rete sintetici e privacy-preserving con AI per NIDS 8

Con la crescente interconnessione di dispositivi eterogenei e l’uso pervasivo dei servizi Internet, i NIDS sono diventati fondamentali per proteggere le reti dai cyberattacchi. Tuttavia, l’addestramento efficace dei NIDS richiede grandi quantità di dati di traffico etichettati, che sono difficili da ottenere a causa dei costi e delle preoccupazioni sulla privacy.

Modello Proposto

L’approccio presentato utilizza un Conditional Variational Autoencoder (CVAE) per generare tracce di traffico sintetiche a partire da dati reali. Il CVAE è progettato per preservare la privacy introducendo rumore non reversibile nei dati durante la fase di pre-processing, eliminando indirizzi IP e porte di trasporto dai dati di addestramento.

Valutazione

image 211
Generazione di dati di rete sintetici e privacy-preserving con AI per NIDS 9

La validità del modello è stata testata utilizzando tre dataset pubblicamente disponibili: Aposemat IoT-23, CSE-CIC-IDS2018 e Kitsune Network Attack Dataset. I risultati mostrano che i dati sintetici generati dal CVAE sono rappresentativi dei dati reali e che l’addestramento dei NIDS con questi dati preserva la privacy senza compromettere significativamente le prestazioni di classificazione.

Risultati

Il modello CVAE ha dimostrato di essere efficace nel generare dati sintetici che mantengono la qualità e la variabilità dei dati reali. Le metriche di valutazione, tra cui la Jensen-Shannon Divergence e lo score di overlapping, indicano che i dati sintetici sono simili ai dati reali senza ripetere pattern di dati originali.

L’approccio descritto nell’articolo rappresenta un avanzamento significativo nella generazione di dataset sintetici per l’addestramento dei NIDS, risolvendo problemi di privacy e scarsità di dati. La generazione di dati sintetici tramite CVAE offre un’alternativa efficace ai metodi tradizionali, garantendo una formazione robusta dei NIDS in modo privacy-preserving.

Si può anche come

MatriceDigitale.it – Copyright © 2024, Livio Varriale – Registrazione Tribunale di Napoli n° 60 del 18/11/2021. – P.IVA IT10498911212 Privacy Policy e Cookies

Developed with love by Giuseppe Ferrara