aldebaran33 web3 decentralized internet blockchain d0215c81 3a08 4d7a 9c87 7b975b146a72

Generazione di dati di rete sintetici e privacy-preserving con AI per NIDS

La ricerca a cura di Giuseppe Aceto, Fabio Giampaolo, Ciro Guida, Stefano Izzo, Antonio Pescapè, Francesco Piccialli, Edoardo Prezioso, intitolata “Synthetic and Privacy-Preserving Traffic Trace Generation Using Generative AI Models for Training Network Intrusion Detection Systems” presenta un modello innovativo per generare tracce di traffico di rete sintetiche preservando la privacy, utilizzando modelli di intelligenza artificiale. Questo approccio risponde alle sfide di ottenere grandi quantità di dati etichettati necessari per l’addestramento efficace dei Sistemi di Rilevamento delle Intrusioni di Rete (NIDS).

Annuncio

Introduzione e Motivazioni

image 212
Generazione di dati di rete sintetici e privacy-preserving con AI per NIDS 5

Con la crescente interconnessione di dispositivi eterogenei e l’uso pervasivo dei servizi Internet, i NIDS sono diventati fondamentali per proteggere le reti dai cyberattacchi. Tuttavia, l’addestramento efficace dei NIDS richiede grandi quantità di dati di traffico etichettati, che sono difficili da ottenere a causa dei costi e delle preoccupazioni sulla privacy.

Modello Proposto

L’approccio presentato utilizza un Conditional Variational Autoencoder (CVAE) per generare tracce di traffico sintetiche a partire da dati reali. Il CVAE è progettato per preservare la privacy introducendo rumore non reversibile nei dati durante la fase di pre-processing, eliminando indirizzi IP e porte di trasporto dai dati di addestramento.

Valutazione

image 211
Generazione di dati di rete sintetici e privacy-preserving con AI per NIDS 6

La validità del modello è stata testata utilizzando tre dataset pubblicamente disponibili: Aposemat IoT-23, CSE-CIC-IDS2018 e Kitsune Network Attack Dataset. I risultati mostrano che i dati sintetici generati dal CVAE sono rappresentativi dei dati reali e che l’addestramento dei NIDS con questi dati preserva la privacy senza compromettere significativamente le prestazioni di classificazione.

Risultati

Il modello CVAE ha dimostrato di essere efficace nel generare dati sintetici che mantengono la qualità e la variabilità dei dati reali. Le metriche di valutazione, tra cui la Jensen-Shannon Divergence e lo score di overlapping, indicano che i dati sintetici sono simili ai dati reali senza ripetere pattern di dati originali.

Annuncio

L’approccio descritto nell’articolo rappresenta un avanzamento significativo nella generazione di dataset sintetici per l’addestramento dei NIDS, risolvendo problemi di privacy e scarsità di dati. La generazione di dati sintetici tramite CVAE offre un’alternativa efficace ai metodi tradizionali, garantendo una formazione robusta dei NIDS in modo privacy-preserving.

Iscriviti alla Newsletter

Non perdere le analisi settimanali: Entra nella Matrice Digitale.

Matrice Digitale partecipa al Programma Affiliazione Amazon EU. In qualità di Affiliato Amazon, ricevo un guadagno dagli acquisti idonei. Questo non influenza i prezzi per te.

Torna in alto