OpenAI presenta Aardvark, un nuovo agente AI progettato per individuare e correggere vulnerabilità software in modo autonomo e scalabile. Basato su GPT-5 e integrato con il motore Codex, Aardvark agisce come un vero e proprio ricercatore di sicurezza virtuale, in grado di leggere, comprendere e migliorare il codice sorgente. Lo strumento, in sviluppo da mesi e ora in beta privata, rappresenta il passo più concreto di OpenAI verso l’automazione completa della cyber difesa del software, un ambito in cui le falle superano le 40.000 CVE all’anno.
Cosa leggere
Funzionalità principali di Aardvark
Aardvark monitora in tempo reale i repository GitHub e altri ambienti di sviluppo, analizzando ogni commit alla ricerca di vulnerabilità potenziali. L’agente non si limita a segnalare i problemi, ma ne valuta l’exploitabilità in sandbox isolate, riducendo drasticamente i falsi positivi. Ogni vulnerabilità viene classificata per gravità e impatto, con annotazioni automatiche sul codice che facilitano la revisione da parte dei team umani.

Aardvark utilizza GPT-5 per il ragionamento e Codex per generare automaticamente le patch. Queste correzioni possono essere applicate con un solo clic, previa verifica manuale, senza interrompere il flusso di lavoro. Oltre ai bug di sicurezza, l’agente individua errori logici, fix incompleti e problemi di privacy nei test. Le sue analisi multilivello coprono tanto i progetti interni di OpenAI quanto repository open-source, sui quali l’azienda prevede di offrire scansioni gratuite pro-bono per supportare la sicurezza della comunità.
Architettura e pipeline multi-stadio
La struttura di Aardvark si basa su una pipeline multi-stadio che simula il metodo di lavoro di un ricercatore umano:
- Creazione di un modello di minaccia per ogni progetto, basato sugli obiettivi di sicurezza dichiarati.
- Analisi dello storico del repository per individuare cambiamenti sospetti o pattern ricorrenti.
- Validazione delle vulnerabilità in sandbox isolate, per verificare se il bug è realmente sfruttabile.
- Generazione della patch automatica tramite Codex, corredata di spiegazione tecnica e test sintetici.
- Integrazione diretta con GitHub, che consente di mantenere i workflow esistenti e ricevere suggerimenti senza interrompere la pipeline CI/CD.
 Questa architettura, alimentata dal ragionamento multimodale di GPT-5, permette ad Aardvark di leggere, analizzare, scrivere test, eseguire codice e correggerlo, superando i limiti dei metodi tradizionali come fuzzing o static analysis.
Benchmark e prestazioni
OpenAI ha testato Aardvark su una vasta suite di benchmark reali e sintetici, ottenendo un tasso di identificazione del 92% delle vulnerabilità note. Il sistema ha già scoperto dieci nuove CVE in progetti open-source analizzati internamente, tutte gestite secondo una policy di disclosure responsabile aggiornata per favorire la collaborazione con i vendor.
Durante i test, Aardvark ha dimostrato capacità di riconoscere pattern di vulnerabilità complesse come race condition, SQL injection e bug di autenticazione in architetture distribuite. La validazione sandbox ha garantito un abbattimento dei falsi positivi e un miglioramento della precisione rispetto ai sistemi di analisi statica tradizionali.
Impatto sulla cybersecurity
Con Aardvark, OpenAI inaugura l’era dell’AI agentica applicata alla sicurezza software. L’agente consente ai team di sviluppo di scalare le attività di code review e threat modeling, mantenendo velocità di sviluppo e standard di sicurezza elevati. La piattaforma trasforma la difesa in un processo continuo: ogni commit, ogni merge e ogni pull request viene analizzato in tempo reale, con risultati integrati nel ciclo DevSecOps. Gli sviluppatori ricevono insight immediati, patch verificabili e spiegazioni tecniche chiare, senza la necessità di esperti di sicurezza dedicati a tempo pieno. Secondo OpenAI, l’obiettivo è invertire l’equilibrio tra difensori e attaccanti, riducendo i tempi di rilevamento da giorni a minuti e abilitando la prevenzione automatizzata delle vulnerabilità prima che raggiungano la produzione.
Disponibilità e roadmap
La beta privata di Aardvark è iniziata il 30 ottobre 2025, con accesso riservato a un gruppo selezionato di partner aziendali. Le organizzazioni interessate possono presentare domanda online, mentre i progetti open-source non commerciali potranno beneficiare di scansioni gratuite pro-bono.
OpenAI prevede un’espansione graduale nel 2026, introducendo nuove feature come:
- Analisi interlinguaggio per progetti multi-stack (Python, Rust, Go, C++).
- Integrazione con ambienti cloud come AWS CodeCommit e GitLab.
- Dashboard di rischio basate su priorità AI-driven.
- Supporto nativo per policy compliance (NIST, ISO/IEC 27001).
 Con l’aumento delle vulnerabilità annuali e il 1,2% dei commit contenenti bug di sicurezza, Aardvark si propone come strumento chiave per la resilienza software, destinato a diventare parte integrante dei workflow di sviluppo globale.
Prospettive future
L’introduzione di Aardvark segna il passaggio da una sicurezza reattiva a una difesa predittiva e autonoma, in cui l’intelligenza artificiale non solo segnala i problemi ma li risolve. OpenAI punta a un ecosistema di agenti AI cooperativi, capaci di scoprire, correggere e documentare vulnerabilità in sinergia con gli sviluppatori umani. La roadmap prevede anche l’apertura di un programma bug bounty AI-driven, in cui Aardvark contribuirà all’identificazione automatica delle vulnerabilità in software di terze parti, con validazione indipendente.
 
			         
			         
														