Sommario
Google ha ampliato il suo programma di ricompense per vulnerabilità (VRP) per coprire scenari di attacco specifici legati all’IA generativa. Questa mossa mira a incentivare la ricerca sulla sicurezza e la protezione dell’IA.
Dettagli sul programma di ricompense per vulnerabilità
Il programma di ricompense per vulnerabilità di Google, noto anche come bug bounty, retribuisce gli hacker etici che individuano e segnalano in modo responsabile le falle di sicurezza. Con l’emergere di nuove problematiche di sicurezza legate all’IA generativa, come il potenziale bias ingiusto o la manipolazione del modello, Google ha deciso di rivedere come le segnalazioni dovrebbero essere categorizzate e riportate.
Il ruolo dell’AI Red Team
Google si avvale delle scoperte del suo nuovo AI Red Team, un gruppo di hacker che simula vari avversari, dai governi agli hacktivist, per individuare le vulnerabilità nella tecnologia. Questo team ha recentemente condotto un esercizio per identificare le principali minacce alle tecnologie dietro prodotti di IA generativa come ChatGPT e Google Bard.
Tipi di attacchi identificati
Il team ha scoperto che i modelli di linguaggio di grandi dimensioni (LLMs) sono vulnerabili agli attacchi di prompt injection. Un hacker potrebbe utilizzare questo tipo di attacco per generare testi dannosi o offensivi o per divulgare informazioni sensibili. Hanno anche segnalato un altro tipo di attacco chiamato training-data extraction, che permette agli hacker di ricostruire esempi di addestramento per estrarre informazioni personali o password.
Ambito del VRP ampliato
Questi tipi di attacchi sono ora inclusi nel VRP ampliato di Google, insieme agli attacchi di manipolazione e furto del modello. Tuttavia, Google non offrirà ricompense per bug legati a problemi di copyright o estrazione di dati che ricostruiscono informazioni non sensibili o pubbliche.
Ricompense monetarie
Le ricompense varieranno in base alla gravità della vulnerabilità scoperta. Ad esempio, i ricercatori possono guadagnare fino a $31,337 per attacchi di command injection in applicazioni sensibili come Google Search o Google Play. Se le vulnerabilità riguardano app di minore priorità, la ricompensa massima è di $5,000. Nel 2022, Google ha pagato oltre $12 milioni in ricompense ai ricercatori di sicurezza.