IA generativa: una minaccia per la privacy dei dati?

di Redazione
0 commenti
Aldebaran artificial intelligence finance c1893d77 dc3b 489c 92bb f3c133a588a8

L’Intelligenza Artificiale generativa, rappresentata da modelli come ChatGPT, sta diventando sempre più pervasiva. Sebbene possa offrire valore in termini di produttività aziendale e automazione, porta con sé rischi significativi, in particolare riguardo alla privacy dei contenuti e dei dati.

Il lato positivo dello scraping dei contenuti

Lo scraping dei contenuti, che utilizza bot per catturare e archiviare contenuti, ha indubbi vantaggi. Se combinato con il machine learning, può aiutare a ridurre i pregiudizi nelle notizie raccogliendo enormi quantità di dati dai siti web e valutando l’accuratezza e il tono dei contenuti. Queste tecniche possono anche aggregare rapidamente le informazioni, risparmiando sui costi e riducendo il tempo necessario per l’estrazione dei dati.

Il lato negativo dello scraping dei contenuti

Tuttavia, ci sono rischi significativi. Un esempio è stato evidente quando si è scoperto che il 75% del traffico di un sito di e-commerce globale era generato da bot, la maggior parte dei quali erano bot di scraping. Questi bot copiavano dati che potevano essere venduti sul Dark Web o utilizzati in modi potenzialmente dannosi, come la creazione di false identità o la promozione di informazioni errate.

L’area grigia

ChatGPT è addestrato su enormi quantità di dati raccolti da tutto il web, consentendogli di rispondere a una vasta gamma di domande. Questa attività apre la porta a problemi significativi. Ad esempio, un giornalista potrebbe vedere il proprio lavoro accuratamente ricercato e scritto essere “scraped” da ChatGPT senza attribuzione. Questo comporta la perdita di traffico sul sito originale, con conseguente perdita di autorità di dominio e potenziali entrate pubblicitarie.

E ora?

Se non si desidera che ChatGPT o altri strumenti di IA generativa si addestrino sui propri dati, è possibile bloccare il traffico dal bot Common Crawler, CCBot. Tuttavia, alcuni dei traffici generati dal plug-in ChatGPT provengono ora da bot sofisticati che possono impersonare il traffico umano. Un’altra opzione è mettere i contenuti dietro un paywall, ma ciò limita le visualizzazioni organiche e potrebbe infastidire i lettori.

Con l’evoluzione della tecnologia IA, le regole e le normative seguiranno. Le aziende dovranno decidere se consentire o meno la raccolta dei loro dati e cosa è considerato giusto per i chatbot IA. Coloro che desiderano escludersi dallo scraping dovranno rafforzare le loro difese in linea con l’evoluzione della tecnologia di scraping.


Matrice Digitale partecipa al Programma Affiliazione Amazon EU, un programma di affiliazione che consente ai siti di percepire una commissione pubblicitaria pubblicizzando e fornendo link al sito Amazon.it.