Categorie
Tech

OpenAI lancia il web crawler GPTBot e affronta questioni di privacy

Tempo di lettura: 2 minuti. OpenAI presenta il suo nuovo strumento di web crawling, GPTBot, mentre affronta crescenti preoccupazioni sulla privacy e sul consenso.

Tempo di lettura: 2 minuti.

OpenAI, la nota azienda di intelligenza artificiale, ha lanciato “GPTBot”, un nuovo strumento di web crawling. Questa mossa arriva in un momento in cui l’azienda è al centro di dibattiti riguardo alle sue tattiche di raccolta dati, in particolare in relazione a questioni di copyright e consenso.

Dettagli sul GPTBot e le sue funzionalità

Un web crawler, talvolta chiamato spider web, è un tipo di bot che indicizza il contenuto dei siti web su internet. Motori di ricerca come Google e Bing li utilizzano per far apparire i siti web nei risultati di ricerca. OpenAI ha dichiarato che il web crawler raccoglierà dati pubblicamente disponibili dal web, ma escluderà fonti che richiedono contenuti a pagamento, sono noti per raccogliere informazioni personali identificabili o hanno testi che violano le sue politiche.

Il GPTBot di OpenAI potrebbe essere utilizzato per migliorare i futuri modelli ChatGPT. OpenAI ha anche annunciato che i proprietari di siti web possono bloccare il web crawler aggiungendo un comando “disallow” a un file standard sul server.

Controversie e preoccupazioni

Recentemente, sono emerse preoccupazioni riguardo alle tattiche di raccolta dati di OpenAI. L’ente di vigilanza sulla privacy del Giappone ha emesso un avvertimento a OpenAI riguardo alla raccolta di dati sensibili senza permesso. Inoltre, l’Italia ha temporaneamente vietato l’uso di ChatGPT, sostenendo che violasse varie leggi sulla privacy dell’Unione Europea.

A giugno, è stata presentata una class action contro OpenAI da 16 querelanti, sostenendo che l’azienda avesse accesso a informazioni private dalle interazioni degli utenti con ChatGPT. Se queste accuse dovessero essere confermate, OpenAI e Microsoft, citata come convenuta, violerebbero la Computer Fraud and Abuse Act.

Ulteriori sviluppi e risposta di OpenAI

OpenAI ha ora introdotto la possibilità per gli operatori di siti web di bloccare specificamente il suo crawler GPTBot. Questo potrebbe rappresentare il primo passo di OpenAI per permettere agli utenti di internet di scegliere se i loro dati possono essere utilizzati per addestrare i suoi grandi modelli linguistici.

Il dibattito sulla privacy e sul consenso ha guadagnato ulteriore attenzione negli ultimi tempi, con aziende come Adobe che hanno proposto l’idea di segnare i dati come non adatti all’addestramento attraverso una legge anti-impersonazione.

Pronto a supportare l'informazione libera?

Iscriviti alla nostra newsletter // Seguici gratuitamente su Google News
Exit mobile version