Categorie
Tech

OpenAI lancia data partnerships per dataset AI migliorati

Tempo di lettura: 2 minuti. OpenAI lancia Data Partnerships per set di dati AI più inclusivi e rappresentativi, mirando a modelli più utili e sicuri.

Tempo di lettura: 2 minuti.

Nell’era digitale, la qualità dei set di dati determina l’efficacia dei modelli di intelligenza artificiale (AI). OpenAI, riconoscendo le limitazioni degli attuali set di dati, ha annunciato un’iniziativa per collaborare con organizzazioni esterne per sviluppare nuovi set di dati più rappresentativi e meno viziati. Questo sforzo, denominato “Data Partnerships”, mira a riflettere meglio la diversità della società umana e a rendere i modelli AI più utili e sicuri per tutti.

Iniziativa per la diversità dei dati

La sfida di creare set di dati imparziali è complessa, come dimostrato da studi recenti che evidenziano la presenza di linguaggio tossico e pregiudizi nei dati di addestramento. OpenAI intende affrontare questi problemi raccogliendo dati su larga scala che includano una varietà di lingue, argomenti e formati, con un focus particolare sui dati che esprimono intenzioni umane, come scritti estesi o conversazioni.

Collaborazioni per il progresso

OpenAI non solo cerca di espandere la diversità dei dati attraverso il programma Data Partnerships ma si impegna anche a digitalizzare i dati di addestramento con strumenti come il riconoscimento ottico dei caratteri e il riconoscimento automatico della parola, garantendo la rimozione di informazioni sensibili o personali. La collaborazione con il Governo Islandese e Miðeind ehf per migliorare le capacità di GPT-4 in islandese e con il Free Law Project per affinare la comprensione dei documenti legali da parte dei modelli AI è solo l’inizio di un percorso ambizioso.

Un futuro AI inclusivo e utile

Con l’obiettivo di creare modelli AI che comprendano profondamente ogni materia, industria e cultura, OpenAI invita le organizzazioni a contribuire con i loro contenuti per arricchire l’apprendimento dei modelli. Il programma prevede la creazione di due tipi di set di dati: uno open source disponibile pubblicamente e set privati per modelli AI proprietari, bilanciando così le esigenze di privacy con il desiderio di migliorare la comprensione del dominio da parte dei modelli AI.

Considerazioni finali

Mentre OpenAI si impegna in questo nuovo capitolo, rimane da vedere se supererà le sfide che hanno ostacolato molti esperti mondiali nella minimizzazione dei pregiudizi nei set di dati. La trasparenza nel processo sarà cruciale, così come lo sarà l’approccio alle sfide incontrate nella creazione di questi set di dati. Nonostante le motivazioni commerciali che possono sottendere a queste iniziative, l’importanza di un AI che serve equamente l’umanità rimane un obiettivo primario per OpenAI.

Di Livio Varriale

Giornalista e scrittore: le sue specializzazioni sono in Politica, Crimine Informatico, Comunicazione Istituzionale, Cultura e Trasformazione digitale. Autore del saggio sul Dark Web e il futuro della società digitale “La prigione dell’umanità” e di “Cultura digitale”. Appassionato di Osint e autore di diverse ricerche pubblicate da testate Nazionali. Attivista contro l’abuso dei minori, il suo motto è “Coerenza, Costanza, CoScienza”.

Pronto a supportare l'informazione libera?

Iscriviti alla nostra newsletter // Seguici gratuitamente su Google News
Exit mobile version