Connect with us

Intelligenza Artificiale

OpenAI aiuta a scoprire immagini ed audio AI

Tempo di lettura: 2 minuti. Scopri come OpenAI sta avanzando nella tecnologia di rilevamento delle immagini e nel watermarking audio per garantire la trasparenza

Pubblicato

in data

OpenAI aiuta a scoprire immagini ed audio AI
Tempo di lettura: 2 minuti.

OpenAI ha annunciato l’introduzione di nuovi strumenti per rilevare se immagini o tracce audio sono state generate dalla sua Intelligenza artificiale, DALL-E, e ha introdotto nuovi metodi di watermarking per contrassegnare più chiaramente i contenuti generati dall’IA.

Dettagli degli strumenti

Classificatore di Immagini: OpenAI ha sviluppato un classificatore che utilizza l’IA per determinare se una foto è stata generata dall’IA. Questo strumento predice la probabilità che un’immagine sia stata creata da DALL-E 3 con una precisione del 98%, anche se l’immagine è stata ritagliata, compressa o modificata nella saturazione.

Watermarking Audio: Insieme al classificatore, OpenAI ha introdotto un watermark resistente alle manomissioni che può etichettare contenuti audio con segnali invisibili. Questo è particolarmente utile per tracciare l’autenticità dei contenuti audio generati.

Prestazioni e Limitazioni: Mentre il classificatore funziona bene con le immagini generate da DALL-E 3, la sua efficacia nel rilevare immagini prodotte da altri modelli di IA è inferiore, riuscendo a identificare solo tra il 5 e il 10% delle immagini generate da altre piattaforme come Midjourney.

Implementazione di Watermarking

OpenAI ha già implementato i “content credentials” nei metadati delle immagini attraverso la Coalition of Content Provenance and Authority (C2PA), di cui fanno parte anche Microsoft e Adobe. Questo mese, OpenAI si è anche unita al comitato direttivo della C2PA, rafforzando il suo impegno nel fornire trasparenza sulla provenienza dei contenuti AI.

Progetti Futuri e Feedback: I nuovi watermark audio sono già stati aggiunti ai clip prodotti da Voice Engine, la piattaforma di sintesi vocale di OpenAI. Tuttavia, sia il classificatore di immagini sia il watermarking audio sono ancora in fase di perfezionamento e OpenAI sta cercando feedback dagli utenti per testarne l’efficacia.

Contesto Storico: OpenAI ha una lunga storia nello sviluppo di strumenti per il rilevamento di contenuti generati dall’IA, sebbene nel 2023 abbia terminato un programma per l’identificazione di testi scritti dall’IA a causa della bassa accuratezza del classificatore di testi.

Implicazioni

Questi sviluppi non solo aiutano a mantenere l’integrità e la trasparenza nell’uso delle tecnologie di generazione di contenuti IA, immagini ed audio, ma forniscono anche strumenti essenziali per gli utenti e i creatori di contenuti per verificare l’autenticità e la provenienza dei materiali che consumano o producono. Questi strumenti rappresentano un passo significativo verso un maggiore controllo e comprensione dei contenuti generati dall’IA, cruciali in un’era dove la distinzione tra contenuto reale e sintetico diventa sempre più sfumata.

Intelligenza Artificiale

Perché l’analisi del sentiment necessita di rilevare il sarcasmo?

Tempo di lettura: 2 minuti. Scopri come un nuovo algoritmo multimodale sviluppato dall’Università di Groningen migliora il rilevamento del sarcasmo, integrando analisi del testo, riconoscimento delle emozioni e emoticon.

Pubblicato

in data

Tempo di lettura: 2 minuti.

Oscar Wilde una volta disse che il sarcasmo è la forma più bassa di spirito, ma la più alta forma di intelligenza; nessun algoritmo però vi è arrivato a riconoscerlo. Questa affermazione riflette la complessità nell’uso e nella comprensione del sarcasmo, noto per essere difficile da trasmettere correttamente anche di persona, e ancor più tramite testo. Le sottili variazioni di tono che indicano il sarcasmo possono facilmente confondere sia gli esseri umani che gli algoritmi informatici, limitando l’efficacia degli assistenti virtuali e degli strumenti di analisi dei contenuti.

Nuovo approccio multimodale per il rilevamento del sarcasmo

Xiyuan Gao, Shekhar Nayak e Matt Coler del Laboratorio di Tecnologia del Parlato presso l’Università di Groningen, Campus Fryslân, hanno sviluppato un algoritmo multimodale per migliorare il rilevamento del sarcasmo, analizzando vari aspetti delle registrazioni audio per aumentare la precisione. Gao ha presentato il loro lavoro il 16 maggio 2024, come parte di una riunione congiunta della Società Acustica d’America e dell’Associazione Acustica Canadese.

Caratteristiche dell’algoritmo

L’algoritmo si basa su due approcci complementari: l’analisi del sentimento utilizzando il testo e il riconoscimento delle emozioni tramite l’audio. Questo metodo integrato permette di ottenere una visione più completa del sarcasmo espresso nel parlato umano.

  1. Parametri acustici: Il team ha estratto parametri come tono, velocità del parlato ed energia dal discorso.
  2. Trascrizione del parlato: Utilizzando il riconoscimento automatico del parlato, il discorso è stato trascritto in testo per l’analisi del sentimento.
  3. Integrazione degli emoticon: Ad ogni segmento del discorso sono stati assegnati emoticon che riflettono il contenuto emotivo.

Combinando questi segnali multimodali in un algoritmo di machine learning, l’approccio sfrutta i punti di forza delle informazioni uditive e testuali insieme agli emoticon per un’analisi completa.Fonte: Acoustics.org

Potenziali miglioramenti e applicazioni future

Il team è ottimista riguardo alle prestazioni dell’algoritmo, ma sta già cercando modi per migliorarlo ulteriormente. Gao ha sottolineato l’importanza di integrare meglio le espressioni e i gesti che evidenziano gli elementi sarcastici nel parlato e l’obiettivo di includere più lingue e adottare tecniche emergenti di riconoscimento del sarcasmo.

Questo approccio può essere utilizzato non solo per identificare il sarcasmo, ma anche in molti altri campi:

  • Analisi del sentiment: Tradizionalmente focalizzata sul testo, può beneficiare del riconoscimento del sarcasmo per applicazioni come la rilevazione di discorsi di odio online e l’estrazione delle opinioni dei clienti.
  • Riconoscimento delle emozioni: Basato sul parlato, può essere applicato all’assistenza sanitaria assistita dall’intelligenza artificiale.

Prosegui la lettura

Intelligenza Artificiale

Android 15 integra Gemini AI: nuove funzionalità e miglioramenti

Tempo di lettura: 2 minuti. Google integra Gemini AI in Android 15, con nuove funzionalità di ricerca, assistente contestuale e miglioramenti on-device per privacy e efficienza

Pubblicato

in data

Android 15 logo
Tempo di lettura: 2 minuti.

Google ha annunciato una serie di nuove funzionalità AI integrate nel sistema operativo Android 15, offrendo uno sguardo su cosa dovrà competere il sistema operativo dell’iPhone di Apple entro la fine dell’anno. Android 15 è stato progettato con l’IA al suo centro, e Gemini rappresenta una parte fondamentale dell’esperienza Android a livello di sistema.

Caratteristiche principali di Gemini AI su Android 15

Barra di ricerca AI e Circle to Search

Una delle nuove funzionalità è una barra di ricerca alimentata dall’IA che può essere utilizzata per rispondere a domande e cercare informazioni. La funzione Circle to Search permette di risolvere problemi di matematica e fisica o di ottenere aiuto con i compiti.

Assistente AI contestuale

Gemini serve come assistente AI su Android, sostituendo Google Assistant. Questo assistente può essere richiamato come overlay su qualsiasi app in uso, offrendo supporto contestuale in tempo reale. Può creare immagini per testi e social media, rispondere a domande su video in riproduzione, interpretare PDF, siti web e altri contenuti, fornendo riassunti e traduzioni.

Privacy e elaborazione on-device

Google utilizza l’IA on-device per alcune funzionalità al fine di mantenere i dati sensibili privati, simile alla strategia di Apple. Gemini Nano, l’IA on-device di Google, genera risposte intelligenti nelle app di messaggistica e riassume memo vocali. Gemini Nano con Multimodalità arriverà sui telefoni Pixel entro la fine dell’anno, introducendo nuove funzionalità come TalkBack per aiutare utenti ciechi e ipovedenti a interpretare meglio il mondo circostante. Un’altra funzione in sviluppo è lo screening delle chiamate, che ascolta attivamente le chiamate e avvisa gli utenti se sembrano truffe.

Modelli Gemini 1.5 Flash e Pro

Google ha anche annunciato Gemini 1.5 Flash, una versione leggera del modello AI Gemini Pro. Gemini Flash è più efficiente, meno costoso e ha una latenza inferiore, ideale per distribuzioni su larga scala. Questo modello eccelle in riassunti, applicazioni di chat, didascalie di immagini e video, e estrazione di dati da documenti lunghi.

Gemini 1.5 Pro è stato migliorato e può seguire istruzioni sempre più complesse e sfumate, inclusa l’interpretazione di documenti fino a 1.500 pagine o un’ora di contenuti video. Gli utenti possono interagire con Gemini in Google Messages, e gli abbonati a Gemini Advanced possono sperimentare una nuova esperienza conversazionale mobile.

Project Astra

Project Astra è un altro sforzo di Google che si concentra su agenti AI utili nella vita quotidiana. Durante una demo, Google ha mostrato prototipi di agenti in grado di identificare oggetti, fornire contesto sulle informazioni dalla fotocamera e richiamare una sequenza temporale di eventi per trovare un oggetto perso.

Prossimi annunci

Google fornirà ulteriori informazioni sulle nuove funzionalità in arrivo su Android 15 entro questa settimana.

Prosegui la lettura

Intelligenza Artificiale

Perchè Google ha chiamato la sua AI “Gemini”?

Tempo di lettura: 2 minuti. Google spiega l’origine del nome “Gemini” per le sue funzionalità AI, ispirato alla mitologia greca, alla costellazione dei Gemelli e al Project Gemini della NASA.

Pubblicato

in data

Gemini AI
Tempo di lettura: 2 minuti.

Dal Google I/O 2023, “Gemini” è diventato il nome che raggruppa tutte le funzionalità AI di Google. Questa settimana, Google ha ufficialmente spiegato l’origine del nome.

Origini e significato del nome “Gemini”

Inizialmente, il progetto aveva il nome provvisorio “Titan”, ispirato alla mitologia greca e alla luna più grande di Saturno. Tuttavia, Jeff Dean, co-leader tecnico di Gemini, non era un grande fan di questo nome, ma esso gli ha dato l’idea di un nome legato allo spazio.

Così, Google ha scelto “Gemini”, che in latino significa “gemelli”. In astronomia, Gemelli è una costellazione associata ai gemelli mitologici greci Castore e Polluce, i cui nomi sono stati dati alle sue due stelle più brillanti. Questo significato duplice si adattava perfettamente al modello AI di Google.

Il team di Google ha trovato che la personalità duale del segno zodiacale dei Gemelli, capace di adattarsi rapidamente, connettersi con un’ampia gamma di persone e vedere le cose da molteplici prospettive, fosse ideale per il momento in cui Google stava unendo i team di DeepMind e Google Research “Brain”.

L’importanza della collaborazione tra i team

Jeff Dean ha spiegato che lo sforzo di Gemini è nato dal desiderio di avvicinare i team che lavoravano sulla modellazione del linguaggio. La metafora dei gemelli rappresentava bene questa fusione: i membri del team legacy di Brain e di DeepMind hanno iniziato a lavorare insieme su questo ambizioso progetto multimodale.

Riferimento al Project Gemini della NASA

Il nome “Gemini” è anche un omaggio al Project Gemini della NASA, attivo dal 1965 al 1968, che ha testato tecnologie cruciali per il successo del programma Apollo. Oriol Vinyals, co-leader tecnico, ha trovato che l’enorme sforzo richiesto per l’addestramento dei modelli linguistici di grandi dimensioni risuonava con lo spirito dei lanci di razzi del Project Gemini.

Evoluzione e denominazione dei modelli

Google ha anche considerato di dare ai modelli nomi di stelle, ma attualmente i nomi utilizzati sono Nano, Flash, Pro e Ultra. L’intervista ha rivelato che la decisione di utilizzare “Gemini” anche come nome per le funzionalità AI visibili agli utenti è stata presa per trasmettere il continuo miglioramento, la creatività e l’innovazione che i team di ricerca di Google porteranno direttamente agli utenti.

Prosegui la lettura

Facebook

CYBERSECURITY

D-Link EXO AX4800 D-Link EXO AX4800
Sicurezza Informatica1 giorno fa

Vulnerabilità RCE zero-day nei router D-Link EXO AX4800

Tempo di lettura: 2 minuti. Un gruppo di ricercatori di SSD Secure Disclosure ha scoperto una vulnerabilità critica nei router...

SEC logo SEC logo
Sicurezza Informatica1 giorno fa

SEC: “notificare la violazione dei dati entro 30 giorni”

Tempo di lettura: 2 minuti. La SEC richiede alle istituzioni finanziarie di notificare le violazioni dei dati agli individui interessati...

Sicurezza Informatica2 giorni fa

Microsoft Azure: autenticazione multi-fattore (MFA) obbligatoria da luglio 2024

Tempo di lettura: 2 minuti. Microsoft inizierà a imporre l'autenticazione multi-fattore (MFA) per gli utenti di Azure a partire da...

Sicurezza Informatica2 giorni fa

USA arrestati sospetti dietro schema riciclaggio da 73 milioni

Tempo di lettura: 2 minuti. Gli Stati Uniti arrestano due sospetti accusati di guidare uno schema di riciclaggio di $73...

quick assist quick assist
Sicurezza Informatica3 giorni fa

Quick Assist di Microsoft sfruttato per ingegneria sociale

Tempo di lettura: 2 minuti. Storm-1811 sfrutta Quick Assist di Microsoft in attacchi ransomware tramite tecniche di ingegneria sociale. Scopri...

breachforums offline breachforums offline
Sicurezza Informatica4 giorni fa

BreachForums è offline e sotto il controllo dell’FBI

Tempo di lettura: 2 minuti. Il noto portale di annunci legati al crimine informatico dove si vendono i dati trafugati...

Cisco Talos Cisco Talos
Sicurezza Informatica5 giorni fa

Talos e CISA collaborano contro minacce Cyber a ONG e attivisti

Tempo di lettura: 2 minuti. Talos e CISA collaborano per proteggere le organizzazioni della società civile da minacce cyber, promuovendo...

Unit 42 Unit 42
Sicurezza Informatica6 giorni fa

DNS Tunneling: per tracciare vittime di Phishing

Tempo di lettura: 2 minuti. Gli hacker utilizzano il tunneling DNS per scandagliare le reti e tracciare le vittime, sfruttando...

Synlab Italia rivendicazione di Black Basta Synlab Italia rivendicazione di Black Basta
Sicurezza Informatica6 giorni fa

Black Basta Ransomware è diventato un problema mondiale

Tempo di lettura: 2 minuti. Black Basta Ransomware ha colpito più di 500 entità in vari settori, sottolineando la crescente...

cy4gaTE cy4gaTE
Economia6 giorni fa

Cy4Gate: accordo da un milione con Innovery

Tempo di lettura: 2 minuti. Cy4Gate rafforza la sua presenza nel mercato con una nuova partnership strategica con Innovery e...

Truffe recenti

Pharmapiuit.com Pharmapiuit.com
Inchieste1 giorno fa

Pharmapiuit.com : sito truffa online dal 2023

Tempo di lettura: 2 minuti. Pharmapiuit.com è l'ultimo sito truffa ancora online di una serie di portali che promettono forti...

Temunao.Top Temunao.Top
Inchieste1 giorno fa

Temunao.Top: altro sito truffa che promette lavoro OnLine

Tempo di lettura: 2 minuti. Temunao.top è l'ennesimo sito web truffa che promette un premio finale a coloro che effettuano...

Inchieste2 giorni fa

Attenti a Mazarsiu.com : offerta lavoro truffa da piattaforma Adecco

Tempo di lettura: 2 minuti. Dalla piattaforma Adecco ad un sito che offre lavoro attraverso le Google Ads: è la...

Sicurezza Informatica2 settimane fa

BogusBazaar falsi e-commerce usati per una truffa da 50 milioni

Tempo di lettura: 2 minuti. Oltre 850,000 persone sono state ingannate da una rete di 75,000 falsi negozi online, con...

Sicurezza Informatica2 settimane fa

Truffatori austriaci scappano dagli investitori, ma non dalla legge

Tempo di lettura: 2 minuti. Le forze dell'ordine hanno smascherato e arrestato un gruppo di truffatori austriaci dietro una frode...

Shein Shein
Truffe online1 mese fa

Truffa dei buoni SHEIN da 300 euro, scopri come proteggerti

Tempo di lettura: < 1 minuto. La truffa dei buoni SHEIN da 300 euro sta facendo nuovamente vittime in Italia,...

OSINT2 mesi fa

USA interviene per recuperare 2,3 Milioni dai “Pig Butchers” su Binance

Tempo di lettura: 2 minuti. Il Dipartimento di Giustizia degli USA interviene per recuperare 2,3 milioni di dollari in criptovalute...

dimarcoutletfirenze sito truffa dimarcoutletfirenze sito truffa
Inchieste3 mesi fa

Truffa dimarcoutletfirenze.com: merce contraffatta e diversi dalle prenotazioni

Tempo di lettura: 2 minuti. La segnalazione alla redazione di dimarcoutletfirenze.com si è rivelata puntuale perchè dalle analisi svolte è...

sec etf bitcoin sec etf bitcoin
Economia4 mesi fa

No, la SEC non ha approvato ETF del Bitcoin. Ecco perchè

Tempo di lettura: 3 minuti. Il mondo delle criptovalute ha recentemente assistito a un evento senza precedenti: l’account Twitter ufficiale...

Sicurezza Informatica5 mesi fa

Europol mostra gli schemi di fronde online nel suo rapporto

Tempo di lettura: 2 minuti. Europol’s spotlight report on online fraud evidenzia che i sistemi di frode online rappresentano una grave...

Tech

Tech3 ore fa

Exynos 2500 e Dimensity 9400 insidiano Snapdragon 8 gen 4

Tempo di lettura: 5 minuti. Samsung Exynos 2500 e MediaTek Dimensity 9400 promettono miglioramenti significativi in efficienza energetica e prestazioni,...

Smartphone4 ore fa

Realme GT 6T: Display da 120Hz e specifiche tecniche rivelate

Tempo di lettura: 2 minuti. Il Realme GT 6T verrà lanciato in India con un display LTPO a 120Hz, Snapdragon...

Tech5 ore fa

WhatsApp migliora la privacy con la funzione Cross-Device Chat Lock

Tempo di lettura: 2 minuti. WhatsApp Cross-Device Chat Lock migliora la privacy, proteggendo le chat private su tutti i dispositivi...

Mac Studio Pro Mac Studio Pro
Tech5 ore fa

Nessun nuovo Mac Studio e Mac Pro fino alla metà del 2025

Tempo di lettura: 2 minuti. Apple non aggiornerà i Mac Studio e Mac Pro fino alla metà del 2025, secondo...

Intelligenza Artificiale5 ore fa

Perché l’analisi del sentiment necessita di rilevare il sarcasmo?

Tempo di lettura: 2 minuti. Scopri come un nuovo algoritmo multimodale sviluppato dall'Università di Groningen migliora il rilevamento del sarcasmo,...

Samsung Galaxy Ring Samsung Galaxy Ring
Tech8 ore fa

Samsung Galaxy Ring: svelate le ultime misure

Tempo di lettura: < 1 minuto. Scopri i dettagli del Samsung Galaxy Ring, disponibile in nove misure e dotato di...

Galaxy S21 FE Galaxy S21 FE
Smartphone9 ore fa

Galaxy S21 FE supporta l’app Camera Assistant di Samsung

Tempo di lettura: < 1 minuto. Galaxy S21 FE supporta ora l'app Camera Assistant di Samsung, permettendo agli utenti di...

Oppo Find X7 Ultra Oppo Find X7 Ultra
Smartphone9 ore fa

Oppo Find X7 Ultra: arriva modalità fotocamera 25MP salvaspazio

Tempo di lettura: 2 minuti. L'Oppo Find X7 Ultra riceve un aggiornamento che introduce modalità fotocamera da 25MP, migliorando la...

Tech9 ore fa

One UI 7 (Android 15) migliora durata batteria su Galaxy

Tempo di lettura: 2 minuti. One UI 7 (Android 15) porta significativi miglioramenti nella durata della batteria per dispositivi Galaxy...

Tech9 ore fa

Riparabilità iPad Pro da 13 pollici è facile, la Pencil no

Tempo di lettura: 2 minuti. Il nuovo OLED iPad Pro da 13 pollici offre miglioramenti nella riparabilità, con una batteria...

Tendenza