Intelligenza Artificiale
Phi-3-Vision di Microsoft: rivoluzione per gli smartphone
Tempo di lettura: 2 minuti. Microsoft lancia Phi-3-Vision, un modello di IA innovativo progettato per smartphone e laptop con capacità di elaborazione limitate.
Microsoft ha lanciato Phi-3-Vision, un nuovo membro della famiglia di modelli di linguaggio ridotti Phi-3. Questo modello innovativo è in grado di comprendere sia il testo che le immagini, rendendolo particolarmente utile per dispositivi con potenza di elaborazione limitata, come smartphone e laptop. Con 4,2 miliardi di parametri, Phi-3-Vision rappresenta un avanzamento significativo nell’IA per dispositivi mobili. Esploriamo di seguito le caratteristiche e le potenzialità di questo nuovo modello.
La Famiglia di Modelli Phi-3
Microsoft offre una vasta gamma di modelli di intelligenza artificiale all’interno della famiglia Phi-3, che comprende:
- Phi-3-mini: 3,8 miliardi di parametri
- Phi-3-small: 7 miliardi di parametri
- Phi-3-medium: 14 miliardi di parametri
Questi modelli sono progettati per soluzioni di intelligenza artificiale leggere, essenziali per sistemi con capacità di elaborazione limitate. Phi-3-Vision, in particolare, è un modello multimodale progettato per l’analisi degli oggetti nelle immagini.
Uso del Modello Phi-3-Vision
Phi-3-Vision si distingue per la sua capacità di riconoscere oggetti nelle immagini, rendendolo utile per rispondere a domande relative ai dati visivi. Gli utenti possono analizzare dati da grafici o foto. Tuttavia, a differenza di DALL-E, non genera immagini, ma fornisce informazioni sugli oggetti presenti nelle immagini. Il modello è stato addestrato utilizzando dataset che includono dati sintetici e siti web pubblicamente disponibili e filtrati. Con 4,2 miliardi di parametri, Phi-3-Vision è ideale per dispositivi mobili e laptop.
Come Funziona Phi-3-Vision
Microsoft ha mostrato come funziona il nuovo modello. Ad esempio, un utente può chiedere un’analisi basata su un grafico, e il modello è in grado di generare tutte le informazioni necessarie dal grafico, fornendo dettagli piuttosto che solo un riassunto.
Tendenza Industriale
Questo sviluppo segue la tendenza del settore verso modelli di intelligenza artificiale più piccoli e efficienti. Dispositivi come laptop e smartphone rappresentano un grande mercato, e se le aziende riescono a sviluppare modelli di IA più piccoli ma efficaci, si tratterà di un grande progresso. Attualmente, Phi-3-Vision è disponibile in anteprima, mentre gli altri modelli della famiglia Phi-3 possono essere accessi tramite la libreria di modelli di Azure.
Phi-3-Vision rappresenta un passo significativo nella giusta direzione. I giganti tecnologici competono per dominare l’industria dell’intelligenza artificiale, e nuovi modelli come Phi-3-Vision mettono maggiormente a fuoco dispositivi con capacità hardware inferiori. Per ulteriori informazioni, visita il sito ufficiale di Microsoft.
Intelligenza Artificiale
Papa Francesco partecipa al G7 e parla di Intelligenza Artificiale
Tempo di lettura: 2 minuti. Papa Francesco al G7 discute sull’Intelligenza Artificiale, evidenziando opportunità, rischi e la necessità di una guida etica per il bene comune.
Papa Francesco ha preso parte alla sessione del G7 sull’Intelligenza Artificiale, tenutasi a Fasano nella struttura di Borgo Egnazia, Puglia, dal 13 al 15 giugno 2024 ed ha espresso le sue riflessioni sugli effetti dell’Intelligenza Artificiale (IA) sul futuro dell’umanità, sottolineando sia le potenzialità che i rischi di questa tecnologia.
Papa Francesco ha iniziato il suo discorso, qui in forma integrale, ricordando che la scienza e la tecnologia sono frutti straordinari del potenziale creativo umano, un dono di Dio che ci permette di raggiungere saggezza, intelligenza e scienza. L’Intelligenza Artificiale, frutto di questo potenziale, è uno strumento potente impiegato in vari ambiti, dalla medicina alla politica. Tuttavia, il suo utilizzo può suscitare emozioni contrastanti: entusiasmo per le possibilità che offre e timore per i potenziali pericoli.
L’Intelligenza Artificiale: opportunità e rischi
L’IA rappresenta una rivoluzione cognitivo-industriale, con il potenziale di democratizzare l’accesso al sapere, avanzare la ricerca scientifica e alleviare i lavori usuranti. Tuttavia, può anche aumentare le disuguaglianze tra nazioni e ceti sociali, minacciando la “cultura dell’incontro” a favore di una “cultura dello scarto”. La rapidità dello sviluppo tecnologico rende l’IA uno strumento affascinante e tremendo allo stesso tempo.
L’IA come Strumento
Papa Francesco ha ribadito che l’IA è, innanzitutto, uno strumento. I benefici o i danni che essa porterà dipenderanno dall’uso che ne faremo. La nostra capacità di costruire utensili e la nostra relazione con questi ultimi sono elementi fondamentali della storia umana. Tuttavia, l’uso degli utensili non sempre è orientato al bene. La tecnologia può rivelare la grandezza dell’essere umano solo se utilizzata al servizio dell’umanità.
Sviluppi futuri e controllo umano
L’uso delle forme avanzate di IA non sarà completamente sotto il controllo degli utilizzatori o dei programmatori. In futuro, i programmi di IA potrebbero comunicare tra loro per migliorare le performance, influenzando ulteriormente la nostra esistenza. È cruciale garantire un controllo umano significativo sui processi decisionali delle IA per preservare la dignità umana.
Considerazioni Etiche
L’IA generativa, pur essendo un potente strumento di accesso alla conoscenza, non è propriamente “generativa”. Essa riorganizza le informazioni esistenti senza sviluppare nuovi concetti o analisi, rischiando di consolidare errori o pregiudizi. Questo può minare il processo educativo e legittimare fake news, rafforzando una cultura dominante senza verifica critica.
Papa Francesco ha concluso l’intervento al G7 sottolineando l’importanza di una politica sana per affrontare le sfide poste dall’Intelligenza Artificiale. La tecnologia, pur potente, non deve rinforzare un paradigma tecnocratico. Al contrario, deve essere utilizzata per costruire il bene comune, guidata da principi etici che tengano conto della dignità umana.
Intelligenza Artificiale
Migliorata la mappatura 3D tramite immagini 2D con AI
Tempo di lettura: 2 minuti. Una nuova tecnica AI, Multi-View Attentive Contextualization, migliora la mappatura 3D tramite immagini 2D
Un team di ricercatori della North Carolina State University ha sviluppato una tecnica che consente ai programmi di intelligenza artificiale (AI) di effettuare una mappatura migliore degli spazi tridimensionali utilizzando immagini bidimensionali catturate da più fotocamere. Questa innovazione promette di migliorare significativamente la navigazione dei veicoli autonomi, operando efficacemente con risorse computazionali limitate.
Multi-View Attentive Contextualization (MvACon)
Il professor Tianfu Wu e il suo team hanno creato una tecnica denominata Multi-View Attentive Contextualization (MvACon), che può essere integrata nei programmi di visione artificiale esistenti per migliorare la capacità di mappare spazi 3D. Questa tecnica non richiede dati aggiuntivi dalle fotocamere, ma ottimizza l’uso dei dati esistenti.
MvACon si basa su un approccio chiamato Patch-to-Cluster attention (PaCa), introdotto lo scorso anno dagli stessi ricercatori. PaCa permette ai transformer AI di identificare oggetti in un’immagine in modo più efficiente ed efficace. La nuova applicazione di PaCa alla mappatura 3D con più fotocamere rappresenta un importante avanzamento.
Test e prestazioni
Per valutare le prestazioni di MvACon, i ricercatori lo hanno utilizzato con tre dei principali transformer di visione: BEVFormer, BEVFormer DFA3D e PETR. Questi transformer hanno raccolto immagini 2D da sei diverse fotocamere e, in tutti i casi, MvACon ha migliorato significativamente le prestazioni, specialmente nella localizzazione degli oggetti, nella velocità e nell’orientamento.
Applicazioni e futuri sviluppi
MvACon ha mostrato risultati promettenti anche con l’aumento minimo della domanda computazionale. I prossimi passi includono ulteriori test con dataset di riferimento aggiuntivi e input video da veicoli autonomi. Se i risultati continueranno a essere positivi, MvACon potrebbe essere adottato su larga scala.
La tecnica Multi-View Attentive Contextualization rappresenta un importante passo avanti nella capacità dei programmi di intelligenza artificiale di mappare gli spazi 3D utilizzando immagini 2D. Con potenziali applicazioni nei veicoli autonomi, questa innovazione potrebbe migliorare significativamente la navigazione e la sicurezza di questi mezzi.
Intelligenza Artificiale
Dream Machine: rivale di OpenAI Sora per Video AI è gratis
Tempo di lettura: 2 minuti. Dream Machine, rivale di OpenAI Sora, offre video generativi AI gratuiti. Scopri come utilizzarlo subito con un account Google.
Negli ultimi mesi, la tecnologia di generazione di video tramite intelligenza artificiale (AI) ha visto una crescita significativa. Sebbene strumenti come OpenAI Sora non siano ancora disponibili per il pubblico, un nuovo rivale chiamato Dream Machine è appena stato lanciato, e puoi provarlo subito.
Introduzione a Dream Machine
Dream Machine, sviluppato da Luma AI, è una piattaforma di video generativi che offre un piano gratuito utilizzabile con un account Google. Luma AI è già nota per un’app che consente di scattare foto 3D con l’iPhone e ora si è concentrata sulla creazione di video generativi. Nonostante alcune limitazioni, Dream Machine rappresenta un’anteprima promettente di come funzioneranno questi servizi.
Funzionalità e Utilizzo
Dream Machine permette di generare video inserendo semplicemente un prompt testuale. Al momento, il sito avvisa che “le generazioni richiedono 120 secondi” e che “a causa dell’elevata domanda, le richieste saranno messe in coda”. Durante i test, il nostro prompt ha richiesto oltre 20 minuti per essere elaborato, ma i risultati sono stati impressionanti.
Le clip prodotte da Dream Machine hanno una durata di cinque secondi e una risoluzione di 1360×752. Dopo aver inserito il prompt, il video appare nel tuo account e può essere scaricato con una filigrana.
Piani e Costi
Il piano gratuito di Dream Machine è limitato a 30 generazioni al mese. Tuttavia, per chi necessita di più generazioni, sono disponibili diversi piani a pagamento:
- Standard: 120 generazioni al mese, $29.99
- Pro: 400 generazioni al mese, $99.99
- Premier: 2000 generazioni al mese, $499.99
Limiti e prospettive future
Sebbene Dream Machine sia un ottimo strumento per sperimentare con la generazione di video AI, presenta alcune limitazioni tecniche nel gestire testo e movimento. Inoltre, restano domande su quali dati siano stati utilizzati per l’addestramento dell’AI di Luma, il che potrebbe limitarne l’uso al di fuori di scopi personali.
Dream Machine non è il primo strumento gratuito di generazione video testuale. Modelli come Runway’s Gen 2, uscito dalla beta l’anno scorso, offrono funzionalità simili. Tuttavia, Dream Machine si distingue per la sua accessibilità immediata senza necessità di lunghe liste di attesa, a differenza di altri strumenti come Google Veo e OpenAI Sora, che saranno disponibili solo più avanti nell’anno.
Dream Machine offre un’anteprima accessibile e divertente dei generatori video AI avanzati che verranno. Se sei interessato a esplorare il futuro della generazione video tramite AI, Dream Machine è un ottimo punto di partenza, anche se richiede un po’ di pazienza per ottenere i risultati.
- Smartphone1 settimana fa
Pixel 8 e 8 Pro: offerta con Google AI Premium
- Smartphone1 settimana fa
Xiaomi Redmi 13 con fotocamera da 108MP e Ricarica Rapida
- Sicurezza Informatica1 settimana fa
Ransomware TargetCompany colpisce ambienti ESXi su Linux
- Smartphone6 giorni fa
Google Pixel 8a vs. Pixel 9: acquistare ora o aspettare?
- Sicurezza Informatica1 settimana fa
Microsoft Recall a rischio con il Tool TotalRecall
- Sicurezza Informatica1 settimana fa
Olympics Has Fallen anche sui Giochi Olimpici di Parigi 2024?
- L'Altra Bolla1 settimana fa
YouTube banna i video di armi?
- Sicurezza Informatica1 settimana fa
FBI recupera 7.000 chiavi di decrittazione LockBit