Microsoft sta lavorando per aggiungere una nuova funzionalità al suo chatbot Bing, che aumenterà notevolmente il valore di utilità dell’IA: il riconoscimento delle immagini. Nominata Bing Vision, la funzionalità è attualmente in fase di test con un piccolo numero di utenti e consente di caricare un’immagine per effettuare una query.
Come funziona Bing Vision
Bing Vision permette agli utenti di caricare un’immagine al posto di digitare testo, e l’IA identificherà l’immagine e fornirà informazioni su di essa. Ad esempio, è stato segnalato che il chatbot è stato in grado di identificare un tempio egiziano da una foto. In un altro caso, è stata fornita al chatbot una scansione di un’equazione matematica, che è stata correttamente identificata come l’equazione di Schrödinger.
Disponibilità limitata e prospettive future
Attualmente, Bing Vision è disponibile solo per un piccolo gruppo di utenti, rappresentando poco più del 10% della base utenti, e solo su desktop PC. Tuttavia, Mikhail Parakhin, capo della pubblicità e dei servizi web di Microsoft, ha dichiarato che la funzionalità dovrebbe essere distribuita più ampiamente nelle prossime settimane, inclusi gli utenti mobili.
Potenziali applicazioni e utilità
Bing Vision può essere utile in molti modi per le query basate su immagini. Ad esempio, se si vede un’immagine di una bellissima spiaggia, lago, montagna o città e ci si chiede dove si trovi, è possibile inviare l’immagine a Bing e l’IA dovrebbe essere in grado di fornire non solo la posizione, ma anche ulteriori dettagli su come pianificare un viaggio in quel luogo.
L’espansione continua delle capacità di Bing AI
Microsoft sta lavorando a ritmo sostenuto per espandere le capacità di Bing AI, il che non sorprende dato che l’IA è attualmente un argomento molto discusso. Di recente, Microsoft ha introdotto l’input vocale per i desktop PC e ha migliorato questa funzionalità per i dispositivi mobili.