OpenAI si prepara a lanciare la modalità vocale avanzata con visione dal vivo
OpenAI continua a innovare, e dopo il successo del lancio di GPT-4o a maggio 2024, si appresta a introdurre nuove funzionalità per il suo assistente AI, ChatGPT. Tra queste spicca la modalità vocale avanzata con visione dal vivo, già mostrata in anteprima e pronta a rivoluzionare l’esperienza d’uso degli utenti.
Cosa offre la modalità vocale avanzata con visione?
La modalità vocale avanzata, presentata durante l’annuncio di GPT-4o, permette agli utenti di interagire con ChatGPT tramite comandi vocali, aggiungendo la possibilità di utilizzare una funzione di visione dal vivo. Durante la demo, il chatbot è stato in grado di riconoscere oggetti ripresi dalla telecamera, come una palla associata a un cane, e fornire risposte pertinenti in tempo reale.
Questa funzionalità non solo amplia le potenzialità del chatbot, ma lo rende anche più versatile, ad esempio per il supporto in attività quotidiane o per offrire assistenza visiva.
Un’anteprima della nuova funzione
Alcuni alpha tester hanno già avuto accesso alla funzione ChatGPT Live Video (Vision) e hanno riportato feedback estremamente positivi. Il sistema si è dimostrato efficiente e utile in diverse situazioni, evidenziando il potenziale della combinazione tra capacità vocali e visive.
“Live Camera”: il nome della nuova funzione?
Dai codici individuati nell’ultima build beta di ChatGPT v1.2024.317, sembra che la nuova funzionalità possa chiamarsi Live Camera al momento del lancio. Tuttavia, alcune stringhe avvertono gli utenti di non utilizzare questa funzione per:
- Navigazione in diretta
- Decisioni legate a salute o sicurezza
Queste limitazioni sottolineano che, nonostante le potenzialità della tecnologia, ci sono ancora ambiti in cui l’affidabilità assoluta non può essere garantita.
Quando sarà disponibile?
Le stringhe di codice lasciano intendere che Live Camera potrebbe essere presto disponibile in beta pubblica, inizialmente per gli utenti di ChatGPT Plus e per gli abbonati a pagamento. Se confermata, questa funzione rappresenterà un ulteriore passo avanti nella capacità di ChatGPT di integrarsi in contesti pratici e visivi.
Un futuro sempre più interattivo
Con l’introduzione della modalità vocale avanzata con visione, OpenAI dimostra di essere all’avanguardia nell’intelligenza artificiale, combinando riconoscimento vocale e visivo in un’unica piattaforma. Questo aggiornamento promette di offrire agli utenti una nuova dimensione di interattività, rendendo ChatGPT uno strumento sempre più utile e versatile per la vita quotidiana.