OpenAI j’ai mis en œuvre une révision significative de l’interface utilisateur pour la modalité vocale di ChatGPTintégré directement dans les conversations, les témoignages existent au lieu de rester confinés dans un écran séparé. Le changement, désormais disponible sur l’application mobile de la version Web, représente une étape importante vers une expérience utilisateur plus fluide et multimodale, en éliminant la nécessité de passer par diverses interfaces pour interagir avec l’assistante IA.
À ce moment-là, pour activer la modalité vocale, il était nécessaire d’appuyer sur l’icône vocale dans l’angle inférieur de l’application, afin d’obtenir une interface complètement séparée caractérisée par la célèbre bande bleue pulsante. Avec le nouvel approche, la fonction vocale est appliquée directement à l’intérieur du chat actuelmaintenir le concours de conversation et permettre une transition plus naturelle entre l’entrée vocale et le test. Les utilisateurs qui préfèrent communiquer sur la modalité autonome peuvent utiliser les messages, à la voix du mode vocal, en sélectionnant « Mode séparé« .
La nouvelle mise en œuvre introduit des fonctionnalités techniques significatives qui améliorent l’utilisation complète. Durant une conversation vocale, ChatGPT génère ou une traduction à temps réel En ce qui concerne cela et les réponses fornites de l’AI, il est plus simple de suivre le fil du discours et de consulter les informations précédentes sans s’affilier exclusivement à la mémoire. Cette caractéristique était une personne individuelle dans l’analyse de l’APK de l’application Android de la part de Android Authority, qui a confié à OpenAI l’intégration de divers paramètres.
ChatGPT peut désormais afficher la carte, les prévisions météorologiques et d’autres contenus multimédias directement dans la fin du chat lors des conversations vocales.
L’aspect le plus intéressant de la mise à jour protège la capacité de l’IA afficher des informations contestées sur la carte, des données météorologiques et des images Directement à l’intérieur de la conversation, sans interrompre le flux de l’interaction vocale. Cette intégration multimodale élimine la nécessité d’ouvrir des applications séparées ou de copier manuellement des informations, ce qui rend l’expérience d’utilisation plus similaire à celle d’un assistant numérique complet qui combine la compréhension du langage naturel avec la visualisation dynamique des données.
Le mode vocal de ChatGPT, lancé pour rivaliser directement avec Gemini Live de Google, permet des conversations mains libres plus naturelles avec l’intelligence artificielle. Le système est prévu pour le geste pause, les intonations et les expressions vocales, offrant une interaction qui contribue principalement à une conversation humaine répondant aux commandes vocales traditionnelles. OpenAI offre deux versions des fonctionnalités : un standard disponible gratuitement pour tous les utilisateurs et un Mode vocal avancé réservé aux abbonati au paiement, qui incluent des voix plus naturelles et des capacités d’élaboration plus sophistiquées.



