Voice Live AI : construire rapidement des services vocaux
L'API Voice Live est un service permettant aux agents vocaux de bénéficier d'interactions vocales de haute qualité et à faible latence. Elle élimine la nécessité d'orchestrer manuellement plusieurs composants. En intégrant la reconnaissance vocale, l'IA générative et la synthèse vocale dans une interface unique, elle offre une solution de bout en bout pour créer des expériences fluides. Voilà pour la définition de Voice Live.Les usages sont variés : pour les centres d'appels, les assistants dans les voitures, l'éducation, les services publics, les RH, etc. Voice Live AI propose plusieurs fonctionnalités clés :- 600 voix standards, plus de 140 paramètres de réglages, plus de 15 langues supportées en reconnaisance- personnalisation des entrées et sorties pour utiliser au moins les matériels disponibles- choixi du LLM flexible : GPT-4o, GPT-4o mini, Phi- réduction de bruit, optimisation pour supprimer les échos- détection dans l'interruption de la conversion pour interagir au mieux avec les utilisateurs et les API- intégration des avatars- fonction appelVoice Live AI est entièrement managé par Azure. Le développeur configure et implémente le service et les API. Il n'y pas de déploiement à réaliser. Le service est compatible avec OpenAI Realtime API.Un tutoriel permet de voir comment construire un agent vocal avec Voice Live Api. Pour ce projet, il faut un compte Azure, Azure AI Foundry, un environnement développement Python, la librairie Chainlit. L'accès aux API se fait via AI Foundry. Tutoriel complet : https://techcommunity.microsoft.com/blog/azure-ai-services-blog/from-zero-to-hero-build-your-first-voice-agent-with-voice-live-api/4417715Service en preview technique pour le moment. Pour en savoir plus : https://learn.microsoft.com/en-us/azure/ai-services/speech-service/voice-liveCatégorie actualité: TechnologiesAzure, VoiceImage actualité AMP:

L'API Voice Live est un service permettant aux agents vocaux de bénéficier d'interactions vocales de haute qualité et à faible latence. Elle élimine la nécessité d'orchestrer manuellement plusieurs composants. En intégrant la reconnaissance vocale, l'IA générative et la synthèse vocale dans une interface unique, elle offre une solution de bout en bout pour créer des expériences fluides. Voilà pour la définition de Voice Live.
Les usages sont variés : pour les centres d'appels, les assistants dans les voitures, l'éducation, les services publics, les RH, etc.
Voice Live AI propose plusieurs fonctionnalités clés :
- 600 voix standards, plus de 140 paramètres de réglages, plus de 15 langues supportées en reconnaisance
- personnalisation des entrées et sorties pour utiliser au moins les matériels disponibles
- choixi du LLM flexible : GPT-4o, GPT-4o mini, Phi
- réduction de bruit, optimisation pour supprimer les échos
- détection dans l'interruption de la conversion pour interagir au mieux avec les utilisateurs et les API
- intégration des avatars
- fonction appel
Voice Live AI est entièrement managé par Azure. Le développeur configure et implémente le service et les API. Il n'y pas de déploiement à réaliser. Le service est compatible avec OpenAI Realtime API.
Un tutoriel permet de voir comment construire un agent vocal avec Voice Live Api. Pour ce projet, il faut un compte Azure, Azure AI Foundry, un environnement développement Python, la librairie Chainlit. L'accès aux API se fait via AI Foundry.
Tutoriel complet : https://techcommunity.microsoft.com/blog/azure-ai-services-blog/from-zero-to-hero-build-your-first-voice-agent-with-voice-live-api/4417715
Service en preview technique pour le moment.
Pour en savoir plus : https://learn.microsoft.com/en-us/azure/ai-services/speech-service/voice-live
