IA vocale et IA pour la traduction

NVIDIA Riva

Créez des équipes vocales personnalisables et faciles à intégrer basées sur l'IA et dotées de capacités de communication en temps réel, avec des fonctions vocales, de transcription et de traduction multilingues.

Aperçu

Qu’est-ce que NVIDIA Riva ?

NVIDIA® Riva est une collection de microservices multilingues avec capacités vocales et de traduction accélérés par GPU, qui permet de concevoir des pipelines d’IA conversationnelle en temps réel entièrement personnalisables. Riva inclut des fonctionnalités de reconnaissance vocale automatique (ASR), de synthèse vocale (TTS) et de traduction automatique neuronale (NMT) de pointe. Cette technologie peut être déployée sur n’importe quel Cloud, sur Data Center, à l'Edge ou sur des systèmes Embedded. Grâce à Riva, les entreprises peuvent ajouter des interfaces vocales et de traduction qui transforment les chatbots en agents ou avatars multilingues d'IA dotés de la parole, ce qui les rend captivants et expressifs.

NVIDIA Riva Canary est désormais disponible

Riva Canary est un ensemble de modèles multilingues et multitâches qui peuvent être déployés en tant que microservices NVIDIA NIM™. Ils prennent en charge la reconnaissance et la traduction automatiques de la parole en texte, peuvent ajouter la ponctuation et les majuscules, et sont capables de traduire.

NVIDIA Riva Magpie TTS est désormais disponible

Riva Magpie TTS convertit le texte en audio et propose des voix masculines et féminines au son naturel, avec capacités multilingues. Le modèle peut être personnalisé avec des voix supplémentaires spécifiques à une marque et constitue un excellent ajout au modèle de streaming ASR multilingue Riva Parakeet pour les cas d'utilisation de type agents vocaux.

Avantages

Découvrez les avantages de NVIDIA Riva

Transcriptions multilingues et génération de voix expressives

Bénéficiez d’une précision élevée pour la transcription et la traduction multilingues, et profitez de voix féminines et masculines prêtes à l'emploi professionnelles et expressives grâce à des modèles de pointe pré-entraînés sur des milliers d’heures de données audio.

Entièrement personnalisable

Profitez du niveau de personnalisation permis par les pipelines ASR concernant les langues, les accents, les domaines, le vocabulaire et le contexte pour obtenir une précision optimale et parfaitement adaptée à votre cas d’utilisation, et exploitez les pipelines TTS pour trouver la voix et l'intonation de marque que vous souhaitez.

Déploiements flexibles

Fournissez des expériences fiables à des centaines de milliers d'utilisateurs en simultané avec des performances d’inférence supérieures à celles des technologies existantes ainsi qu'un choix de déploiements à la carte : sur Data Center, sur site, dans le Cloud, à l'Edge ou sur des systèmes Embedded.

IA de niveau entreprise

Accélérez le développement et le déploiement d'applications d'IA vocales multilingues de qualité professionnelle grâce à NVIDIA Riva, un élément de la plateforme modulaire et flexible NVIDIA AI Enterprise conçue pour accélérer le développement et le déploiement de l'IA.

Les NIM de NVIDIA Riva sont désormais disponibles au téléchargement

Découvrez de nouveaux microservices d'ASR, de TTS et de NMT conçus pour fournir des fonctionnalités d'inférence d'IA vocale et de traduction optimisées. Ces microservices incluent des modèles Parakeet qui offrent une précision et des performances record en matière de reconnaissance vocale automatique (ASR).

Cas d'utilisation

Utilisation de NVIDIA Riva

Utilisation de NVIDIA Riva Découvrez comment les leaders de l’industrie mettent l'accent sur l’innovation avec Riva.

Assistant virtuel basé sur l'IA

Les entreprises déploient des assistants virtuels basés sur l'IA pour traiter automatiquement et en continu les demandes de millions de clients et d'employés. Grâce aux microservices de reconnaissance vocale et de traduction basés sur l'IA de Riva, ces assistants fournissent des réponses naturelles et pertinentes à tout moment de la conversation avec l'utilisateur, et ce malgré d'éventuels bruits de fond, problèmes sonores ou accents et dialectes des locuteurs.

Assistance aux agents

Les consommateurs s’attendent à ce que les agents des centres de contact résolvent leurs problèmes de manière à la fois rapide et efficace. Pour répondre à ces attentes et aider leurs agents à fournir les meilleures expériences qui soient, les entreprises de tous les secteurs mettent en œuvre des technologies d’assistance basées sur les microservices de reconnaissance vocale et de traduction de Riva.

Humain numérique

Pour améliorer les expériences de service client et consolider les relations avec leur clientèle, les entreprises conçoivent des humains numériques sur mesure dotés d'une voix de marque reconnaissable. Grâce à Riva, ces sociétés peuvent créer une voix unique et personnalisée de la plus haute qualité avec seulement trois secondes de données vocales.

Transcription

Alors que des centaines de millions de réunions se tiennent en ligne chaque jour, les technologies de visioconférence sont devenues un outil indispensable pour les entreprises. Grâce à la transcription en temps réel de Riva, les applications de visioconférence offrent une précision impressionnante pour le sous-titrage en direct et la synthèse des réunions, en s'adaptant à des utilisateurs dont les accents peuvent varier et qui utilisent un vocabulaire spécifique à leur domaine.

Traduction avec l'IA

Dans un contexte économique mondialisé, les entreprises sont amenées à travailler dans de nombreux pays et à répondre aux besoins de clients d’origines linguistiques et culturelles diverses. Cette variété représente un défi unique : trouver des locuteurs natifs ou former des employés à parler plusieurs langues. Les capacités de traduction de Riva garantissent une communication précise et efficace et facilitent ainsi les interactions à l'échelle mondiale.

Robots de service

Les robots de service sont utilisés de plus en plus fréquemment dans les hôpitaux, les aéroports et les boutiques du monde entier. Ils se placent au service des travailleurs en première ligne en traitant les tâches quotidiennes les plus répétitives dans les restaurants et sur les sites de production, ils aident les clients à localiser les articles dans les boutiques et ils assistent les médecins et les infirmières qui prodiguent des soins aux patients. Riva simplifie l'intégration de fonctionnalités de reconnaissance vocale et de traduction basées sur l'IA dans les robots de service.

Options de démarrage

Manières de démarrer avec NVIDIA Riva

Utilisez les bons outils et les technologies adaptées pour concevoir et déployer des applications d’IA vocale et de traduction multilingues entièrement personnalisables.

Essayez

Découvrez Riva par le biais d'un portail basé sur une interface utilisateur pour explorer et prototyper avec des points de terminaison gérés par NVIDIA, disponibles gratuitement dans le catalogue d'API de NVIDIA.

Déployez

Procurez-vous une licence gratuite pour essayer NVIDIA AI Enterprise pendant 90 jours en utilisant votre infrastructure existante.

Expérimentez

Accédez à l'infrastructure hébergée par NVIDIA et à des ateliers pratiques comprenant des instructions pas à pas et des exemples détaillés, disponibles gratuitement via NVIDIA LaunchPad.

Études de cas

Comment les leaders de l'industrie stimulent l'innovation avec Riva

Télécommunications

L'IA vocale pour un service client de pointe

Client: T-Mobile

Produits: NVIDIA Riva, systèmes NVIDIA certifiés

Technologies: : GPU NVIDIA pour Data Centers, NVIDIA NeMo, NVIDIA Riva

Télécommunications

IA vocale de premier ordre pour une expérience de visioconférence incomparable

Client: RingCentral

Produits: NVIDIA DGX, NVIDIA Riva

Technologies: GPU NVIDIA pour Data Centers, NVIDIA NeMo, NVIDIA Riva, serveur d'inférence NVIDIA Triton

Enseignement supérieur / Université

Automatisation de la reconnaissance vocale en arabe et en temps réel

Clientr: Tarteel.ai

Produits: NVIDIA Riva, systèmes NVIDIA certifiés

Technologies: NNVIDIA NeMo, NVIDIA Riva, GPU NVIDIA pour Data Centers

Adoptants

Leading Adopters Across All Industries

Ressources

Découvrez nos ressources les plus récentes sur NVIDIA Riva

Essayez Riva sur NVIDIA LaunchPad

Vous disposez d'un projet existant d’IA vocale ? Inscrivez-vous si vous souhaitez tester et prototyper vos solutions basées sur la conversation et l'IA vocale grâce à la pile logicielle NVIDIA Riva à hautes performances, que vous pouvez déployer dès maintenant.

Développez des services ASR sur mesure à haute précision

Découvrez comment concevoir, entraîner, optimiser et déployer avec NVIDIA Riva un service de reconnaissance vocale automatique (ASR) accéléré par GPU incluant des fonctionnalités personnalisées.

Parlez à vos données dans votre langue maternelle

Rejoignez des experts en IA pour apprendre à configurer, à paramétrer et à déployer des systèmes d'IA prêts pour la production à des fins de reconnaissance vocale et de traduction multilingue dans des applications reposant sur les LLM afin d'augmenter les capacités de vos chatbots pour leur permettre de s'adresser à vos clients dans leur langue maternelle.

Utilisez l'IA vocale pour la transcription, la traduction et le traitement des voix

Développez des applications d’IA vocale de classe mondiale entièrement personnalisables dans des domaines comme les assistants virtuels intelligents, les services de transcription audio et les avatars numériques.

Réinventez les expériences dans les centres de contact avec NVIDIA Riva

En générant une transcription précise des interactions avec les clients en temps réel, Riva permet aux applications d'IA de fournir des informations contextuelles, d'évaluer les sentiments et de recommander aux agents la prochaine action à mettre en œuvre, garantissant ainsi une expérience sur mesure de la plus haute qualité.

Chien-robot capable d'aller récupérer des commandes dans un environnement urbain

Découvrez comment Spot exploite l'IA vocale pour passer et récupérer des commandes dans un environnement urbain et sans connexion Internet. Au lieu de transférer des commandes vocales dans le Cloud et de les traiter en ligne sur le serveur, Spot traite toutes les données en local pour fournir des performances et une livraison à la fois transparentes et efficaces.

Étapes suivantes

Vous voulez vous lancer ?

Utilisez les bons outils et les technologies adaptées pour concevoir et déployer des applications d’IA vocale et de traduction multilingues entièrement personnalisables.

Pour les développeurs

Découvrez tout ce dont vous avez besoin pour commencer à développer avec NVIDIA Riva, incluant la documentation la plus récente ainsi que des didacticiels, des articles techniques et plus encore.

Nous contacter

Discutez avec un spécialiste des produits NVIDIA pour savoir comment passer du stade de pilote à la phase de production en bénéficiant de la garantie de sécurité, de stabilité d'API et du support technique de NVIDIA AI Enterprise.

AI2Labs

En 2021, AI2Labs s'est détaché de Yoozoo Games pour devenir une startup technologique locale à Singapour. AI2Labs innove, expérimente et développe des produits et des applications d’IA, ce qui permet de mettre en œuvre des processus plus efficaces et d’améliorer la durabilité et les résultats commerciaux.

AI2Labs a intégré Riva à son Speakr, une API de reconnaissance vocale spécifique à un domaine, pour prendre en charge les subtilités des domaines du langage et des affaires asiatiques, tout en parvenant à une précision de pointe pour la traduction Singlish.

Avaya

Avaya est une société spécialisée dans les solutions de communication dans le Cloud et de collaboration en matière de workstream, qui fournit des communications unifiées, des centres de contact, des plateformes de communication en tant que service (CPaaS) et des services avec leur plateforme OneCloud.

Avaya a intégré le moteur de synthèse vocale NVIDIA Riva pour le sous-titrage en temps réel à grande échelle. Riva offre une meilleure qualité de transcription, un taux d’erreur des mots plus faible et une livraison économique.

C-DAC

For over 10 years, the Applied AI Group at C-DAC in Pune, India, has focused on research and development of speech technology. They’ve successfully created a cutting-edge speech-to-text (STT) system for Indic languages such as Hindiand Marathi. The group continues to advance their work by exploring AI-enabled, open-source deep learning frameworks, libraries, and tools for creating STT and speech-enabled applications for other Indic and low-resource languages. Experiments were conducted using various neural network architectures and topologies from NVIDIA’s open-source NeMo framework, with Citrinet and Conformer-CTC network topologies proving to be effective in building and training neural acoustic models for speech recognition. These models were trained on single- and multi-node Param Siddhi AI systems, optimizing training time and performance. Finally, the models were deployed for real-time and batch-mode inference using the Riva GPU-accelerated production pipeline.

NCS

NCS, filiale de Singtel Group, est une société de services technologiques de premier plan présente en Asie-Pacifique et associée à des gouvernements et à des entreprises pour faire avancer les communautés grâce à la technologie. En combinant l’expérience et l’expertise de ses 12 000 collaborateurs répartis dans 61 spécialisations, NCS fournit des services technologiques différenciés et de bout en bout aux clients avec leurs capacités NEXT en matière de numérique, de données, de Cloud et de plateformes, ainsi que des offres de base en matière d’applications, d’infrastructures, d’ingénierie et de cybersécurité. NCS s’est par ailleurs associé à des acteurs technologiques, des instituts de recherche et des start-ups pour soutenir l’innovation libre et la co-création. 

NCS utilise NVIDIA Riva TTS dans Breeze, l’application compagnon du conducteur, pour la navigation à guidage vocal, la mise à jour du trafic et de l’état de la route, les taux de stationnement en temps réel, les tarifs électroniques de tarification routière et les heures d’exploitation, afin d’aider les conducteurs singapouriens à vivre des trajets en toute fluidité.

En savoir plus.

breeze.com.sg/

www.ncs.co

Customer Story

RingCentral

RingCentral, un fournisseur majeur de solutions mondiales de communication, de collaboration et de centres de contact dans le Cloud d’entreprise, propose des services à des millions d’utilisateurs. La plateforme RingCentral facilite la collaboration depuis n’importe quel appareil et n’importe où, améliorant ainsi l’efficacité commerciale et la satisfaction des clients.

RingCentral utilise NVIDIA Riva pour la transcription de visioconférences pour 200 000 utilisateurs simultanés sur sa plateforme.

En savoir plus.

www.ringcentral.com

Customer Story

GTC Session

Snap

Snap est une société de caméra et de médias sociaux qui permet la création de messages multimédia avec des filtres et des effets. Pour créer des expériences plus interactives, les utilisateurs de Snapchat jouent avec des Lens, une fonctionnalité qui ajoute des effets en temps réel dans les captures d’écran, plus de 6 milliards de fois par jour. 

Le service d’IA vocale optimisé pour le bruit et le lingo de NVIDIA Riva est intégré à Snap AR Lens Studio, ce qui permet aux créateurs, aux infographistes et aux développeurs, de concevoir des expériences captivantes de réalité augmentée (AR).

T-Mobile

T-Mobile, un transporteur suralimenté, offre un réseau 4G LTE avancé et un réseau 5G transformateur pour la meilleure expérience client. Pour responsabiliser les agents du centre de contact, T-Mobile met en place Expert Assist. Ce logiciel basé sur l’IA utilise NVIDIA Riva pour la transcription des conversations avec les clients en temps réel afin d’alimenter les systèmes de recommandation et d’aider des milliers d’agents.

Avec Riva, T-Mobile optimise les modèles de reconnaissance vocale sur des jeux de données personnalisés et interprète le jargon du client avec précision dans les environnements bruyants.

En savoir plus.

www.t-mobile.com

Customer Story

GTC Session

Building Speech AI Applications

Explore how to get started with integrating and deploying Riva ASR and TTS models in production with high-performance inference and minimal effort.

An Introduction to NVIDIA Riva

Learn about Riva’s architecture, key features, and components for building speech and translation AI services.

NVIDIA Parlays Win in Voice Challenge

Read how a team of NVIDIANs won the LIMMITS ’24 challenge, which asked contestants to recreate in real time a speaker’s voice in English or any of six languages spoken in India with the appropriate accent.